ITパスポート試験 用語辞典
クローラ【Crawler】
Web上を自動巡回して文書や画像などの情報を取得・データベース化するプログラムのこと。主に検索エンジンにおける情報収集に用いられることが多いが、悪意のある業者による電子メールアドレスの収集に使用されることもある。HTML文書中のリンクをたどり、次々と別のページを訪問する動作を繰り返すことでWeb上を自動巡回している。
- 分野:
- テクノロジ系 » ネットワーク » ネットワーク応用
(シラバス範囲外) - 出題歴:
- 28年秋期問86
- 重要度:
(Wikipedia クローラより)
クローラ(Crawler)とは、ウェブ上の文書や画像などを周期的に取得し、自動的にデータベース化するプログラムである。「ボット(Bot)」、「スパイダー」、「ロボット」などとも呼ばれる。
主に検索エンジンのデータベース、インデックス作成に用いられているほか、統計調査などの目的にも利用される。近年では電子メールアドレス収集業者などもクローラを利用して、スパムの送信効率を上げている。
一般にクローラは、既知のHTML文書の新しいコピーを要求し、文書中に含まれるリンクをたどり別の文書を収集するという動作を繰り返す。新しい文書を見つけた場合はデータベースに登録する。また、既知のファイルが存在しないことを検出した場合はデータベースから削除する。
主なクローラ
- グーグルボット(Google)
- MSNBot(MSN)
- Yetibot(ネイバー)
- InfoSeek Sidewinder(インフォシーク)
- Yahoo! Slurp(Yahoo!)
- (キーウォーカー)
- Slurp(Inktomi)
- Scooter(AltaVista)
- Baiduspider(百度)
- インターネットNinja
- KenKen! Robot(建築系検索エンジンKenKen!)
- MitsuBachi(マイニングブラウニー)
出題例
全文検索型検索エンジンの検索データベースを作成する際に用いられ,Webページを自動的に巡回・収集するソフトウェアはどれか。
- CGI
- クローラ
- クロスサイトスクリプティング
- バックドア
[出典]ITパスポート H28年秋期 問86 解説
正解
イ
「ネットワーク応用」に属する用語
- IPアドレス
- サブネットマスク
- IPv6
- DNS
- URL
- 同報メール
- メーリングリスト
- cc
- bcc
- cookie
- CGI
- CMS
- MIME
- RSS
- オンラインストレージ
- クローラ
- MVNO
- ISP
- IP電話
- ハンドオーバ
- ローミング
- MIMO
- キャリアアグリゲーション
- テザリング
- SIMカード
- eSIM
- テレマティクス
- ADSL
- FTTH
「ネットワーク」の他の分野
「テクノロジ系」の他のカテゴリ
- 基礎理論(23)
- アルゴリズムとプログラミング(27)
- コンピュータ構成要素(32)
- システム構成要素(29)
- ソフトウェア(17)
- ハードウェア(14)
- 情報デザイン(21)
- 情報メディア(28)
- データベース(19)
- ネットワーク(71)
- セキュリティ(121)
このページのWikipediaよりの記事は、ウィキペディアの「クローラ」(改訂履歴)の記事を複製、再配布したものにあたり、このページ内の該当部分はクリエイティブ・コモンズ 表示 - 継承 3.0 非移植 ライセンスの下 に提供されています。