情報検索論 演習問題
  検索エンジンの補足率を推計する

ヒット カウンタ
since 2001/04/01

【検索エンジンとは?】

インターネット上には様々なエンジンが提供されています。検索エンジンには

  • 全文検索エンジン

  • 登録に基づいてリンクを張っている検索エンジン

があります。前者は検索エンジンの提供者が一定の頻度でWWWページの検索を行ってキーワードによる検索のためのテーブルを維持している方式であり、後者はサイト作成者からの登録や検索エンジン運営者のサーファーチームの判断により検索のためのテーブルを維持している方式です。いずれにせよ、ウェブは生き物ですし、完全に全てのページを補足しているということはありえないことです。では、これらの補足率は一体どの程度なのでしょうか?

 

サーチ(検索)エンジン -- インターネット上の情報を探し出す検索システムのこと。検索エンジン、検索ページ、検索サイト、サーチページなど、いろいろな呼び方があるが、どれも同じ。代表的なものに「Yahoo!(ヤフー)(http://www.yahoo.co.jp/)」や「goo(グー)(http://www.goo.ne.jp/)」などがある。検索方法は大きく2種類に分けられ、1つは指定したキーワードに合致する情報を探し出す「キーワード検索」。もう1つは分類されたカテゴリーの中から欲しい項目をたどっていく「ディレクトリ検索」。しかし、最近は利用者がその区別なく使えるようになっているケースが多い。Yahoo!はディレクトリ検索が売りだが、検索を絞り込んでいく途中からgooのキーワード検索に切り替わる。(アスキーデジタル用語辞典)

search engine -- A program or web site that enables users to search for keywords on web pages throughout the World Wide Web. (Netdictionary)

 

 

【推計方法】

【記号の定義】

N:検索エンジンで検索可能なWWWページの集合

Na:検索エンジンAが補足したページ集合

Nb:検索エンジンBが補足したページ集合

Nab:検索エンジンAとBが共通に補足したページ集合

検索エンジンの補足率に偏りがないとすれば、検索エンジンAの補足率:Pa(=[Na]/[N])は [Nab]/[Nb] で推定される。

 

TOP

【演習問題】
検索エンジンを二つ選んで、適当なキーワードによって検索を行い、その結果から検索エンジンの補足率を推定してください。

TOP


【参考文献】

[1] Steve Lawrence and C. Lee Giles, Searching the World Wide Web, SCIENCE, Vol.280, pp.98-100, 3 April 1998


TOP


情報検索論


Mikami's HOME

Mail to Mikami

TOP


© Yoshiki Mikami 2001       last updated 2001/06/15