筆者は前回,インターネット検索エンジンの仕組みについて説明した(関連記事:検索エンジンが有用に機能しなくなってきた)。検索エンジンはインターネット上のほとんどすべてのWebページを巨大なデータベースにダウンロードして,あるWebページから別のWebページへのハイパーリンクを調べることによって,特定のトピックにおけるランクをWebページに付けている。

 したがって,「遡河魚」で検索すると,そのトップかそれに近い位置に,最も多くのWebページからリンクされている,遡河魚に関するWebページが表示されることになる(読者がグーグルで検索する手間を省くために遡河魚について説明しておくと,遡河魚は淡水で孵化して海水で育った後,淡水に戻って産卵する魚である。現在最もよく知られている遡河魚は鮭だが,150年前のアメリカ人にとって最もなじみのある遡河魚はシャッドと呼ばれる非常に大型のニシンで,海で丸々と太ってから春になると川に戻ってきて,素晴らしいご馳走を提供してくれた)。

 このリンク計数方式の検索を実行すると,これまでは非常に精度の高い結果が得られた。しかし前回述べたように,最近はそのような結果が得られなくなってきたように思える。そこで,検索精度を高めるために筆者が提案するのは,ブログのページやベンダーのコンテンツに識別子を組み込むことだ。

 VistaやServer 2008に関する技術的なトピックを検索すると,ほとんど毎回と言えるほどブログへのリンクが表示される。あるブロガーがソフトウエア関連のキーワードについて,「これは使い物にならない」とか「Microsoftの無料公開イベントでデモを見た」など,そのソフトウエアを調べようとしている人々にとって全く価値のないコメントを書き込むと,それによってそのブログが検索結果の上位に表示されてしまうのだ。

 「ブロゴスフィア」の大部分は,ほとんどすべてのブログをほかのすべてのブログとリンクしているシステムで構成されている。したがって,大量のつまらないブログにも無数のリンクが貼られて,それらが検索結果の上位にランクインすることになる。どうすればよいか。おそらく,HTMLに「これはブログページ」という意味のタグを挿入すれば,検索の際に「ブログは検索しないこと」と指定できるだろう。

 誤解しないでほしい。ブログは社会的相互関係を築くための素晴らしいツールだ。会話も同じように社会的相互関係を築くために必要な行為だが,図書館で調べ物をするときは往々にしてうるさく思われるものだ。ここで提案しているのは,おしゃべりはオンラインのチャットや掲示板,技術的な内容は別の場所というように,別々に分けようということだ。

 筆者はカメラマニアだが,ほんの少しでも写真機材に関連することを検索すると,ほぼ必ずと言っていいほど,オンラインベンダーが製品概要を2段組みで派手に宣伝する「コンテンツ」が検索結果として表示される。筆者はオンラインショッピングが好きだし,コンピュータや写真機材のほとんどはオンラインで購入している。しかし,図書館でオレンジを探しているときは,オレンジに関して記述している書物を探しているのであって,大量のオレンジを売ってほしいと思っているわけではない。

 繰り返すが,ページに「これはセールスベンダーのページ」という意味の何らかの識別子を挿入して,Web検索でそのようなページをブロックする機能を付けるという考えはどうだろうか。オンライン販売が成長し続けていることから明らかなように,そのようなページをすべての人が排除しようとするとは思えない。それに,ページをセールスベンダーのページとしてマーキングしておけば,ある製品を安く売っているところがないか探そうとしたときに,セールスベンダーのページだけを検索するように指定することによって,販売とは関係ないページを排除することができるというメリットも生まれる。

 結局,Webを役に立つようにするにはどうしたらよいか,という問いに対する答えは,Webを安全にするための解決策と同じところに落ち着く。すなわち評判ベースのシステムにすることだ。検索エンジンがWebページをランク付けする場合,そのWebページへのリンクの数ではなく,リンク元の信頼性を基準とすればよい。筆者は,検索エンジン・ベンダーが,いずれそのような方法を採用するものと見ている。

Windows IT Pro, (C)2007. Penton Media, Inc.