GoogleがバイナリをLinkするワケ

Googleの検索結果画面だが、何か変だと思わない?

google_result

Googleが.exeなどのバイナリ・ファイルを参照している(中身を解析している)証拠だ。"size of stack reserve"を検索してみれば同じような画面が表示されるはず。

検索エンジンのロボット(クローラー)が巡回サイトの何をアクセスするかは実質的に紳士協定と言ってよい。robots.txtをWebサイトのURLの然るべき場所に配置して、検索エンジンの対象にしない方法はあるが、それはロボットであるプログラム次第だ。アクセスを許されたディレクトリ内であっても、どのようなファイルが実際にインデックス化のためにアクセスされるかはロボットによる。

Googleは、拡張子が何であれ悪意のあるファイルがインデックスされないように中身を解析した上で検索結果に反映させていることがわかる。Webアクセス・フィルタリングの製品である、WebsenseはGoogleのこのバイナリ検索結果を使って、BagelやMytobといったマルウェアを含むような危険なサイトに関する情報の精度を上げているそうだ(具体的にどうしているかは明らかにされていない)。が、いずれにせよ、バイナリファイルが「表示される」ことはバグであるようだ。
PCWorld.com - Google's Binary Search Helps Identify Malware:
Thousands of malicious Web sites pinpointed thanks to a little-known capability in Google's search engine.
一方で何人かのブロガー達は、悪意のある人間がある種の共通キーワードを用いて、Googleのこのバグ(?)を意図的に利用してマルウェアのバイナリをインデックスさせ、ダウンロードさせようとするかもしれないと指摘している。もちろん、検索結果をクリックするだけで単純にバイナリが実行されることはなく、「バイナリ・ファイルですが、実行しますか」という主旨の警告ダイアログが表示されるので、それほど危険ではないという意見もある。

Googleはこの現象(検索結果に表示されてしまうこと)を「時々あること」と認めており、防御する努力をしていると述べる。単純なミス? いや、そうではないかもしれない。Computer Sciences Corporationの研究者で、Google Hacking for Penetration Testers等の著者であるJohnny Long氏(O'Reiily's description)は「彼らは(高度な)ファイル検索サービスの準備をしているのだ」と言う。バイナリ・ファイル解析は単純なセキュリティ向上ではなくて、将来、「何でも見つけることができる」ようにするためのものだと。なにせ、Googleロボットが訪れているところは、宝の山なのだ。

[]