Suranga Chandratillakeは「もっと効果的でスケーラブルなやり方が必要だ」と考え、Webビデオのリモコン実現を目指して2004年にBlinkxの共同創始者となった。Blinkxの検索技術は隠れマルコフモデルを利用してビデオ音声の音声認識を行い、ビデオ内容を解析するというもの。「Contextual Search」(内容検索)と彼は呼ぶ。
Blinkx searchの良さは、スピーチやニュース映像なんかであれば効果てきめんであることは容易に想像がつくだろう。彼らは他サイトへの技術ライセンスで$12.5 million(約15億円)を稼いでいるが、成功と言えるためには3つの障害を乗り越えなければならない。
- Google VideoやYouTubeの検索がもっと良くなるかもしれない
- TruVeo, Flurl, ClipBlastなどの競合に出し抜かれるかもしれない
- 彼らは音声を検索しているのであって、画像ではないこと
Content-Based Image and Video Retrieval - Google Video:「The Search」のJohn Battelleは、「サーチはインターネットへのナビゲーションであり、インターフェースなのさ」と言ったが、そのトップに立ち続けるのは本当に難しいのだろうな。
We will describe the use of hidden Markov models (HMMs) for content-based retrieval of images and video via text queries. In this model, objects or concepts present in an image or video clip constitute the state-space of a Markov chain, and the observed visual features, as well as any text or caption accompanying the image, are modeled as stochastic emissions from the (unobserved) states of this Markov chain.
*参考*