セマンティックWeb

 以前、以下のエントリで、ネット上に転がっている価値や意味のある情報を抽出するにはどうするべきかを書いたが、今回は、もう少し考えたので、ちょっとエントリしてみる。

Blogの情報的価値 - β. (Bee’s Blog)

 Googleなどのサーチエンジンの検索アルゴリズムは、参照回数のランキング順になっているが、今後は、推論的なアプローチが必要になってくるのではないだろうか。セマンティックWebのように、情報の選択・収集を自動化し、意味のある情報(単一のエントリに限らず、関連するエントリも含む)を引っ張り出してくる機能が必要になってくるのではないだろうか。

 これは、1つのテーマに対して、トラバによって1つの討論形態になっている複数のblogの集まりをなんらかの形でサマライズして我々に見せるというようなことを想定している。このサマライズした形は、

 セマンティックWebが実用化し、本当に価値のある情報を探し出して来て提供できるようになれば、主戦場は、「コンテンツのクオリティ」に戻ってくるのではないだろうか。ただし、ここでいうコンテンツは、従来のホームページ上にあるHTMLファイルではなく、セマンティックWebが生成したファイルだ。

 でいうところのセマンティックWebが生成したファイルを考えている。セマンティックWebのインプリがどのような形になるのかよく分かっていないのでいささか誤解があるかもしれないが。

 Proving grounds of the mad over logにて、セマンティックWebのインプリについて言及があったので、以下に引用する。

http://firewood.txt-nifty.com/bbc/2005/02/blog_chairmen.html

 webをセマンティック・ウェブ化するためには、検索したい全てのページにタグをつける必要がある。古い(既存の)システムにはタグはないが、10億ページ以上あるwebに人力でタグをつけるのは非現実的である。もし自動で行うなら、知識表現を用いるタグを機械的につけるためには、機械がそのページの内容を理解する必要があるが、それでは「セマンティック・ウェブによって機械がwebを理解する」とは言えなくなる。(なお私は機械的な意味解析には悲観的である)

 現在のセマンティックWebは、コンテンツをキーワード化したメタデータとしてのタグを取り扱うことで、インプリするようであるが、私もmakiさんと同様、可能性や実効性には懐疑的である。比較的コンテンツのクォリティの高い研究室や企業内のイントラネット上ならタグ化が容易であり、意味があるかもしれないが、一般のネットワーク上にあるコンテンツ全てをタグ化するのは無意味であるように思う。

 先ほどのエントリでも触れていたが、”A fully semantic web enabled system”のように、利用者間で評価をつけそれを交換するというシステムが一番妥当なような気がする。Amazonが本のレビューやレビュアーの評価をのせることで、情報の価値を保障しているのと同様の方法で、BloggerやBlogのエントリに対する評価を、SNSや、セマンティックWebなどで行う形になるのかなと想像している。そう行った意味で、FPNが行っているアルファブロガー選出というのは大変有意義な試みであると思う。

Site Under Construction