セマンティックウェブに対するGoogleの疑問 16
ストーリー by mhatta
Googleの人として最近よくしゃべるようになってきましたね 部門より
Googleの人として最近よくしゃべるようになってきましたね 部門より
maia曰く、"Tim Berners-Leeが7月18日米国人工知能学会で基調講演を行なったところ、質疑の時間になって最初に質問したのがGoogleの検索担当ディレクタPeter Norvigだった(CNETの記事、CNET News.comの記事)。Berners-Leeは、いつもの通り、永続的なURIsとRDFを使うことの重要性を強調したが、Norvigのぶつけた質問をまとめると
- 私たちは、サーバが設定できず、HTMLが書けない何百万人ものウェブマスターを相手にしている。彼らが「next step」に進むのは難しいだろう。
- 2番目の問題は競争だ。民間企業の中には「我こそリーダーだ。それでも標準に従うべきなのか」と主張する向きもある。
- 3番目の問題は偽装の一種。私たちは毎日、(不正に)ランクを上げようとする偽装に対処している。人の目がより行き届かないセマンティックウェブだと、かえって偽装が簡単になる心配がある
なんかさあ (スコア:1)
ひとつ気になったのは
>人の目がより行き届かないセマンティックウェブだと、かえって偽装が簡単になる心配がある
なんでも自動化して人の手を加えないのがGoogle流じゃなかったのか?
#実際には人為的な操作を加えてるくせに、Google Mapの店舗情報の間違いを指摘したら「全部自動でやってて修正できません」と答えられたのがちょっと気にくわないAC
Re:なんかさあ (スコア:5, すばらしい洞察)
>なんでも自動化して人の手を加えないのがGoogle流じゃなかったのか?
それは明らかに誤解かと。
これは、CNETの記事にも「Berners-Lee氏はこれまでにもHTMLだけでなくセマンティック言語を使うようウェブ開発者に提唱してきたが」とあり、そこに対する Google の立場からの反論なわけです。
「一般エンドユーザの目に触れないメタデータを恣意的に付ける(そしてそれを信頼する)ことによるリスク」に加え、「HTMLも(満足に)使い切れないwebマスターに、より抽象度の高いセマンティック言語を(正しく)使えるわけがない」という現実があるから、「webマスターたちが作りたい(作れる)ものを作れば、メタデータ類を生成してあげる」のが Google のアプローチであり、現実解としてそうするしかないと思うんだけど、Timの意見はどう? とNorvig氏は言ってるのだと思われます。
つまり、無数のwebマスターが「がんばって」メタデータを作成して「楽に自動的に」セマンティックwebするか、無数のwebマスターは「楽に」やりたいことだけやって「がんばって自動的に」Googleするか、の戦い。
「なんでも自動化」というのは世界中未来永劫存在しないので、どこかで誰かががんばらないといけないんだけど、セマンティックwebは「とにかくデータ作成の時にがんばっておけば、明るい未来が待ってる(かも)。みんな、がんばれ~」、Web2.0は「blogとかソーシャルブックマークとかでほどほどにがんばっておくだけでも、このくらい楽しいことができますよ」、Googleは「俺ががんばるから、みんなは好きにしてて」、ということなのだろうなと思ってます。
Re:なんかさあ (スコア:0)
テキトーな理解で書いてたから、ちゃんとしたレスもらえてよかったよ。
#元AC
Re:なんかさあ (スコア:2, 参考になる)
PageRankは人間がリンクをメンテナンスしていることにけっこう依存したアルゴリズムですし。
RDFなどの場合だと機械が他のRDFを元に推論などをして新しいRDFを生成したりといったことがHTMLと比べずっと多く行なわれるので、どこかに変な情報が入ると今よりもずっと早く広く広まってしまうかもしれません。
境界線 (スコア:1, 興味深い)
(完全)自動化と人為的な手心
の境界はどこか?
というのもいろいろと見解が分かれるところだと思います。
結局、何がしかのパラメーターを放り込んでプログラムを最適化していたら、そのパラメーターは人為的なわけであって、要するに自動化しているけど、パラメーターの調整は行っているという意味もある。だから、google が自動化しているというのは確かに本当だろうとは思うが(人海戦術ではない)でも、何がしかの要素はいれているし、例外事項も存在する。というだけではないだろうか?
何がしかのシミュレーションプログラムやら、何がしかのモデルに基づいたコードを書いたひとならいろいろと経験していると思うが、こういうどこまでが理論の中だけで閉じているのか、人為的に調整したパラメーターを含んでいるのか?どこまで自動化しているのか?というのは、それぞれの立場だと見方で言い方が(言葉に含まれている範疇が)いろいろあるとおもう。
だから、あまり「自動化」という言葉を神聖化するというか、妄想を抱かないようにするのは大事だと思うよ。
Re:なんかさあ (スコア:0)
どこかに人為的な操作をしてるからって、全てが同じとは限りません。
まぁ、あれじゃない? (スコア:1, すばらしい洞察)
オーソドックスな質問をあえてしてみた、と。
で、答えるほうも、いい加減うんざりするほど繰り返される質問なので、
模範解答は用意してあった、と。
質問した人が人だったので、話題になっただけ、と。
Re:まぁ、あれじゃない? (スコア:0)
次はアンタが質問してくれ > Kanzaki (スコア:1, おもしろおかしい)
あまりにアホらしいのでAC
理論/理想アプローチか、動けばいいアプローチか (スコア:1)
メガフォーマットとマイクロフォーマットの対比、あるいは
マイクロカーネルとモノリシックカーネルの対比、などに通じるものを感じる。
古くは、SGMLとHTMLもそう。
前者は、理論的な整合性からアプローチしようとする。
後者は、動けばいい、ですな。今使えるものを手にしようとする。いくら理論的に正しくても、現実に今使えないのじゃ意味ないと。あるいは、問題解決しやすいと。
多分、両者はそれぞれの特徴を認めるのが普通なので、実際は対立するようで、結局すみわけになっていったり、あるいは現実には似たようなことをやっていたりするものでしょうが。
#よく分からないけど。
脳に情報が届く前に返信 (スコア:0)
カラテとスモーとボクシングとムエタイとレスリングとプロレスとジュードー、どれが一番強いか決めるときは、統一ルールを作らなきゃダメだと思います。
ルールは、言い出しっぺか一番お金持ちが決める方向で。
気に入らないときは、別のルールで大会を開けばいいじゃないかな。
そのときのルールは以下略
Re:脳に情報が届く前に返信 (スコア:2, すばらしい洞察)
> そのときのルールは以下略
そして、カラテとスモーとボクシングとムエタイとレスリングとプロレスとジュードー、ができあがる。
(ふりだしに戻る)
Re:脳に情報が届く前に返信 (スコア:0)
自分に有利なルールでも、みんなに公平なルールでも、自由に。
今やりたいすぐやりたい (スコア:0)
けど、何から始めたらいいの?
まったくとっかかりがわかりません。(><)
Re:今やりたいすぐやりたい (スコア:0)
とりあえず、hCard、hCalendar、hReviewあたり。
#なんでhが付くの?
Re:今やりたいすぐやりたい (スコア:1)
"HTML for xxxx"という所から来てるんじゃないでしょうかねぇ.
(X)HTMLである(人間(HTML+CSS)にも機械(XML)にも読める)ことが最重要なはずなので.
前にちょこっと調べたときもhの理由は見つかりませんでした.誰かhな人,おせーて下さい.