ティム・バーナーズ=リーが語る「WWW に対する 2 つの後悔」 91
ストーリー by reo
Web address でいいんですか ? いいんです 部門より
Web address でいいんですか ? いいんです 部門より
ある Anonymous Coward 曰く、
先日のストーリーでも紹介された、CERN による「World Wide Web 20 周年」の記念式典が 3 月 13 日に開催された。この式典で“WWW の父”ことティム・バーナーズ=リー氏は、WWW に対する 2 つの「後悔」を明らかにした (ITmediaの記事より) 。
1 つ目は「Web アドレスを『http://』で始めたこと」。「スラッシュが 2 つあるのは冗長で、数十億回も無駄にキーが押された」。2 つ目は「Web アドレスの構造」。国や組織など一番大きな要素を最初に置き、「info.cern.ch」ではなく「ch/cern/info」のようにすべきだった、と思っているそうだ。
ちなみにバーナーズ=リー氏はネット詐欺の被害にも遭ったことがあるそうだ。
そこじゃないだろ (スコア:4, すばらしい洞察)
これだからアルファベットしか使わない人間は・・・。
WWW最大の失敗は,
URLに非ASCII文字を使用する際のEncoding指定について何も規定しなかったこと
に決まってるだろ。これのおかげで非英語圏の人間がどれだけ面倒な思いをしていることか。
Re:そこじゃないだろ (スコア:2)
アルファベットの字形って統一されてましたかねぇ。
# メガネgとかループlとかあるな
むしろ必要なのは統一じゃなくて包摂基準の確定でしょうな。
こちらもまだ当分は無理だと思ってますけど。
Re:そこじゃないだろ (スコア:1, 参考になる)
包摂基準ではなく包摂規準です [nifty.com]。当たり前ですがISO/IEC 10646の世界を離れれば、異なる規準はいくらでもありえます。
包摂規準の確定についてはIRGがAnnex.S分科会とか作って頑張っているようですがまだまだかかりそうですし、素人が判断するにはどうせ困難を伴うので、例示をどんどん増やしてほしいです。具体的にはIVD [unicode.org]に登録するとか。IVDはIVSを使うときにしか役に立たないわけではありません。
> Furthermore, variation selectors are default ignorable. This implies that registrants must ensure that the glyphic subset associated with an IVS is indeed a subset of the glyphs which are acceptable for the base character alone.
なので [unicode.org]、そのbase characterでどのようなグリフを符号化できるのか判断するのにきわめて有用です。
Re:そこじゃないだろ (スコア:2)
その昔、タイプライターでは、「エル」(小文字)と「いち」が同一だった、 というような住民からすれば。
一方、Ken Thompsonは…… (スコア:2, おもしろおかしい)
1 つ目は「Web アドレスを『http://』で始めたこと」。
「UNIXを設計し直すとしたら、どこを直したいですか」 と聞かれ「creat のスペルに e を付けたいね」と答えたらしい [google.co.jp]
1を聞いて0を知れ!
Re:一方、Ken Thompsonは…… (スコア:1, 興味深い)
彼はその後ちゃんと直してるよ
どっto (スコア:2, おもしろおかしい)
父上
僭越ながら
そのおかげで「ドットコム」という語呂のよい言葉が生まれたのです
Re:どっto (スコア:2, すばらしい洞察)
世が世なら「コムスラ」とかそういう、別の語呂の良い言葉が生まれただけのことです。
Hiroki (REO) Kashiwazaki
Re:どっto (スコア:1)
世が世なら「コムスラ」とかそういう、別の語呂の良い言葉が生まれただけのことです。
だが、「どっと混む [google.co.jp]」という幾多のダジャレドメインは生まれなかったであろう。:-)
Re:どっto (スコア:3, おもしろおかしい)
世が世なら「コムスラ」とかそういう、別の語呂の良い言葉が生まれただけのことです。
だが、「どっと混む [google.co.jp]」という幾多のダジャレドメインは生まれなかったであろう。:-)
混むズラ
とかって茨城あたりから出てくるんじゃね?
Re:どっto (スコア:1)
スラッシュが2つあると冗長 (スコア:2, おもしろおかしい)
だとしたら、 http://srad.jp/ [srad.jp] なんかスラッシュが4つある。
もっと短くて typo しやすい名前にすべきだよね。
モデレータは基本役立たずなの気にしてないよ
Re:スラッシュが2つあると冗長 (スコア:1)
後悔することなんかないさ (スコア:2, すばらしい洞察)
メールアドレスの仕様に比べりゃ、全然マシっすよ先生!
Lv5以下の社員全員にデスマーチ!
違和感・・・? (スコア:1)
HTTPは単純なプロトコルだから、広まったんだと思いますよ。ただ、HTMLの構造はもう少しきつくてもよかったんじゃ・・・<p>タグを閉じないで利用する輩が、周りに多すぎるので。
-- gonta --
"May Macintosh be with you"
Re:違和感・・・? (スコア:2, 興味深い)
</P>は省略可能ですよね?
批判しているのはもしかしてお尻<P> [google.co.jp]のことでしょうか?
# 変な書式を下手に指摘すると宗教論争になるよ!怖い怖い。
Re: (スコア:0)
DTDを意識せずに個人的な正義を振り翳して要らぬ騒ぎを起こすヒトには
イラッとさせられたり、ヒヤッとさせられたり、
# 口からクソをたれる前にDTDを付けろ!!
Re:違和感・・・? (スコア:1)
URL の host, port 部分と path との区別をどこでつければいいのかとか考えちゃいますねー。
Hiroki (REO) Kashiwazaki
Re:違和感・・・? (スコア:2, おもしろおかしい)
> URL の host, port 部分と path との区別をどこでつければいいのか
そこで区切りとして登場するのが「//」です! ……あれ?
Re:違和感・・・? (スコア:1)
タグを閉じないで利用する輩が、周りに多すぎるので。 そんないい加減な書き方でも表現できたからこそ, 広まったようにも思います. >
タグを閉じないで利用する輩が、周りに多すぎるので。 私もPタグにかかわらず,いい加減なHTML文書書かれるのを見ると イラっときます.
Re:違和感・・・? (スコア:1, おもしろおかしい)
#そこまでこだわる人が、なぜ改行位置の確認もしないのだろうか。
Re:違和感・・・? (スコア:1)
、。と,.の使い分けもできてないから、わざとやってるんじゃないですかね。
まぁだとしても嫌がらせ以外の意図は良く分かりませんが。
Re:違和感・・・? (スコア:1)
ありゃやってしまいましたね.
こういうミスも許容してくれるのが,Webのいいところなんですよ.
と実感.
Re:違和感・・・? (スコア:1)
それにしても">"の使い方がイラっとは来ませんが、なんだか不思議ですね。
わたしゃ全角で書かれたアルファベットと数字が含まれた文章や改行が適切でない文章を見かけるとイラっとしてしまいます。
#こういう理不尽な感情がどこからくるのかが興味深い今日この頃。
Re:違和感・・・? (スコア:1)
字句解析&構文解析のコストじゃないかと憶測してみる。
変な改行や大きさや書体が乱れているとパターンマッチしにくいのではなかろうか?
Re:違和感・・・? (スコア:2, 興味深い)
> XMLの様に、ルールは簡単な方が学習コストは低いのではないか?
この意見はよくわかるし,学習コストを軸にして考えればボクも同感です.ただ,自分が思っていることをHTMLとかで表現したいと考えている人のうち,「HTMLを学習したい」なんて思っている人なんてそんなに多くないですよ.
表現出来ればいいぐらいに割り切って考えているような人にとっては,エラーメッセージが出なかったり,ちょっと書いただけで表現出来るとかのほうがよっぽど大事で,それが後でどうなるかなんて知ったこっちゃありません.彼らのような人は,ちょっとやってみてうまく行かないとか難しいって思ったら,違うところにいっちゃうと多いと思います.
Re:違和感・・・? (スコア:2, 興味深い)
タイピングの心理的な手間と秤にかけてってことではないかなと。
昔は手打ちが標準だったので。
コンピュータ(というか解釈ルール)的には開始記号-終了記号の対が厳密かつ簡潔で扱いやすいのでしょうが、
人間にとっては開始記号だけの方が書きやすいということではなかろうかなと。
開始記号-終了記号の対が扱いやすいかどうかは文生成と文解釈で異なるんじゃないかなとも思う。
そしてタグに限らず人間は開始記号-終了記号の対を書き出すのが苦手な生き物なんじゃないかと。
例えば大抵の構文を意識したエディタではかっこ閉じ補完してくれるあたり、人間は閉じかっこを覚えているのが苦手なことの表れかなとも。
(あるいは行指向言語やインデントでブロックを認識するプログラミング言語が思い出したように現れるあたりとかも。)
思うに、ヒトのココロにはスタック的構造がなくてそれを模倣するには追加の脳内努力が必要なんじゃないかなーと。
Re:違和感・・・? (スコア:1)
主観的感想を言えば、厳密な構文解析が楽なことが分かっていても
XMLで要素の終了タグは打つのが面倒臭いw
特にHTMLのテーブルみたいに何層も入れ子になっている時は特に面倒。
Re:違和感・・・? (スコア:1)
いやまぁ、XMLはHTMLの親戚として手打ちしたら面倒だという例に挙げただけで今なら長い文書は可能な場合はツールを使ってます。
(昔はAltovaのツールに投資したけど更新費用が高くてお小遣い枠では維持できなくなったので近頃はEclipseのプラグインです。)
ただ元コンテキストはHTMLができた頃の話のHTMLの終了タグの話で、当然その頃はそんなにツールが普及しておらず(というか存在すら怪しかった)手打ちが普通でしたので。
(そもそも一般のユーザにとってはマークアップ文書という概念ですらまだいくらか目新しさがあった筈。私も初めて見たときはマークアップ文書というカテゴリが陽には意識できずなんとなくTeXの仲間と意識していた記憶があります。)
ちなみにもう一個コメントのツリーを遡ったところにも書きましたが:
文の解釈の容易さと記述の容易さは無関係といわないまでも別だろうと思っています。
(マークアップした文書という存在が読みやすいかどうかを別にすると、)開始タグ-終了タグの対は人間にとっても読みにくくはないと思います。書きにくい(=ツールの助けが欲しくなる)だけで。
またソフトウェア書きは皆さん(私自身を含めて)は慣れてるので改めて振り返らないと意識しにくいですが、XML/HTMLの開始タグ-終了タグに限らず、プログラミング言語のBEGIN-ENDや/*...*/、{}、[]、()も、読む分には悪くない構造だと思いますが、意外と脳内で一手間掛かって書きにくい(=ツールの助けが欲しくなるとか、先に閉じカッコ書いてから中身を書く慣習とか)と思います。
Re:違和感・・・? (スコア:2)
> <yellow>あ<underline>いう</yellow>え</underline>お
括弧の開きと閉じがオーバーラップしてたら気持ち悪くないですかね。
(1 + 2 * {3 + ) 4}
「本日は『晴天」なり』
そういう感覚があるからHTMLも要素がオーバーラップしないつくりになっているんだと思います。
# とか言いつつSGMLならCONCUR YESにすれば似たようなことができますが。
Re:違和感・・・? (スコア:2, 参考になる)
入れ子でないオーバーラップを許すとスタックでは処理できなくなる(プッシュダウン・オートマトンで受理できなくなる)ということで解析する際の複雑さが上がります。
比較的簡単なスタックですら人間の脳にとっては人工的な努力が必要なのだとするとそれ以上でしょう。そこいらへんが「気持ち悪い」の理由じゃないかと。
ツリー構造との対応も不可能ではないにせよ簡単ではなくなります。
Re:違和感・・・? (スコア:1)
入れ子構造がよく用いられるのはツリー構造との対応関係もあるのではないかと思います。
人間の記憶と思考の基礎構造は神経ネットワークに支えられたグラフ的構造(リソースの制約があるだろうから任意の 2 頂点間にエッジがある完全グラフってことはないだろうけど、グラフの構造の制約が現時点では明らかでないので一般のグラフを仮定)ではないかと推測され、
そこからアウトプットとして何らかの表現に書き出すときには脳内のグラフ構造を部分的に書き出さないといけない(脳内を全部ダンプするわけにはいかない)だろうと思います。
一般のグラフから部分グラフ取り出すとき、ツリーはあるノードをルートとして選んでそこから重複しないように辿れば比較的簡単に取り出せます。そしてツリーは必ず平面上に表現できる(平面グラフ)うえ、一次元構造しかない文字列を使う場合にも入れ子構造を導入することであいまいさなく表現できます。あいまいさがなければ解釈する(入れ子構造からツリーを再構築する)際のコストが低くなるでしょう。
もちろん一般のグラフから目的に応じて{バランスの良い|判りやすい}ツリーを切り出すことには余計な努力が必要(複数のノードに繋がるノードをどこへぶら下げるのがいいか?)ですし、それを入れ子構造に変換することにはさらに余計な努力が必要(閉じカッコや閉じタグを忘れないこととか)ですが、脳内にあると思われる知識のグラフの構造を部分的にせよ表現するには悪くない方法かも知れないと思うのです。
もちろんDAGとか色々他にも性質の良いグラフはあるでしょうし、グラフを文書の文字列にコード化する方法もいろいろあるでしょうが、ツリー-入れ子構造は書き出すにも読み取るにも計算量的に色々お手軽なのでよく使われるのかなと。
このようなことは構造を持たない文書には関係ないですが、知識構造の表現能力の向上を目指して文書に人工的な構造を導入しようとした時比較的導入しやすいのがツリーであり、ツリーを素直に表現できるのが入れ子なのではないかと。
Re:違和感・・・? (スコア:1)
ところで、こういう入れ子(=ツリー構造)は文書では割と多用される一方、会話ではあまり使えない気がします。
というかそもそも会話は脱線すると元には戻れないことが多い。
このあたりも人間の脳が作り出す「意識」はネットワークの上を連想によって辿るように働いていて、他のノードに移ったら移ったきりであり、元に戻るためのスタック的な仕組みをサポートしていないということかなと思っています。
このため入れ子などの構造は会話のようなリアルタイム処理が必要な局面では使えないということなのではないかと憶測。
Re: (スコア:0)
>HTMLの構造はもう少しきつくてもよかったんじゃ・・・
タグを閉じないで利用する輩が、周りに多すぎるので。
勘違いだったら申し訳ないけども、それってブラウザ側の解釈の問題じゃないの?
Re: (スコア:0)
ベースはXMLじゃなくて、SGMLなんだから。
XHTMLが云々とか、SGMLの省略可能表記が云々という話なら、又別ですが。
Re: (スコア:0)
/jp/kantei/xx とすればよかったという後悔はわかるけど。
Re: (スコア:0)
> まさにあなたのようなコメントをする人の存在を許してしまったことを後悔しているという内容なんですが、まさにそのとおりですね。
ホントに? ニュース原文 [reuters.com]
妄想じゃないなら根拠プリーズ
# むしろgonta氏の意図が汲み取れてないような気もするが
Re:違和感・・・? (スコア:1)
それなりに普及して、間違える人も割と見なくなってよかったですよ。
最近だとコデラノブログで見かけたくらいかな。
Re:違和感・・・? (スコア:1)
英国では Valeria.Paiva@uk.ac.cambridge.computer-lab みたいなメールアドレス
uk.ac.cambridge.computer-lab@Valeria.Paivaでないと中途半端な気がします。
wwwだけではどうにもならないことではあるが (スコア:0)
メールアドレスとして「ユーザ名@ホスト名」と書いている限りは、「ユーザ名@ホスト名」は「狭→広」だからよかったのかもしれないけど、URLの場合は、
プロトコル://ユーザ名:パスワード@ホスト名/dir1/dir2/....../file
となっていて、「ユーザ名:パスワード@ホスト名」は「狭→広」なのに、その後は「広→狭」なのがエレガントではない、ということだろうか。
Re:wwwだけではどうにもならないことではあるが (スコア:1, 興味深い)
・ホスト名の広がりが左←右なのに対して、それ以降のパスが左→右となってる
・意味合いが対して違いが無いものに対して2つの異なるセパレータ(/と.)を使ってる
まあ電子メールの方が古い歴史を持ってるから(1971年に現在の形式が制定)、
wwwのホスト名をそれと異なる順にするのは違和感が有ったのでしょう。
#だと思う。
Re:wwwだけではどうにもならないことではあるが (スコア:1)
サーバ単位でなんて付いていませんよ。あくまでも IP アドレス単位。Windows でも netstat -an してみればわかりますよ。
複数 IP アドレスあっても同一ポート番号が指定できない? VirtualHost の設定で *:80 とか書いて全 IP アドレスの 80 番を指定しているだけじゃないですか?
単一 IP アドレスでも同一ポート番号で開けないと……とか言うのは、区別できないので却下。ssh/http/https/smtp/smtps/pop3/pop3s/imap4/imap4s が全部 80 番で、とかきもいだけです。
わざわざ (スコア:0)
そんなことは別にどうでもいいとか思ってしまった。
そういう人は結構いるような気がしますが。
Re:わざわざ (スコア:1)
「結構」いるのかどうかはよくわかりませんが、そうでない人がまだいるのは確か。
例えば私がそうです。
Chromeだとアドレスバー(?)にURLを打ち込んでいくと補完してくれるのも楽で、ブクマよりもそっちの方をよく使っています。
#って、何の反証にもなってないねw
Re: (スコア:0)
そんな人が増えようが、過去から営々と続けられた行為の中での回数を考慮すれば、実は数十億回程度では済まないじゃないかとも。
今この瞬間にだって世界中でと考えればウン万人が打とうとしていても不思議とは思わん。
Re:そもそも (スコア:1)
>URLを手で打ち込むにしたって、
>Webブラウザ使ってるだけなら「http://」省略出来るよね。
これだから若者は……
少なくとも、NCSA Mosaic はそんなしゃれたことはできませんでしたよ。
たしか昔の Netscape(3.x くらい) や、IE(2.0 くらい)も。
Re:そもそも (スコア:1)
古いブラウザを使って反論するのは卑怯とか思って、試しにやってみたら、w3mもlynxも省略できました。
Re:そもそも (スコア:1)
もちろん、各種補完機能は最大限便利に使っています。
最新技術の利便性に頼りながら、若者に対しては
「自分が若い頃にはこんな便利なモノはなかった。
今の若者は……」とやるのがおっさんというものです。
Re:そもそも (スコア:1, すばらしい洞察)
>UNIXの端末でもシェルの補完機能とかに頼らずCOMMAND.COMか何かを使っておられるのですか?
UNIXでCOMMAND.COMを使っていたらある意味すごいと思う。
Re:wwwも短くしていいよ (スコア:1)
元々wはdouble uなので、いっそuだけでu
-- う~ん、バッドノウハウ?