パスワードを忘れた? アカウント作成
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。

Google、大規模日本語データの公開を検討」記事へのコメント

  • by Anonymous Coward
    Googleが提供するってことはWebページをクロールした結果が元になると思うんだけど、著作権などはどういう扱いになるんでしょうか?
    自分が書いた駄文がデータに入るのはかまわないけど、Googleが権利を主張するようなことがあればなんとなく納得いかない。
    • by Anonymous Coward
      何を提供してもらえるのか解かりませんがコーパスを提供してくれるのかな、という気がします。
      むしろ言語処理学会で何が欲しいの?とか聞く可能性も高い気がしますけど。
      コーパスは簡単に言うと単語と様々な付属情報(品詞や活用、出現率等々)ですが、
      貴方の文章は単語と付属する情報の内の出現率等の数値に影響は与えても文章そのものは収録されないと思います。
      それに著作権がどう程度影響するかとかはまた別問題ですが・・・

      もっとも提供されたコーパスを使うほうもライセンスにはかなり気をつけないといけなくて、
      google-dicを使ってマルコフ連鎖で文章作ったけど、著作
      • by Anonymous Coward
        著作権は感情や主張の表現に与えられるものなので、単語レベルの情報を元にして何かを作ったならば、元になった著作物の権利は関係なくなると思われます。元の著作物の主張や感情などを引き継いでいるとは考えられないからです。
        • by Anonymous Coward on 2007年03月16日 21時07分 (#1127256)
          著作権法は著作物にしか適用されませんが、一般的なライセンス契約というのは、もっと幅広いものです。結局のところ著作権が問題なのではななく、「~に同意しない限り見せないよ」というライセンスは結べるわけで、著作権が問題になるのは、そのライセンスを基にしてできた著作物の二次著作物からです。

          例えば、私が300年前の先祖の肖像画を持っていたとして、「他に誰にも見せないようにするなら美術館入場料500円で写真を撮ってもいいよ」という契約を結んだ場合、その肖像画の一次著作権は切れているので、その写真をどう複写したところで著作権的には問題ないですが、ライセンスのおかげで肖像自体の一般公開は避けられるはずです。ただし、写真家の預かり知らないところで写真が複写されてしまった場合、責められるのは写真家ですし、その写真家が責任を取れないような状況になってしまった場合(例えば、既に死んでしまっていたりした場合)はどうしようもありませんから、ライセンスでガチガチにしても、肖像はいずれパブリックドメイン化されてしまうでしょう。それこそ、スパイ大作戦みたいに、「見たら燃やせ」方式にしない限りはね。もちろん、私自信が、肖像非公開によってどれほどのメリットを受けるのかは別ですよ。

          で、今回の場合、肖像画に相当するのがGoogleデータで、写真に相当するのが、まあ、辞書データとでもしましょうか。普通、肖像画の写真に一次的な意味の著作権が発生することはまずありませんが、辞書データに著作権が発生しないかどうか、というのは微妙なラインです。著作権のない生データを、システマティックに加工したデータに著作権が発生する、というのは一見、受け入れがたいようにも感じられますが、実情では、コピペ以外は著作権を主張している(もちろん認められるかどうかは別ですよ)場合がほとんどです。その場合、生データの所有者が、「見せる」ことを許諾するライセンスに、辞書データ(著作物)の再配布形式を指定することができてしまいますよね。

          GoogleがA大学に生データを「見せる」条件として、「『A大学が作った辞書データを使用する場合はGoogleに100円ずつ払うこと』というライセンスを辞書データに付与する」というライセンス契約を結ばせることも可能なわけです。まあ、Googleはこんな頭の悪いライセンスを締結したりはしないでしょうが、著作物でないものを元に著作物を作ることはできるってことですよ。まあ、Googleの場合、そもそもが売名なので、「Googleのデータを使用しています」マークを二次著作物以降にもつけさせるような感じになるでしょうか。

          [生データ] -(見せるライセンス)→ [著作物] -(一般向けのラインセンス)→ [二次著作物] -(二次著作物のライセンス)→ [三次著作物] →...

          この場合、「一般向けのライセンス」が「見せるライセンス」に抵触する内容である可能性はほぼないので、生データが著作物として認められるかどうかはあまり関係がありません。問題は辞書が著作物なのかどうか、です。で、そこを突っ込んで議論している人はいません、というか、配布元が再配布ライセンスを決定できないことが判例として確定してしまうと、こういう一連のことが始めからなかったことになりそうなので、たいていの場合は配布元の主張、すなわち、配布物が著作物であることを認めて使用している、というのが現状ではないでしょうか。
          親コメント

Stableって古いって意味だっけ? -- Debian初級

処理中...