アカウント名:
パスワード:
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
Stableって古いって意味だっけ? -- Debian初級
各種権利はどうなるの (スコア:2, 興味深い)
自分が書いた駄文がデータに入るのはかまわないけど、Googleが権利を主張するようなことがあればなんとなく納得いかない。
Re:各種権利はどうなるの (スコア:3, 興味深い)
むしろ言語処理学会で何が欲しいの?とか聞く可能性も高い気がしますけど。
コーパスは簡単に言うと単語と様々な付属情報(品詞や活用、出現率等々)ですが、
貴方の文章は単語と付属する情報の内の出現率等の数値に影響は与えても文章そのものは収録されないと思います。
それに著作権がどう程度影響するかとかはまた別問題ですが・・・
もっとも提供されたコーパスを使うほうもライセンスにはかなり気をつけないといけなくて、
google-dicを使ってマルコフ連鎖で文章作ったけど、著作
Re:各種権利はどうなるの (スコア:1, 参考になる)
Re:各種権利はどうなるの (スコア:0)
例えば、私が300年前の先祖の肖像画を持っていたとして、「他に誰にも見せないようにするなら美術館入場料500円で写真を撮ってもいいよ」という契約を結んだ場合、その肖像画の一次著作権は切れているので、その写真をどう複写したところで著作権的には問題ないですが、ライセンスのおかげで肖像自体の一般公開は避けられるはずです。ただし、写真家の預かり知らないところで写真が複写されてしまった場合、責められるのは写真家ですし、その写真家が責任を取れないような状況になってしまった場合(例えば、既に死んでしまっていたりした場合)はどうしようもありませんから、ライセンスでガチガチにしても、肖像はいずれパブリックドメイン化されてしまうでしょう。それこそ、スパイ大作戦みたいに、「見たら燃やせ」方式にしない限りはね。もちろん、私自信が、肖像非公開によってどれほどのメリットを受けるのかは別ですよ。
で、今回の場合、肖像画に相当するのがGoogleデータで、写真に相当するのが、まあ、辞書データとでもしましょうか。普通、肖像画の写真に一次的な意味の著作権が発生することはまずありませんが、辞書データに著作権が発生しないかどうか、というのは微妙なラインです。著作権のない生データを、システマティックに加工したデータに著作権が発生する、というのは一見、受け入れがたいようにも感じられますが、実情では、コピペ以外は著作権を主張している(もちろん認められるかどうかは別ですよ)場合がほとんどです。その場合、生データの所有者が、「見せる」ことを許諾するライセンスに、辞書データ(著作物)の再配布形式を指定することができてしまいますよね。
GoogleがA大学に生データを「見せる」条件として、「『A大学が作った辞書データを使用する場合はGoogleに100円ずつ払うこと』というライセンスを辞書データに付与する」というライセンス契約を結ばせることも可能なわけです。まあ、Googleはこんな頭の悪いライセンスを締結したりはしないでしょうが、著作物でないものを元に著作物を作ることはできるってことですよ。まあ、Googleの場合、そもそもが売名なので、「Googleのデータを使用しています」マークを二次著作物以降にもつけさせるような感じになるでしょうか。
[生データ] -(見せるライセンス)→ [著作物] -(一般向けのラインセンス)→ [二次著作物] -(二次著作物のライセンス)→ [三次著作物] →...
この場合、「一般向けのライセンス」が「見せるライセンス」に抵触する内容である可能性はほぼないので、生データが著作物として認められるかどうかはあまり関係がありません。問題は辞書が著作物なのかどうか、です。で、そこを突っ込んで議論している人はいません、というか、配布元が再配布ライセンスを決定できないことが判例として確定してしまうと、こういう一連のことが始めからなかったことになりそうなので、たいていの場合は配布元の主張、すなわち、配布物が著作物であることを認めて使用している、というのが現状ではないでしょうか。