Google翻訳、「ロシア連邦」を「モルドール」と訳してしまうトラブル 93
ストーリー by headless
悲馬 部門より
悲馬 部門より
Google翻訳のウクライナ語からロシア語への翻訳で、「ロシア連邦」が「モルドール」と訳されてしまうといったトラブルが4日から5日にかけて発生していたそうだ(RTの記事、
The Guardianの記事、
BBC Newsの記事、
TCH.uaの記事)。
「モルドール」はJ.R.R.トールキンの小説「指輪物語」で描かれる、サウロンが支配する国。2014年にロシアがクリミアを併合して以降、これに反発する一部のウクライナ人の間でロシアを示す表現として使われていたそうだ。映画「ホビット」第3作の公開時にモスクワの高層ビルで「サウロンの目」のインスタレーションが計画された際にも、ロシアとモルドールを関連付ける表現がみられたとのこと。このほか、ウクライナ語からロシア語への翻訳では、「ロシア人」に対して「占領者」、ロシア外相の姓「ラブロフ」に対して「悲しいお馬さん」といった意味の翻訳結果が表示されていたという。
Googleでは5日の昼までに問題を修正し、Google翻訳は自動翻訳であり、人間の翻訳者は介在しないと説明している。数億件の文書からパターンを調べることで機能しているが、文脈に即した単語の意味を見つけることはまだまだ困難であり、誤りが含まれることがあるとも述べているとのことだ。
「モルドール」はJ.R.R.トールキンの小説「指輪物語」で描かれる、サウロンが支配する国。2014年にロシアがクリミアを併合して以降、これに反発する一部のウクライナ人の間でロシアを示す表現として使われていたそうだ。映画「ホビット」第3作の公開時にモスクワの高層ビルで「サウロンの目」のインスタレーションが計画された際にも、ロシアとモルドールを関連付ける表現がみられたとのこと。このほか、ウクライナ語からロシア語への翻訳では、「ロシア人」に対して「占領者」、ロシア外相の姓「ラブロフ」に対して「悲しいお馬さん」といった意味の翻訳結果が表示されていたという。
Googleでは5日の昼までに問題を修正し、Google翻訳は自動翻訳であり、人間の翻訳者は介在しないと説明している。数億件の文書からパターンを調べることで機能しているが、文脈に即した単語の意味を見つけることはまだまだ困難であり、誤りが含まれることがあるとも述べているとのことだ。
誤り? (スコア:1)
統計的にウクライナ語でロシアを「モルドール」と呼ぶ人が多かったのなら
(意味的には)誤りではないよね。
新語や流行り語が「いつから定着したとみなされるべきか」という問題。
Re:誤り? (スコア:1)
それならモルドールって訳さないとダメでしょ
ウクライナの人たちはロシアと呼ばずにそう呼んだのだから
意味的にも完全に誤りですよ
Re: (スコア:0)
完全に誤りってことはないな。例えば、日本語の「風俗嬢」を英訳したらprostituteとかになると思うけど、これを再翻訳した時「売春婦」にすると、文脈的には誤りの可能性がある。法的には日本にでは売春が違法だから、合法的な売春婦は存在しないけど、風営法に定められた場所で自由恋愛するのは合法だから。
つまり、翻訳はニュアンスを捨てなきゃいけないから、「モルドールの元首プーチン」っていうフレーズを解析したとき、プーチンとサウロンは別の人だから、この場合のモルドールはロシアの別名であることは明らかで、この意味に限るとウクライナ以外では使われてないんだから、ウクライナ語のモルドールを他言語に翻訳するとロシアになる。逆にこれをモルドールのままにされると、他の言語圏の人は意味がわからない。だって、事実としてプーチンはモルドールの元首じゃないからな。
Re: (スコア:0)
それは背景を知らないと読めないってだけで、訳語で解決する問題じゃないよ。
「ウクライナじゃロシアの事をモルドールって呼んでるんだって?」って文をあなたは
「ロシアの事をロシアって呼んでるんだって?」って訳すんですか?
Re: (スコア:0)
人間がどう訳すかの話ではなくて、
機械がどう訳すかの話だから、
「ロシアのロシア」と明らかに破綻してる文章がアウトプットされるなら機械的にはじかれるべきでしょうということだ。
Re: (スコア:0)
だから、たれ込みにそう書いてあるね。
Re:誤り? (スコア:1)
「ウクライナ語でロシアを『モルドール』と呼ぶ」ということは、
「ロシアを意味するウクライナ語は『モルドール』である」、ということなんですから、
・ウクライナ語の文書で「モルドール」という言葉を使っていたら、別言語では「ロシア(を意味する語)」に翻訳される
および
・別言語の文書で「ロシア(を意味する語)」を使っていたら、ウクライナ語で「モルドール」と翻訳される
ことになるはずでしょう。
「ウクライナ語→ロシア語で、「ロシア(を意味するウクライナ語)」が「モルドール(を意味するロシア語)」に翻訳される、
というのはおかしいかと。
Re:誤り? (スコア:1)
ウクライナではロシアの蔑称としてモルドールがある。と全世界の人が知っていれば、
ウクライナ語で「モルドールがまたやりやがった」は
ロシア語でも「モルドールがまたやりやがった」と訳すのが正しくない?
Re:誤り? (スコア:1)
普通、「そんなのケーキのひとかけらさ」と訳せば野暮な直訳なのは
誰でも知っている。
ウクライナ人のロシア蔑称として定着したら、
「ロシア人がまたやりやがった」こそが野暮な意訳になる。
Re: (スコア:0)
その問題を解決することも自動翻訳に要求されているわけです。
Re:誤り? (スコア:1)
それって、人間でも解決ができなさそう。
Re: (スコア:0)
イミフ
Re: (スコア:0)
順接の接続詞の「なので」はネット上のコーパス取ったらアリで、新聞上だと口述筆記に紛れてるくらいだからナシだろ。でも、それが合ってるか間違ってるかなんて、人間にも決められない。
って事だろ。
Re:誤り? (スコア:1)
有名な「ら抜き言葉、ありかなしか」もそうだね。
Re: (スコア:0)
「ら抜き言葉が許容されるか」と「ロシア連邦をモルドールと呼ぶことが許容されるか」はだいぶ異なると思うが。
国会の答弁でら抜き言葉を使っても別に問題ないだろうけど、
国会で理由もなくロシアを「モルドール」と呼んだら普通に国際問題に発展する。これが間違いでなくてなんなのか。
「統計上そういう用法が多く認められるから」なんて言い訳が通ると思う?
「モルドール」という呼び方には明らかにロシアに対する揶揄が含まれるし、
その意味を含めるべきでない場面でそんな翻訳をするのは、
どちらもロシアを指しているとしても意味的にも間違いだろう。
Re: (スコア:0)
モルドールに揶揄が含まれるのは明らかじゃないよ。蔑称が一般名詞になった例なんていくらでもある。「清教徒」とか「クエーカー教徒」とかね。
Re: (スコア:0)
だからさ、「清教徒」「クエーカー教徒」が一般名称として認められるかどうかと、「モルドール」が認められるかどうかは別じゃん。
たかが去年使われ始めたスラングと、もはや自分でそう名乗るようになって何百年も経つ名称を、一緒くたにされても困るんだけど。
Re: (スコア:0)
ツリーの最初のコメントに、
>「いつから定着したとみなされるべきか」
って書いてあるやん。数百年前に定着したのか、最近定着しつつあるのかの問題。
自分の責任の下で第三者に対して発表する用の文章を用意するためのシステムでもないし、
新聞記事や教科書に載るようなかっちりした訳が出てくると期待するのがおかしい。
最近出てきたスラングも翻訳に反映させます、というシステムなんだからそう言うもんでしょ。
人間様が誰も使ってない新たな表現を編み出してしまったというならシステムの手落ちだけど。
人間様は好き勝手に誤用しても良いけど、機械がそれを真似た「誤用」をするのはまかり成らん、とか酷すぎる。
Re:誤り? (スコア:1)
いつから定着したとみなされるべきかという問題なんだね。
Re: (スコア:0)
> 新聞記事や教科書に載るようなかっちりした訳が出てくると期待するのがおかしい。
誰の話?かっちりした訳が出てくると期待している人なんで、どこにも見当たらないけど。
まさかとは思うけど俺のこと?俺はそんなこと期待していないけど。
現在の訳は明らかにGoogleの意図したものではない「誤訳」だし、だからこそGoogleはさっさと修正したというだけの話。
俺の「期待」なんてヒトコトも話していないけど。
> 最近出てきたスラングも翻訳に反映させます、というシステムなんだからそう言うもんでしょ。
違うよ。違うからGoogleは修正した。そういうシステムならGoogleは修正
Re: (スコア:0)
> いつから定着したとみなされるべきかという問題なんだね。
そんなことは言っていないけど……
言葉の意味の問題だと何度も言っているのであって、いつ定着したかは意味にも影響を与えることがあるというだけだ。
もう一度言うけど、言葉の意味の問題だ。
Re:誤り? (スコア:1)
“ウォックス・グーグリス、ウォックス・デイ”と言い換えると古諺っぽくていいですね。
Re: (スコア:0)
おもいっきり自分で「アリ」「ナシ」ってはっきり区別してるじゃん……
1行で矛盾されても……
Re: (スコア:0)
逆じゃない?
「ウクライナ語でモルドールと言えばロシア連邦のことを指す」という新たな用法だから、「ウクライナ語版の指輪物語をロシア語に自動翻訳すると何故かロシア連邦が登場する」というトラブルになるべき。
突き詰めると、例えば、国外の何らかの集団を日本人が「あの豚共」とでも呼ぶ習慣が定着してしまったとしても、そのばっちい文章を自動翻訳すると、「あの豚共」がその集団を示す適切な語に置き換わることになるわけで、国内の妙な習慣が輸出されないわけで安心ですな。
Re:誤り? (スコア:1)
Fucking Jap!
を「くそ日本人」と訳すべきか「くそジャップ」と訳すべきか
の問題に加え「ジャップ」が日本語として元々他の意味を持っている
場合だから、結構難しいな。
Re: (スコア:0)
それはどっちでもいいだろうけど、
「クソ日本人」と「クソジャップ」がどっちでもいいということは、
「ロシア連邦」と「モルドール」がどっちでもいいということの根拠にはならない。
Re: (スコア:0)
意味的にはむしろ誤りでしょ。
悪意を込めてモルドールと呼んでいるのであって、悪意のある文脈で使うなら合っているが、
そうでなければ間違い。この過ちがただせないというなら比喩や慣用句を解釈できない。
# つーか、今回の件も比喩だわな。
Re: (スコア:0)
トールキンがモルドールをロシアの意味で使ってなかったって証明できます?
つまり、ボットは古典を読んで言語を学んだわけじゃなくて、ネットを読んで言語を学んでいるから、先にウクライナ的モルドールに出会った後に、トールキン的モルドールに出会うこともありうるわけで、その場合、ボットにとってはトールキン的モルドールこそが二次的な意味、すなわち単なる語源になる。そもそも、ウクライナにおけるモルドールの使用例がウクライナ的モルドールがトールキン的モルドールを駆逐するくらいある場合、もう、ウクライナ語でのモルドールはロシアの別名に過ぎない。
Re: (スコア:0)
ボットが知識不足で誤訳しただけなのに、知識不足のボットにとってはその誤訳こそが正しい翻訳だとか、もうさっぱり意味がわからない
それならもうどんな「翻訳」でも正当化できるな。そんな翻訳機が役に立つとは思わないけど。
まあ、お前がそう思うんならそうなんだろう、お前ん中ではな、ということか。
Re: (スコア:0)
今はモルドールの意味が残ってるから、他人のことを気軽に「知識不足」って貶せるけど、トールキンの方のモルドールの意味を知らない人が出現し始めていて、Googleのボットは単にその一人であるに過ぎない。日本語をしゃべってる人も頭に広辞苑をインストールしてから話し出すわけじゃないんだよ。そして、広辞苑に書いてあることだけが正しいわけでもない。そもそも、ウクライナでモルドールって言ってる人たちだって、実際に指輪物語を読んだり視聴したことがある人ばっかりがモルドール呼ばわりしてるわけでもないだろうし。
っていうのが、ソシュール系記号論の基本なんで、この考えを受け入れられずに「正誤」が存在すると仮定する方がマイノリティだよ。むしろ、「お前の中では正しい」っていうのは、(アニメの元ネタから切り離して考えれば)セマンティックの多様性を認めるってことだから、自分で何を言ってるのか理解していないように思える。お前に言われるまでもなく、俺が正しい。
Re: (スコア:0)
ロシアを揶揄する意味の「モルドール」と、単にひとつの国家を指し示す「ロシア連邦」が同じ意味だとは俺は思わないな。
その言葉が何を指すかだけで分類する方法もあるだろう。それも方法論として間違いじゃないだろうが、
Google翻訳という一般の人間が使う道具での方法論としては誤りだろう。これは言語学での正しさではなく、Google翻訳というツールでの適切さの話だ。
指輪物語を読まずにモルドールと呼んでいる人もいるだろうが、それがロシアに対する揶揄だということは理解した上で言い換えているはずだ。
受けるとる側のロシアだって、それが単なる呼称ではなく
Re:誤り? (スコア:1)
どっちのじいちゃんバカにしているか、自分でもわかってないだろ。
ぷぷ。
そういえば、昔 (スコア:1)
ついでに (スコア:1)
ISはスリザリンと訳してしまえ
日本なら (スコア:0)
日本語翻訳で同様の事が起きたら、何て訳されるんでしょうね。
ショッカー?何か違うな。
ボラ―連邦?マイナー過ぎるか。
Re:日本なら (スコア:2)
コサック
Re:日本なら (スコア:1)
鬼ヶ島
Re: (スコア:0)
禿...
Re: (スコア:0)
そういえば、こんなのもあったなあ。
http://megalodon.jp/2012-0706-2042-54/https://jp.cloudflare.com:443/railgun [megalodon.jp]
もしかして: モルドール (スコア:0)
日本で「もしかして」機能が初めて入ったときもひどいことになってたな。
Re: (スコア:0)
チーズの名前に訳するとかおかしいにも程があると思った
もしかして:モンドール
Re: (スコア:0)
ふたなりプリキュア問題ですね。懐かしい。
日本語→ウクライナ語→日本語 (スコア:0)
↓ウクライナ語
↓日本語
おや?なんか変だぞ?
Re:日本語→ウクライナ語→日本語 (スコア:1)
最後は、ウクライナ=モルドールみたいになっちゃってるね。
機械訳の融通無碍に花束を! (スコア:0)
で、誰か不自由した人は居るの? ロシア人でも苦笑して済ませたんじゃ無いかな?
黒ロシア (スコア:0)
モルドールはシンダール語で「黒の国」。
ベラルーシ(=白ロシア)というのがありますが、それと対になる黒ルーシ(=黒ロシア)も実はあります。
ただ、白ロシアと対になる名前が先行したので具体的にどこを指すのか人により定義が異なっていたようです。
https://ja.wikipedia.org/wiki/%E9%BB%92%E3%83%AB%E3%83%BC%E3%82%B7 [wikipedia.org]
18世紀以降リトアニアやベラルーシに流れるネマン川上流域に限定して黒ルーシと呼ばれるのですが、
それ以前にはロシアやウクライナを指す呼称としても用いられていました。
また、モンゴルの支配下に入ったのが黒ロシアという説があるようです。
モンゴル支配の時代からロシアの中心は(現在ウクライナの)キエフからモスクワに移ります。
(この場合ベラルーシの白はモンゴル人に支配されない白人のロシアを表すことになりますが、
白は西の方角を表すのでベラルーシは西ロシアを表すという説が有力です。他にも色々)
どゆこと? (スコア:0)
Googleの自動翻訳ってのは、人間の手を介さずに機械的な手法で翻訳するけど、なんだか物騒な状況の時はその限りで無いので、結局人間が介在した結果が表示されるんだよっていうこと?
結局、人間が無理矢理翻訳パターンを減らしたら、それは減らした奴の意図する翻訳結果ってことですよね?
Re: (スコア:0)
記事だけ読んで妄想に浸ってばかりいないで、Google翻訳を一度くらい使ってみなよ。
自動翻訳された文をクリックすると「翻訳を改善」というアイコンが現れて、誤訳を訂正することが出来る。
そういう形で、人間からのフィードバックは常に介在しているんだよ。
Re:機械翻訳の限界 (スコア:1)
このスレッドの流れって、今回のストーリーの翻訳問題からちょっとずれてるような。
今回の問題は「ウクライナ内でロシアを示す表現として『モルドール』を使う人がいる」という状況で、「ウクライナ語からロシア語への翻訳で、『ロシア連邦』が『モルドール』と訳されてしまう」というものです。
イギリスの例で言うなら、日本語文書の中の「グレートブリテン及び北アイルランド連合王国」いう表記が、英語への翻訳で「England」になってしまってる、というような状況。
「イギリス」が「England」に訳されているだけなら(翻訳としては不完全ですが)ここまで問題視されないでしょ。
Re:機械翻訳の限界 (スコア:1)
鰤でもなんでもいいけど、今回の問題は
「日本語で『イギリス人』の蔑称として「鰤公」という言葉を使って」いる状況で、
日本語の「彼はイギリス人です。」という文章を
英訳したら「He is Duke of Yellowtail.」と訳されてしまう
ような状況ってことなわけですよ。
日本語でどう呼んでいるかは、他言語から日本語へ翻訳するときの訳語の選択には影響するでしょうけど、
日本語から他言語への翻訳に影響するのは、訳語の選択ミスとかそういう問題じゃないです。