Google翻訳の精度が向上、ニューラル・ネットワーク導入が理由? 33
ストーリー by hylom
元の文章によって翻訳品質もだいぶ変わる予感 部門より
元の文章によって翻訳品質もだいぶ変わる予感 部門より
Googleの翻訳サービス「Google翻訳」の精度が向上していることが話題になっている(ITmedia)。
「shi3zの長文日記」ブログではいくつかの翻訳例が出ているが、日本語として変な部分はまだあるものの、確かにかなり分かりやすい翻訳結果が出るよう変更されているようだ。
まだ日→英だけ (スコア:3, 参考になる)
まだ日→英だけで、英→日はしばらく先とのことです。
https://twitter.com/naoya_ito/status/797211494416977921 [twitter.com]
Re: (スコア:0)
Google日英ホントひどかったからねぇ。
仕事で使ってた時、こらダメだ言うことでBing翻訳使用者ばかりになっていったから。。
♯長めの文だと会話できる人も使ってた。
今ならこの二つで翻訳->良い方選んで手直しする方法でそれなりに使える感じ。
Re: (スコア:0)
ストーリーで引用されているshi3z氏のブログでは、英→日の結果を試して感心しているようですが…。
実はGoogle翻訳は今までもすごかった…のかな?
Re: (スコア:0)
後に続くコメントを見る限り、講演者もいつからどんな範囲で切り替わるのか把握していなかっただけのような
やってみた (スコア:2, 興味深い)
タレこみの文をそのままかけたら酷い事に。
と思ったら、カギ括弧が閉じてないから当然ですね。日本語として失格。
「Google翻訳」にしたら、もう自分には添削できないレベルの英語が出てきて感服しました。
Re:やってみた (スコア:3, 興味深い)
ほんとだ。そこらへんの日本人をはるかに超えるレベルだ。あえて言うなら時制と複数形をどう推測するかというあたりか。
It is a hot topic that the accuracy of Google's translation service "Google Translation"
is improvinghas been improved (ITmedia).Several
translationsexamples are available on the "long (日記の期間の長さではないのでlengthy等の方が適当か) diary of shi 3 z" blog,butand although thereisare stillastrange parts as Japanese, it certainly seems to have been changed so that translation results are clearly easy to understand.I が止まらない (スコア:1)
ちょっと試してみたら日本語でありがちな主語が省略されてる文だと、デフォルトで I にされる傾向があった。
内容を確認せずに送信しちゃうと、後で「言ったのはあの人!オレはそんなこと言ってねえ!」って言い訳しなきゃならんかも。
#AIだけにアイが重いってか?
Re: (スコア:0)
「〜にする(した)」「〜なる(なった)」の表現が、字面どおりにmadeやbecameになりがちな傾向もあるっぽい。
もっと軽くdoやgetで訳したほうがいい場面が多いような。
Re:やってみた (スコア:1)
適当な文章を英訳して遊んでたら、「141万円」が141 million yenになってて吹いた。
同じ文章の「130万円」は1,300,000 yenで正しいのに…。
まあでも、このクオリティの英語が自動で出てくるのはいいですね。
小説や論文を書くのにはまだ足りないけど、気が利いた文章を考える必要がない状況もたくさんあるので。
Re: (スコア:0)
事故レス。
「130万円」じゃなかったよ。
「103万円」が1,300,000 yenに変換されてたよ…。
どうやってこういう間違いが起こるんだろう。
Re:やってみた (スコア:1)
脊髄反射的神経網
Re: (スコア:0)
つまりはそこが文法を処理してないパターン認識の弱点の一つじゃない?助数詞とか単位を理解してない。
だから特殊な処理が無い限りは 「150万ドル(約3億円)の違約金」のような翻訳もしない。
#こっちの「翻訳」は、為替レートが大きく変わった時に困るけどね。当時は240円だったんだなーとしみじみ。
>「103万円」が1,300,000 yenに変換されてたよ…。
むしろこっちの方がイレギュラーなのでは。なんでそういう学習をしちゃったんだろ。
そういえば、試した中では「うちの息子(小3)」みたいなのでも(small 3)になってたわ。
文脈を理解してれば「小学校」の意味なことは明らかだと思うけどね。
Re:やってみた (スコア:2)
もしかして、スラドのtypoは機械翻訳を使っての海外サイトへの無断転載を抑止する目的だったりもする?
Re:やってみた (スコア:2, おもしろおかしい)
ストーリー by hylom
も含めて翻訳させてどんどん学習させていけば、そのうちby hylom を見てありがちなtypoまで直して訳してくれるようになる、かな?
Re: (スコア:0)
やめるんだ!
Googleがhylom化する未来が見える。
Re: (スコア:0)
きしゃのきしゃがきしゃできしゃした
→You can sharpen your tea ceremony
翻訳精度あげられるなら (スコア:1)
日本での英語教育もAIに任せたら精度(習熟度)があがるんじゃないかと期待。
今の学校教育は知らないけど、過去に中高6年やってたのって受験以外で役に立たなかった気がする。
#自分の学力と意欲は棚に上げとく。
Re:翻訳精度あげられるなら (スコア:2, おもしろおかしい)
就職してからだってそれこそMSDNの誤訳指摘する以外に英語使ったことないわ
Re:翻訳精度あげられるなら (スコア:1)
大学でも英語の授業は少ないなりにあって
論文読み書きする分には専門分野だからなのかなんとかなったけど
発表やポスターセッションで英語でやりとりするのはめっちゃ冷汗かいた。
関ヶ原に米軍が颯爽と登場 (スコア:0)
の連想ゲームは精度上がったって言うんだろうか
一方スラドでは (スコア:0)
日→日の編集でも誤編集しまくりで精度向上は見込めず
スラドをSladと訳すバグあり (スコア:0)
惜しいですがsradです。
Re: (スコア:0)
Googleとhylomさんのどっちを信頼するか、考えるまでもない。
sradはsladのタイポなんですよ。
某社からのメールが意味不明だったので試してみた (スコア:0)
元: Apple Pay が到着しました
google 翻訳 日本語 → 英語 : Apple Pay has arrived
さらに、英語 → 日本語 : りんごの支払いが到着しました
うん、使ってたのか!
グーグルにしては珍しく (スコア:0)
なんかJS切ってると使えなくなってるねえ。昔は使えてたのに。
403. That’s an error.
Your client does not have permission to get URL / from this server. (Client IP address: 127.0.0.1)
That’s all we know.
逆にトラブルのもと? (スコア:0)
割とそれっぽい文章をつくるようにはなってそう。
こういう形になっていると、文章としてそれっぽいみたいな思考は入ってそう。
あとはこの単語は、こういう文型に配置するみたいな配置パターンの情報を統合して文章にとりまとめる
みたいなところは賢くなってそう。
ただ、やっぱり意味の認識は難しそう。
意味をしっかり把握して、それをもとにやや大胆に文の形を変更したり
言葉を補ったりみたいなあたりは。
こういう状況だと、文章としてはそれっぽいから信じてしまったけど、
実は意味をきちんと訳せていなかったみたいな場合、トラブルになりそうではある。
Re: (スコア:0)
機械翻訳のspamサイトやフィッシングサイトを見分けにくくなりそうですねえ。以前の機械翻訳のレベルならひと目で見分けがついたのですが。
電子書籍との組み合わせ希望 (スコア:0)
電子書籍と組み合わさっているとうれしいのですが、もうあるのですかね?
あと、YouTubeの字幕翻訳、こちらも精度向上されるとうれしいです。
# man pageをこれから試してみるところ
Re: (スコア:0)
たとえばKindle Paperwhiteだと、デフォルトの翻訳機能はbingになってるはず。
(わざわざためしてないけど、たぶんスタンドアロンでは使用不可。)
持ってるのは旧世代だけど、たぶんかわってないんじゃないかな。
翻訳できると言っても長文を訳させるのはきついし、翻訳精度もそれなりなので、あんまり使ってない。
英和辞典や英英時点の方が使用頻度が高いくらい。
今高い評価を得ている新型のGoogle翻訳も、技術文書とか小説とか訳させたらボロボロになると思うよ。
あくまで「今までよりはマシ」ってだけで、慣れない文章を訳せないのは変わらんもの。
日本語 → 日本語 (スコア:0)
日本語から日本語に翻訳させると微妙に文章が変わります。
中間言語的な何かにいったん変換していると思われます。
これ、何かに使えないかな。
おめこ→Congratulations! (スコア:0)
どういうことだってばよ?
ここからが本当の (スコア:0)
https://japan.googleblog.com/2016/11/google.html [googleblog.com]
提供開始は本日(16日)らしいですよ奥さん!