
Google日本語入力、正式サービスへ。そして開発秘話コミックも公開中 100
ストーリー by reo
開発者の顔が見えるのは素晴らしい 部門より
開発者の顔が見えるのは素晴らしい 部門より
ikotom 曰く、
ご存じの方も多いと思うが昨年 12 月 16 日にGoogle 日本語入力がベータ版から卒業し正式サービスとなった。今までタレコミが無かったあたり、タレコミ人と同じく世間的にも正式版とベータ版の違いなど興味がないのだろう。もし機能を知りたければ窓の杜の記事などをご覧になられたし。
むしろ個人的に一読をお勧めしたいのが、同時公開中の開発背景を紹介しているコミックである。オッサン開発者達がアメコミとも何とも言えぬ絵柄で「辞書ファイルが無い」「Webか らリアルタイム取得しない」といった特徴や DLL 分割のポイントなどを解説しており、技術者ならずとも興味深い話題が満載である。マルチプラットフォームが目標であることも明言されており、現在 Mozc としてオープンソース化されているコア部分に各種 UI を加えた、待望の Linux 版到来も間近と期待してよさそうだ。
Newspeakを強要しない? (スコア:5, 興味深い)
ATOKで「小人」が変換できないのでイラっとしてたらこういう理由があるらしい。
http://www.justsystems.com/jp/tech/atok/dic/faq/03.html [justsystems.com]
そうしたことばを変換辞書に収録することにより、故意ではなくても無意識のうちに、あるいは誤変換の形で文書中に挿入されてしまう、という可能性がでてきます。
そのような場合、たとえ本人にその気がなくても、結果的にあることばが他者に対し不快感を与えたり、また思わぬところで、差別意識を助長する結果にならない、とは誰にも保証できません。
また、一度、文章となってしまうと、もともとどのような意図でその単語を使ったかは、伝達が進めば進むほど不明確になります。インターネットによって、即時に多数の人に情報を伝達できる現在ではなおさらです。
ATOK監修委員会は、この種の言葉を収録するか否かをめぐって、さまざまな角度から長期にわたり、検討した結果、社会のあるべき人権意識に立脚し、現時点では、原則として収録しない方針を採用しています。
それはお前らIME屋の仕事じゃねえよジャストシステム。
俺が何を書くかは俺が決める。
俺の意図が伝わらなかったらそれは全部俺が悪い。
俺が書いた文章の責任は全部俺が取る。
それをIME屋が勝手にしゃしゃり出て責任被ろうとすんじゃねえ。
使用者にNewspeak [wikipedia.org]を強要すんな。
…というわけでGoogle日本語入力に乗り換えてみようかな。
「気狂いピエロのフェルディナンかよ!」
とか
「お前らはまるで白痴だな!」
みたいな侮蔑表現がちゃんとできる?
Re:Newspeakを強要しない? (スコア:2)
他人任せにした時点で君の負け。geekなら漢直だろ!
# とかいうわたしはskkユーザ
Re:Newspeakを強要しない? (スコア:1, 参考になる)
>「気狂いピエロのフェルディナンかよ!」
>とか
>「お前らはまるで白痴だな!」
器具委ピエロのフェルディナンかよ
お前らは○では口だな
となりました on ATOK2010
一方Google日本語入力は… (スコア:1, おもしろおかしい)
あうあうあー → (^p^)あうあうあー
Re: (スコア:0)
Re:Newspeakを強要しない? (スコア:1)
差別語に限らず弾いた単語をオプション辞書で追加させて欲しいですね。
ダウンロードに際してはかなりの注意書きをして、変換候補に強く警告を出すような感じで。
ラーメンのひとつの言い回しですら別けて変換する必要があるというのは面倒です。
具体的にその単語が必要と云うことではなく無意識に挿入されるのとは逆に
無意識に変換されることを期待してされない時の思考の中断が煩わしい。
変換できてそれが一般的に不適切な言葉かどうかをジャストシステムの基準で教えてくれる方がよっぽどありがたい。
更に云えばオプション辞書セットにすればATOKは設定を使い分けることができるので公私で使い分けることもできる。
gIMEは辞書に学習させないモードしかなかったのでそのままなら公私でエキセントリックな変換を辞書から除外するといったことはできないかも。
# でも除外語辞書を公開したら「なんでこれが差別用語なんだ!」ってのがあるかも知れないのも事実ー
Re: (スコア:0)
Re:Newspeakを強要しない? (スコア:1)
駅にいくとたくさん表示されてますが→「小人」
Re:Newspeakを強要しない? (スコア:2)
ATOKで「しょうにん」を変換したら、広辞苑第六版の辞書で、「こ‐びと【小人】」が出てきましたよ。
もう考えることさえ面倒だ。
Re:Newspeakを強要しない? (スコア:1, すばらしい洞察)
だとしても、
その機能を無効に出来ない、常にメーカーの思想を押し付け続ける、
というのは傲慢であり、思想統制や検閲と紙一重だよ。
#個人的には言葉狩りこそ差別だと思う
Re:Newspeakを強要しない? (スコア:1, すばらしい洞察)
それは違う。
どんな製造物であれ思想を盛り込むのは自由だし、全く製作者の思想を反映させないなんて無理でしょう。
しかし、言葉を扱うツールが知らぬ間に言葉狩りをして検閲するなんてやってはいけない事だと思います。
逆に言えば、ATOKを信頼しているとその思想とやらに知らず知らず洗脳されてしまう人もいるのでは?
うちのATOKではこうです! というように何が正しいのかATOKに決めてもらうことに疑問を感じない人が。
#まあ、ネタで言ってる人もいるんでしょうけど
Re:Newspeakを強要しない? (スコア:1)
どうしても「気違い」「気狂い」を使いたければ、即登録 by SKK ユーザ
という半分冗談はともかく、自分が知らない単語は使わない(使えない)、自分が知っている単語をIME辞書が知らなければ、教えれば良いだけ、というやり方が、肩の凝らない方法かもしれませんね。
Linuxでは、ibus + mozcを試しましたが、変な文例が上がってくるので、ちょっと苦手ですね。やはり辞書を鍛えたskkの方が、ノイズが少ない分使いやすい。
一方、Windowsでは、ATOKを使ってますが、ATOK禁止語を使う機会がないので、いまいち不便さが分かりません。
入力した文章の利用権が無料でGoogleに与えられる (スコア:5, 興味深い)
利用規約より。
なおかつそれに続けて
とありますが、Google 日本語入力についてこの「追加条項」が存在しないことから、この権利を撤回しないというGoogleの意思が明確に表明されていると考えることもできます。ちなみに、Google Chromeの利用規約ではこの条項は削除されています。
たとえGoogle 日本語入力自体にその文章をGoogleに送信する機能がついていなくても、Googleが利用権を取得することに変わりはありません。
以上から、少なくとも企業での使用はお勧めできませんね。特に、守秘義務や特許がらみの部署での使用は危険です。
使ってないのに想像で書いてみる (スコア:3, おもしろおかしい)
「薄毛」を変換しようしたら、「もしかして: 禿」と小さな親切余計なお世話の変換候補を表示してくれそうな予感。
Android版があればなぁ・・・ (スコア:2, 興味深い)
Google日本語入力のAndroid版を切に希望します。
できればGoogleアカウントと紐づいた辞書同期も。
10ドルくらいなら喜んで払います。
Google Pinyinだと辞書同期もあるんだよなぁ。
屍体メモ [windy.cx]
バカと暇人向け日本語入力という印象 (スコア:2, 興味深い)
【パンツ】→【パンツじゃないから恥ずかしくないもん】
みたいな思わず吹き出す単語が多くて真面目な用途の時は使いにくい印象
オタ的にも笑ってしまって思考が遮られるけど
一般人なら更にギョッとするんじゃないかな
サブカルの辞書がわり使うなら、本当にいい感じなんだけどね
邪王炎殺黒龍波とかATOKじゃ変換する気にもなれんもんな。
なんかGoogle日本語入力使ってると
ウェブはバカと暇人のものという説は正しいんだろうなとしみじみ思えて哀しくなってくる
勿論自分もそんな馬鹿な暇人の1人なんですけどw
Re:バカと暇人向け日本語入力という印象 (スコア:2, 興味深い)
オタク語を気にする人は実はオタクだけで、一般人はそれほど気にしないですね。
変換語をみていちいち顔をしかめたり気にしたりする人はオタクしかいないといっても過言ではありません。
ビジネス的な場所では特にそう感じます。
取引先の営業氏がGoogle日本語入力使っていますが、重役を呼んでいても構わずプロジェクター越しにオタク変換をやらかしてくれますので、社内の隠れオタクをあぶりだすのに重宝しています。
Re:バカと暇人向け日本語入力という印象 (スコア:1)
ギャルゲ風の萌え絵も気にするのはオタだけらしいし(一般人的には可愛い絵くらいの認識の人が多いらしい)
それはそうなんだろうとは思うんだけど、なんか割り切れん物を感じるんだよね。要するに自分がオタだからなんだろうけど
ただ人が気にするしないは別としてネットスラングが混入しやすいってのはそれだけで仕事への使用を躊躇する人多いと思うよ
ちょうど別トピで話題になってるけど、言葉狩りだなんだいわれてもATOKが差別語削ってるのも
そのことの是非を議論すれば否定的な意見が多いとしても
本音を言えば面倒な事に巻き込まれるくらいなら、無難に消しといて欲しいって需要のが大きいってだけのことだと思うんですよ
Re:バカと暇人向け日本語入力という印象 (スコア:1, おもしろおかしい)
本当にそうなれたらどんだけ嬉しいことやら…。
なんというか (スコア:1, おもしろおかしい)
例えば「あくせられーた」の第1候補が「一方通行」なのはいかがなものかと。
(ベータのときはそこまでひどくなかったような…?)
Re:なんというか (スコア:2)
自分のGoogleIMEだと、
あくせられーた[変換]
あくせられーた(第1候補)
アクセラレータ(第2候補)
アクセラレーター(第3候補)
一方通行(第4候補)
ですよ?
あなたがアクセラレータ→一方通行 で変換して学習して一番目にさせているのでは?
Re:なんというか (スコア:1)
インストールして使ってみました。最初に変換する言葉が「あくせられーた」なのもどうかと思うけど。
結果、文字入力中にポップアップで出てくる変換候補はカタカナの奴ですが、スペース押した一発目は「一方通行」でした。
LIVE-GON(リベゴン)
Re:なんというか (スコア:1, 興味深い)
視線を大きく動かす必要があるでしょ?
その確認作業で一回思考が分断されてしまうのが嫌なんですよね。
変換精度が高いかどうかに関わらず、タイプミスがあるとボロボロになるし。
# Japanist2003を単文節変換に近い状態で使用中。
# 予測変換の候補に以前入力したかなり長い文章まで出てきてくれるので楽。
Re:なんというか (スコア:1)
>変換した直後に確認しなくても良いんです
世の中はそんなに便利になっていたのか!
変換してしまったらタイプミス修正さえ面倒な、ことえりとは大違いだな~。
the.ACount
Re:なんというか (スコア:1)
単語ごとにになんらかのタグがついてて、ビジネスモードとか、ホビーモードとか、
適当に優先順位を替えられれば良いんでしょうが。
Re: (スコア:0)
書いてたら、想像以上に思考が乱されるんですよね、あの手の言葉。
ツイッターや掲示板への書込みにはいいかもしれないが、今のままじゃ
常用は厳しいと思った次第。
誤字誤用の恐怖 (スコア:0)
便利そうだなあとは思っていますが、ビジネスユーズにはまだお金を出してATOKを使った方が良いのかなあという印象です。
#それでもたまにとんでもない誤変換をやらかしたりしますが (それは多分IMEのせいではなく自分のせい orz)
Re:誤字誤用の恐怖 (スコア:2, すばらしい洞察)
Re:誤字誤用の恐怖 (スコア:1)
ATOK=Google日本語入力>>>>>>>>>>>>>>>標準IME
文字入力速度の向上なら↑だから、乗り換えたほうが良いのは確実。
当て字の誤字誤用(というかスラング)が気になるけれど、ホントの誤用はまだ見つけたことがないレベル。
---------------------------- うちの猫は、ながぬこ
Re:誤字誤用の恐怖 (スコア:2, 興味深い)
標準IMEって何かによりますが、2ch的大げさな表現(不等号いくつ入れたかすら数えずにムキになってキーを叩いた感じ)のように思います。例えば「Microsoft Office IME 2010 はガチ [hatena.ne.jp]」にその道の専門家がコメントをつけていますが
とのことなので、ATOK > IME2010 > Googleくらいかと。
ではなぜMS-IME=バカという評価が根付いたかというと、過去のバージョンに想像を絶するほどひどいものがあったのが原因らしい(中国製だという噂 [live.com])。
「Microsoft Office IME 2010 はガチ」にもあるけど、マイクロソフトの基礎研究は世間でのイメージほどレベルは低くないばかりか、むしろかなり高い水準です。マイクロソフトはイメージでかなり損をしている感じ。
Re:誤字誤用の恐怖 (スコア:2)
> 件 18回 (一つ上のコメントへのコメント)
18回って???
Google日本語入力で"けん"→「件」 "くだん"→「件」 それぞれ一発で出るよ。
> 標準IMEって何かによりますが、2ch的大げさな表現(不等号いくつ入れたかすら数えずにムキになってキーを叩いた感じ)のように思いま> す。例えば「Microsoft Office IME 2010 はガチ」にその道の専門家がコメントをつけていますが
標準っていうんだからOSに最初からついてくるやつで、OSってこの話の流れでいうとWindowsだよね?
Microsoft Office IME 2010はMS-Officeに付いてくるやつでしょ。
んで、Vistaや7の最初からついてくるIMEは確かにアホ過ぎて話にならん。
そんなときGoogleIMEが無料で出てきてちゃんと使い物になる制度で変換してくれてるから手放せなくなりました。
GoogleIMEが出てこなかったらATOKもっと売れたんじゃないかと思います。
#バイドゥIMEってのがあったような?使ったことないけど。まだ元気なんだろうか?
Re:誤字誤用の恐怖 (スコア:1)
Windows XP に付いてた IM を使ってるけど、気にならなかったな~。
Mac の「ことえり」の経験が酷かったからなのかな?
the.ACount
Re: (スコア:0)
ただ、叩かれているほど酷くはないというのには同意
もっとも、自分の環境がずっとATOKなので
たまにMS-IMEを使う機会があっても
はなから「ATOKよりツカエナイのはしょうがあんめぇ」と
ハードルを下げて使っているからかもしれません
なので、高水準かどうかはそれこそ考えたことないな
Re: (スコア:0)
会社のIMEのVerが低いのでIME2010を知らないのだが、
カタカナ語は正確に変換してくれるの?
(MSは国語審議会のトンチキな日本語に賛同してしまったので7も買えないor買ったらリソース弄るしか無いの?)
いちいちコンピューターとかプリンターとか候補に出られたら破壊しかねないレベル
Re:誤字誤用の恐怖 (スコア:2, 参考になる)
MS-IME2010は、OfficeXP以降のライセンスを保持している方なら、だれでも無料で利用できます。
ダウンロードは以下のところから。
http://www.microsoft.com/downloads/details.aspx?displaylang=ja&Fam... [microsoft.com]
OfficeXP以降を持ってないならごめんなさい。
カタカナ辞書は、ちゃんとしてますよ。(コンピュータとかプリンタとか。← MS-IME2010で入力)
Re: (スコア:0)
Re:誤字誤用の恐怖 (スコア:1, 興味深い)
でも大量の既存の文章から辞書を作り出したってのが本質としてあるので、
自社の社内文書から辞書を生成すれば強力な業務向け辞書が出来ると思うのですよ。
ネットの雑多な文章から生成されたから少々カオスになってるだけで。
・・・というか辞書作成toolって公開されてるのかな。
#もっとも走らせるのにどれだけメモリが必要かわからんけど。
Re:誤字誤用の恐怖 (スコア:4, おもしろおかしい)
専務「新しい日本語入力システムです、最新のネット用語も辞書に入っていて便利ですよ」
社長「どれ、使ってみよう」
しゃち
1 社長氏ね
2 鯱
社長「けしからん!こんなもの使えん!」
専務「ネットは玉石混交ですからね…こちらに社内文書から作った辞書もありますよ」
社長「どれ、使ってみよう」
しゃち
1 社長死ね
2 社長まじ死ね
Re:誤字誤用の恐怖 (スコア:4, おもしろおかしい)
人生は七転び八起き、一日は早寝早起き
Re:誤字誤用の恐怖 (スコア:1)
google日本語入力ではないですが、
私が使ってるATOK2005には、AI辞書トレーナーという機能が付いていて、
ファイルやフォルダ、メールを指定すると、その文章から自動学習してくれるので、
PC乗り換えた一番最初に使うと少し楽することが出来て重宝してます。
答えはある。それを見つける能力が無いだけだ。
Re:誤字誤用の恐怖 (スコア:1)
ATOKで辞書の移行が出来ない分けじゃないんですよ。
というか、初めて鍛え直しをしたときに印象が良かったので、
ずっとこうしてたんです。
# 自分の行いに疑問を持たないのはいけない。
答えはある。それを見つける能力が無いだけだ。
Re: (スコア:0)
そうですよね
ことえりよりは賢いのとATOKより安定しているのでMacでは常用しているのですが
ネット上で使われる誤字が辞書に多くて、1日1回はぎょっとします
学習するほど馬鹿になる気がするのと簡単な言葉も変換できない場合があるので
レポートを後で上げようかと思っていると作業後には何だったか忘れるという繰り返しで
何も貢献出来ていないのですけれどね
文字ちいせぇ (スコア:0)
どうでもいいが、文字ちいせぇ。
どんな環境をターゲットにしたんだ…
Re:文字ちいせぇ (スコア:2)
IEでは見にくく、Google Chromeだと見やすいのかとおもったら
何も変わらなかったでござる
著作権はクリアしてるの? (スコア:0)
ネットから膨大な文書を集めて辞書を作るのは、著作権的に大丈夫なの?
Re: (スコア:0)
ここで辞書と言っているのは、国語辞典や英和・和英辞典のような人が読んで調べるためのものではありません。
ユーザーが入力したカナをコンピュータが漢字に変換する際に使うデータベースのようなものです。
ネットで収集した文がそのまま含まれているようなものではなく、沢山の文章を解析した後の、結果(文字の区切りとか前後に繋がりやすい語の種類とか)をまとめたものなので、元の著作権は影響しません。
書評を公開するのに元の本の著作権が影響しないのと一緒です。
Re: (スコア:0)
日本で検索サービスが行えない理由が、そういう目的のコピーも著作権侵害になったからです。
たとえば内部で使うための複製は許可すべきだ、なんて言うと、新聞を社内資料としてコピーすることまでも許可しちゃうことになる。
だから、検索サービスの内部処理など、用途を限定して許可する文言を、著作権法に入れ込もうとしてたと思いますが。
Re: (スコア:0)
著作権侵害は、親告罪で、検索なら結果表示に、検索サイトに複製
された著作物の一部が表示されたりと、訴え易いですが。
IMEの辞書作成のために、多数の文書の複製が作られた可能性があって
も、現実問題としては無問題でしょう。
法学的には、面白い課題だと思いますし、著作権法を改正する際には
明文化する必要があるとも思います。
このストーリの別の書き込みにある「アクセラレータ」を変換すると、
「一方通行」になったりが、もっと進んで、著者名を入れると、作品の
全文に変換されたりすると、アウトでしょうね。
(俳句くらいなら、既にあるかも)
同時公開? (スコア:0)
開発背景のコミックはずいぶん前から公開されていたと思いますが…。
タイトルも「Google 日本語入力 beta」 となっていますし、最後のページを見ると Copyright 2008 となっています。
キー配置は (スコア:0)