パスワードを忘れた? アカウント作成
290145 story
Google

Google日本語入力、正式サービスへ。そして開発秘話コミックも公開中 100

ストーリー by reo
開発者の顔が見えるのは素晴らしい 部門より

ikotom 曰く、

ご存じの方も多いと思うが昨年 12 月 16 日にGoogle 日本語入力がベータ版から卒業し正式サービスとなった。今までタレコミが無かったあたり、タレコミ人と同じく世間的にも正式版とベータ版の違いなど興味がないのだろう。もし機能を知りたければ窓の杜の記事などをご覧になられたし。

むしろ個人的に一読をお勧めしたいのが、同時公開中の開発背景を紹介しているコミックである。オッサン開発者達がアメコミとも何とも言えぬ絵柄で「辞書ファイルが無い」「Webか らリアルタイム取得しない」といった特徴や DLL 分割のポイントなどを解説しており、技術者ならずとも興味深い話題が満載である。マルチプラットフォームが目標であることも明言されており、現在 Mozc としてオープンソース化されているコア部分に各種 UI を加えた、待望の Linux 版到来も間近と期待してよさそうだ。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by Anonymous Coward on 2011年01月14日 15時18分 (#1887928)

    ATOKで「小人」が変換できないのでイラっとしてたらこういう理由があるらしい。

    http://www.justsystems.com/jp/tech/atok/dic/faq/03.html [justsystems.com]

    そうしたことばを変換辞書に収録することにより、故意ではなくても無意識のうちに、あるいは誤変換の形で文書中に挿入されてしまう、という可能性がでてきます。
    そのような場合、たとえ本人にその気がなくても、結果的にあることばが他者に対し不快感を与えたり、また思わぬところで、差別意識を助長する結果にならない、とは誰にも保証できません。

    また、一度、文章となってしまうと、もともとどのような意図でその単語を使ったかは、伝達が進めば進むほど不明確になります。インターネットによって、即時に多数の人に情報を伝達できる現在ではなおさらです。

    ATOK監修委員会は、この種の言葉を収録するか否かをめぐって、さまざまな角度から長期にわたり、検討した結果、社会のあるべき人権意識に立脚し、現時点では、原則として収録しない方針を採用しています。

    それはお前らIME屋の仕事じゃねえよジャストシステム。

    俺が何を書くかは俺が決める。
    俺の意図が伝わらなかったらそれは全部俺が悪い。
    俺が書いた文章の責任は全部俺が取る。

    それをIME屋が勝手にしゃしゃり出て責任被ろうとすんじゃねえ。
    使用者にNewspeak [wikipedia.org]を強要すんな。

    …というわけでGoogle日本語入力に乗り換えてみようかな。

    「気狂いピエロのフェルディナンかよ!」
    とか
    「お前らはまるで白痴だな!」
    みたいな侮蔑表現がちゃんとできる?

    • 他人任せにした時点で君の負け。geekなら漢直だろ!
      # とかいうわたしはskkユーザ

      親コメント
    • by Anonymous Coward on 2011年01月14日 19時14分 (#1888052)

      >「気狂いピエロのフェルディナンかよ!」
      >とか
      >「お前らはまるで白痴だな!」

      器具委ピエロのフェルディナンかよ
      お前らは○では口だな

      となりました on ATOK2010

      親コメント
    • 一方Google日本語入力は… (スコア:1, おもしろおかしい)

      by Anonymous Coward on 2011年01月14日 21時03分 (#1888107)

      あうあうあー → (^p^)あうあうあー

      親コメント
    • by Anonymous Coward
      オプションとして差別語辞書を用意すれば・・・
      • 差別語に限らず弾いた単語をオプション辞書で追加させて欲しいですね。
        ダウンロードに際してはかなりの注意書きをして、変換候補に強く警告を出すような感じで。
        ラーメンのひとつの言い回しですら別けて変換する必要があるというのは面倒です。
        具体的にその単語が必要と云うことではなく無意識に挿入されるのとは逆に
        無意識に変換されることを期待してされない時の思考の中断が煩わしい。
        変換できてそれが一般的に不適切な言葉かどうかをジャストシステムの基準で教えてくれる方がよっぽどありがたい。

        更に云えばオプション辞書セットにすればATOKは設定を使い分けることができるので公私で使い分けることもできる。
        gIMEは辞書に学習させないモードしかなかったのでそのままなら公私でエキセントリックな変換を辞書から除外するといったことはできないかも。

        # でも除外語辞書を公開したら「なんでこれが差別用語なんだ!」ってのがあるかも知れないのも事実ー

        親コメント
    • by Anonymous Coward
      単語登録機能はこういう場合に使うものだと思う。
  •  利用規約より。

    本コンテンツを提出、掲示または表示することにより、ユーザーが本サービス上や本サービスを通じて提出、掲示または表示する本コンテンツを、再生、翻案、修正、翻訳、公開、公衆実演、公衆展示、および配布するための無期限、取消不可で、全世界で適用され、ロイヤルティ無料の、かつ非独占的なライセンスを Google に提供していただきます。

     なおかつそれに続けて

    このライセンスは、Google が本サービスを表示、配布およびプロモーションすることをできるようにすることを唯一の目的としており、本サービスの追加条項に定義する一部の本サービスについては撤回される場合があります。

    とありますが、Google 日本語入力についてこの「追加条項」が存在しないことから、この権利を撤回しないというGoogleの意思が明確に表明されていると考えることもできます。ちなみに、Google Chromeの利用規約ではこの条項は削除されています。
     たとえGoogle 日本語入力自体にその文章をGoogleに送信する機能がついていなくても、Googleが利用権を取得することに変わりはありません。
     以上から、少なくとも企業での使用はお勧めできませんね。特に、守秘義務や特許がらみの部署での使用は危険です。

  • by Anonymous Coward on 2011年01月14日 16時50分 (#1887977)

    「薄毛」を変換しようしたら、「もしかして: 禿」と小さな親切余計なお世話の変換候補を表示してくれそうな予感。

  • Google日本語入力のAndroid版を切に希望します。
    できればGoogleアカウントと紐づいた辞書同期も。
    10ドルくらいなら喜んで払います。
    Google Pinyinだと辞書同期もあるんだよなぁ。

    The Android Pinyin IME supports user dictionary synchronization with the desktop version.Google Pinyin [wikipedia.org]

    --
    屍体メモ [windy.cx]
  • 売りのサジェストがウェブから単語拾ってるせいで数は多いんだが
    【パンツ】→【パンツじゃないから恥ずかしくないもん】
    みたいな思わず吹き出す単語が多くて真面目な用途の時は使いにくい印象

    オタ的にも笑ってしまって思考が遮られるけど
    一般人なら更にギョッとするんじゃないかな

    サブカルの辞書がわり使うなら、本当にいい感じなんだけどね
    邪王炎殺黒龍波とかATOKじゃ変換する気にもなれんもんな。

    なんかGoogle日本語入力使ってると
    ウェブはバカと暇人のものという説は正しいんだろうなとしみじみ思えて哀しくなってくる
    勿論自分もそんな馬鹿な暇人の1人なんですけどw
    • by Anonymous Coward on 2011年01月14日 21時40分 (#1888125)

      オタク語を気にする人は実はオタクだけで、一般人はそれほど気にしないですね。
      変換語をみていちいち顔をしかめたり気にしたりする人はオタクしかいないといっても過言ではありません。
      ビジネス的な場所では特にそう感じます。

      取引先の営業氏がGoogle日本語入力使っていますが、重役を呼んでいても構わずプロジェクター越しにオタク変換をやらかしてくれますので、社内の隠れオタクをあぶりだすのに重宝しています。

      親コメント
      • >オタク語を気にする人は実はオタクだけで、一般人はそれほど気にしないですね。
        ギャルゲ風の萌え絵も気にするのはオタだけらしいし(一般人的には可愛い絵くらいの認識の人が多いらしい)
        それはそうなんだろうとは思うんだけど、なんか割り切れん物を感じるんだよね。要するに自分がオタだからなんだろうけど

        ただ人が気にするしないは別としてネットスラングが混入しやすいってのはそれだけで仕事への使用を躊躇する人多いと思うよ
        ちょうど別トピで話題になってるけど、言葉狩りだなんだいわれてもATOKが差別語削ってるのも
        そのことの是非を議論すれば否定的な意見が多いとしても
        本音を言えば面倒な事に巻き込まれるくらいなら、無難に消しといて欲しいって需要のが大きいってだけのことだと思うんですよ
        親コメント
  • なんというか (スコア:1, おもしろおかしい)

    by Anonymous Coward on 2011年01月14日 12時51分 (#1887831)
    ちょくちょくオタクっぽい変換がでてきて正直微妙。
    例えば「あくせられーた」の第1候補が「一方通行」なのはいかがなものかと。
    (ベータのときはそこまでひどくなかったような…?)
    • by sumeshi0206 (12305) on 2011年01月14日 16時22分 (#1887959) 日記

      自分のGoogleIMEだと、

      あくせられーた[変換]
      あくせられーた(第1候補)
      アクセラレータ(第2候補)
      アクセラレーター(第3候補)
      一方通行(第4候補)

      ですよ?
      あなたがアクセラレータ→一方通行 で変換して学習して一番目にさせているのでは?

      親コメント
    • by ken2 (27347) on 2011年01月14日 13時53分 (#1887880)
      そのへんはユーザーがどうこう出来ませんからね。
      単語ごとにになんらかのタグがついてて、ビジネスモードとか、ホビーモードとか、
      適当に優先順位を替えられれば良いんでしょうが。
      親コメント
    • by Anonymous Coward
      面白いから自宅で使ってたんですが、持ち帰り仕事でちょっとした文章
      書いてたら、想像以上に思考が乱されるんですよね、あの手の言葉。

      ツイッターや掲示板への書込みにはいいかもしれないが、今のままじゃ
      常用は厳しいと思った次第。
  • by Anonymous Coward on 2011年01月14日 12時38分 (#1887821)
    誤字誤用がこわくて、まだ移行できません。
    便利そうだなあとは思っていますが、ビジネスユーズにはまだお金を出してATOKを使った方が良いのかなあという印象です。

    #それでもたまにとんでもない誤変換をやらかしたりしますが (それは多分IMEのせいではなく自分のせい orz)
    • Re:誤字誤用の恐怖 (スコア:2, すばらしい洞察)

      by Anonymous Coward on 2011年01月14日 13時16分 (#1887855)
      ビジネスユーズって誤字誤用の類いじゃないの?
      親コメント
    • by inouek (31502) on 2011年01月14日 13時01分 (#1887843)

      ATOK=Google日本語入力>>>>>>>>>>>>>>>標準IME

      文字入力速度の向上なら↑だから、乗り換えたほうが良いのは確実。

      当て字の誤字誤用(というかスラング)が気になるけれど、ホントの誤用はまだ見つけたことがないレベル。

      --
      ---------------------------- うちの猫は、ながぬこ
      親コメント
      • by Anonymous Coward on 2011年01月14日 13時43分 (#1887874)

        ATOK=Google日本語入力>>>>>>>>>>>>>>>標準IME

        標準IMEって何かによりますが、2ch的大げさな表現(不等号いくつ入れたかすら数えずにムキになってキーを叩いた感じ)のように思います。例えば「Microsoft Office IME 2010 はガチ [hatena.ne.jp]」にその道の専門家がコメントをつけていますが

        Google日本語入力は固有名詞に強いが、複数文節での変換精度ではMS-IME2010やATOK2009に劣る
        MS-IME2010は素の変換精度としてはATOK並みのレベルまで到達しているように思える
        ATOK2009は変換精度こそMS-IME2010に並びかけられているが、誤入力の補正や誤変換の指摘機能などで一歩抜きんでている

        とのことなので、ATOK > IME2010 > Googleくらいかと。

        ではなぜMS-IME=バカという評価が根付いたかというと、過去のバージョンに想像を絶するほどひどいものがあったのが原因らしい(中国製だという噂 [live.com])。

        「Microsoft Office IME 2010 はガチ」にもあるけど、マイクロソフトの基礎研究は世間でのイメージほどレベルは低くないばかりか、むしろかなり高い水準です。マイクロソフトはイメージでかなり損をしている感じ。

        親コメント
        • > 件 18回 (一つ上のコメントへのコメント)
          18回って???
          Google日本語入力で"けん"→「件」 "くだん"→「件」 それぞれ一発で出るよ。

          > 標準IMEって何かによりますが、2ch的大げさな表現(不等号いくつ入れたかすら数えずにムキになってキーを叩いた感じ)のように思いま> す。例えば「Microsoft Office IME 2010 はガチ」にその道の専門家がコメントをつけていますが

          標準っていうんだからOSに最初からついてくるやつで、OSってこの話の流れでいうとWindowsだよね?
          Microsoft Office IME 2010はMS-Officeに付いてくるやつでしょ。
          んで、Vistaや7の最初からついてくるIMEは確かにアホ過ぎて話にならん。
          そんなときGoogleIMEが無料で出てきてちゃんと使い物になる制度で変換してくれてるから手放せなくなりました。
          GoogleIMEが出てこなかったらATOKもっと売れたんじゃないかと思います。

          #バイドゥIMEってのがあったような?使ったことないけど。まだ元気なんだろうか?

          親コメント
        • by Anonymous Coward
          「MS-IME=バカという評価が根付いた」のはもっともっと前のような気が……

          ただ、叩かれているほど酷くはないというのには同意

          もっとも、自分の環境がずっとATOKなので
          たまにMS-IMEを使う機会があっても
          はなから「ATOKよりツカエナイのはしょうがあんめぇ」と
          ハードルを下げて使っているからかもしれません

          なので、高水準かどうかはそれこそ考えたことないな
        • by Anonymous Coward

          会社のIMEのVerが低いのでIME2010を知らないのだが、

          カタカナ語は正確に変換してくれるの?

          (MSは国語審議会のトンチキな日本語に賛同してしまったので7も買えないor買ったらリソース弄るしか無いの?)

          いちいちコンピューターとかプリンターとか候補に出られたら破壊しかねないレベル

      • by Anonymous Coward
        誤用は確かに見当たらないね。 個人的にはATOKの方がまだ上です。 なぜなら、各個人が頻繁に利用する漢字の並び替えはしてくれないっぽい。 例えば、「件」という文字を出す場合、18回スペースバーを「毎回」叩かなければでてこない。 個人的には、それ以外はなんの問題はない。 ATOK>Google日本語入力>>>>>>>>>>>>>>>>>>>>>>>>MS IME>松茸>カンナ
    • by Anonymous Coward on 2011年01月14日 13時13分 (#1887854)
      google日本語入力はビジネスには向いてないって話はよく聞きますね。

      でも大量の既存の文章から辞書を作り出したってのが本質としてあるので、
      自社の社内文書から辞書を生成すれば強力な業務向け辞書が出来ると思うのですよ。
      ネットの雑多な文章から生成されたから少々カオスになってるだけで。

      ・・・というか辞書作成toolって公開されてるのかな。

      #もっとも走らせるのにどれだけメモリが必要かわからんけど。
      親コメント
      • Re:誤字誤用の恐怖 (スコア:4, おもしろおかしい)

        by Anonymous Coward on 2011年01月14日 13時55分 (#1887884)

        専務「新しい日本語入力システムです、最新のネット用語も辞書に入っていて便利ですよ」
        社長「どれ、使ってみよう」

        しゃち
        1 社長氏ね
        2 鯱

        社長「けしからん!こんなもの使えん!」
        専務「ネットは玉石混交ですからね…こちらに社内文書から作った辞書もありますよ」
        社長「どれ、使ってみよう」

        しゃち
        1 社長死ね
        2 社長まじ死ね

        親コメント
      • by colorless (35494) on 2011年01月14日 16時13分 (#1887955) 日記

        google日本語入力ではないですが、
        私が使ってるATOK2005には、AI辞書トレーナーという機能が付いていて、
        ファイルやフォルダ、メールを指定すると、その文章から自動学習してくれるので、
        PC乗り換えた一番最初に使うと少し楽することが出来て重宝してます。

        --
        答えはある。それを見つける能力が無いだけだ。
        親コメント
    • by Anonymous Coward

      そうですよね
      ことえりよりは賢いのとATOKより安定しているのでMacでは常用しているのですが
      ネット上で使われる誤字が辞書に多くて、1日1回はぎょっとします
      学習するほど馬鹿になる気がするのと簡単な言葉も変換できない場合があるので
      レポートを後で上げようかと思っていると作業後には何だったか忘れるという繰り返しで
      何も貢献出来ていないのですけれどね

  • by Anonymous Coward on 2011年01月14日 12時52分 (#1887832)

    どうでもいいが、文字ちいせぇ。
    どんな環境をターゲットにしたんだ…

  • by Anonymous Coward on 2011年01月14日 13時28分 (#1887866)
    Web検索サービスを国内で合法化するための著作権の改正は行われたんでしたっけ?
    ネットから膨大な文書を集めて辞書を作るのは、著作権的に大丈夫なの?
    • by Anonymous Coward

      ここで辞書と言っているのは、国語辞典や英和・和英辞典のような人が読んで調べるためのものではありません。
      ユーザーが入力したカナをコンピュータが漢字に変換する際に使うデータベースのようなものです。
      ネットで収集した文がそのまま含まれているようなものではなく、沢山の文章を解析した後の、結果(文字の区切りとか前後に繋がりやすい語の種類とか)をまとめたものなので、元の著作権は影響しません。
      書評を公開するのに元の本の著作権が影響しないのと一緒です。

      • by Anonymous Coward
        ネットにある文書を解析するためにはローカルにコピー・保存したりするでしょ。
        日本で検索サービスが行えない理由が、そういう目的のコピーも著作権侵害になったからです。

        たとえば内部で使うための複製は許可すべきだ、なんて言うと、新聞を社内資料としてコピーすることまでも許可しちゃうことになる。
        だから、検索サービスの内部処理など、用途を限定して許可する文言を、著作権法に入れ込もうとしてたと思いますが。
        • by Anonymous Coward
          別ACです。

          著作権侵害は、親告罪で、検索なら結果表示に、検索サイトに複製
          された著作物の一部が表示されたりと、訴え易いですが。

          IMEの辞書作成のために、多数の文書の複製が作られた可能性があって
          も、現実問題としては無問題でしょう。

          法学的には、面白い課題だと思いますし、著作権法を改正する際には
          明文化する必要があるとも思います。

          このストーリの別の書き込みにある「アクセラレータ」を変換すると、
          「一方通行」になったりが、もっと進んで、著者名を入れると、作品の
          全文に変換されたりすると、アウトでしょうね。
          (俳句くらいなら、既にあるかも)
  • by Anonymous Coward on 2011年01月14日 13時29分 (#1887867)

    開発背景のコミックはずいぶん前から公開されていたと思いますが…。
    タイトルも「Google 日本語入力 beta」 となっていますし、最後のページを見ると Copyright 2008 となっています。

  • by Anonymous Coward on 2011年01月14日 14時07分 (#1887893)
    かな入力でカスタマイズできる項目が少ないのでJapanistから他になかなか移行できないんですよね。 いろんなのが出てくる毎に試してはいるんですが。 他のIMEはかな入力なんてどうでもいいんだろうか。
typodupeerror

未知のハックに一心不乱に取り組んだ結果、私は自然の法則を変えてしまった -- あるハッカー

読み込み中...