パスワードを忘れた? アカウント作成
170862 story
Google

Googleが「Google 日本語入力」ベータ版を公開 236

ストーリー by mhatta
いたく感心しました 部門より

Googleが日本語入力インプットメソッド「Google 日本語入力」を開発し、ベータ版の公開を開始した(ダウンロードページ)。ウェブ上の大量のデータからMapReduceを駆使して辞書や統計的言語モデルを構築という、いかにもGoogleらしい手法での実装となっている。タレコミ子がWindows Vista上で試用してみたところ、ややレスポンスは鈍いものの、長文の一括変換や文節の切り分けに関してはMS-IMEを歯牙にもかけず、ATOK 2008にも肉薄か場合によっては上回るほどの変換効率を誇っているようだ。なおGoogle Japan Blogのエントリでは、このGoogle IMEがいわゆる「20%ルール」から生まれたことなど興味深い内幕が明かされている。

現時点ではWindows版(32bitのみ)とMac版のみの公開だが、風の噂ではLinux版の開発にも着手しているとかいないとか。GoogleがIMEを出すというのはやや意外な感じもあるが、AndroidやChrome OSへの布石、競合他社への影響など、今後の展開に目が離せなくなりそうだ。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • ターゲット (スコア:5, すばらしい洞察)

    by ramsy (8353) on 2009年12月03日 11時42分 (#1682584) ホームページ 日記
    Windows版なんてとりあえず動く程度で本腰入れなくていいんじゃないかなぁ。選択肢はまだ十分にあるし。
    Unix系OSに(Linux,Mac OS X)に注力して欲しい。AndroidやChrome OSの事を考えると特に。
    それと、技術的に出来るかどうかは微妙だけどiPhoneのオンスクリーンキーボードを丸ごと入れ替えるタイプが欲しい…
    アルファベットと日本語が入り交じる文章打つのめんどくさいんだもの。
    --
    # rm -rf ./.
  • 使ってみた (スコア:3, 参考になる)

    by oguma (17986) on 2009年12月03日 14時17分 (#1682743)

    ローマ字入力では「ゐ」も「ゑ」も「くゎ」も入力できない。
    四段活用動詞が登録できない。
    片仮名入力への変更がキーアサインできない。マウスで一々クリックしないといけない。

    人文科学の人は使うなということですね、わかります。

    --
    Nullius addictus iurare in verba magistri
  • 日本語の衰退 (スコア:2, すばらしい洞察)

    by Anonymous Coward on 2009年12月03日 11時38分 (#1682580)
    WWWには、筆者の不注意や無知、IMEの語彙の不足、冗談のための意図的なものなどさまざまな誤変換が見られます。
    それをIMEが変換候補に挙げるようになったら、間違った言葉が平気で使われるようになり、言葉の意味の変化がどんどん速まってしまいますね。
    • by Anonymous Coward on 2009年12月03日 13時35分 (#1682714)

      まぁ、実際2ちゃん語?みたいなのは強いみたいですな。

      「いいはな」って入力するだけで候補には「イイハナシダナー」が出るし。
      「逝って良し」なんて「いって」でオッケー。
      「本当に」って入力するだけで「本当にありがとうございました」が出てくる。
      こりゃ便利だわ。そのうち「【神】Google日本語入力【変換】」とかいうスレも
      立ちそうですな。

      親コメント
    • Re:日本語の衰退 (スコア:2, おもしろおかしい)

      by Anonymous Coward on 2009年12月03日 11時53分 (#1682592)

      少なくともGoogleサジェストを見る限り、第一候補が「無線LAN内臓」になりそうな気がする。

      親コメント
    • やまとのことば、あやうきとほもいけるなら、やまとのことばをつかいませう。

      親コメント
      • by tmiura (6268) on 2009年12月03日 14時41分 (#1682762) 日記

        あやうきとほもいけるなら、

        もしかして: おもひける

        親コメント
        • ご指摘ありがとうございます;;大和言葉と中古と旧かな遣いが混じってむちゃくちゃですね。

          >> 情けないことに、私の世代の多くは戦前の文章をまともに読めないのですよ。高々50-60年前のものを。

          うーん。昭和初期でも芥川龍之介や太宰治は小学校の教科書に載ってますし、
          明治文学の夏目漱石ですらです。まともに読めないんですか?

          親コメント
  • by Anonymous Coward on 2009年12月03日 11時42分 (#1682585)
    ライセンス条項をリサイズ不能な小さなボックスに閉じ込めて、ひたすらスクロールしなきゃ読めないようにするってのは珍しくも何ともないが、横スクロールまで要求するとは、さすが google 一味違うぜ。右クリ禁止を実装しなかった良心だけはほめてやろう。
  • Googleが「変換したい候補」を一方的に与えてくれる訳じゃなく、「確定する言葉、またそのコンテキスト」をどう使うかと言う事まで、ちゃんと考えておくべき。電子書籍やメールやストリートビューに次ぐ、新たなGoogleの脅威だと思うがね…。
  • ON/OFFのキー設定 (スコア:2, 参考になる)

    by kenzillow (37517) on 2009年12月03日 14時43分 (#1682763) ホームページ

    Google日本語入力のOn/OffをShift + Spaceにしたいと思っていたのですが、プロパティにあるキー設定からは変えられないようです。
    設定をエクスポートしてみると、以下のようにON/OFFらしき項目が末尾に記載されていますので編集してみようと思いましたが、トグル動作用の設定方法がわかりません。

    Conversion OFF IMEOff
    Conversion ON IMEOn
    DirectInput Henkan IMEOn
    DirectInput ON IMEOn
    Precomposition Ctrl Alt F11 Abort
    Precomposition OFF IMEOff
    Precomposition ON IMEOn
    Composition Ctrl Alt F11 Abort
    Composition OFF IMEOff
    Composition ON IMEOn

    とりあえず今はToggleAlphanumericModeを割り当てて使っていますが、ちょっと不便です。

    --
    運転手は運転がお仕事。笑うのはブギーポップにはできない僕らのお仕事。
  • by mtgood (31646) on 2009年12月03日 17時47分 (#1682899)

    日本語入力できるのうれしい。
    ATOKは挙動不審なんだよなー。

  • by monaka (4489) on 2009年12月03日 11時38分 (#1682582)

    GoogleがIMEを出すというのはやや意外な感じもあるが

    IMEってのは,仮名から漢字を検索するツールだよね.

    # ことえりを捨てることができて小躍りしているID

    --
    from もなか
  • by scavenger (21990) on 2009年12月03日 12時07分 (#1682613)

    20%でこういうことを始められないとgoogleではやっていけない、ってことかも。

    だからこそ、そのあとも出来る人たちが集められる環境なんだろうなぁ。

  • 予測変換機能を実装→「夫と入力すると・・・ [livedoor.jp]」とか。

    そこまで行かなくても、仕事に使うにはちょっと暴発が怖いかな。MSIMEを使ってても、ふと気づくとtypoと誤変換のコンボで書類に飛んでもない単語を書き込んでたりするし。 それ以上にまだ見ぬだじゃれを生み出してくれそうで。

    99%は上手く行くから残りの1%は知らん、もしくは、99%を99.9%にする努力ならあり得るけど個別の事例には対応しない、みたいな割り切り方がgoogleの競争力だと思うので。ATOKだとしばしば見られる「ある種の言い回しの変換でいつもつまづく」という評判→「次のバージョンでその手の言い回しを適切に扱えるアルゴリズムを追加」、みたいな対応はgoogleはやってくれなさそうなイメージ。
typodupeerror

コンピュータは旧約聖書の神に似ている、規則は多く、慈悲は無い -- Joseph Campbell

読み込み中...