パスワードを忘れた? アカウント作成
42534 story
ソフトウェア

Office IME 2007、本当に賢くなった? 109

ストーリー by hylom
Made in Japan 部門より

あるAnonymous Coward 曰く、

ASCII.jpに、先日修正パッチが公開された「Office IME 2007」について、マイクロソフトへ取材を行った記事が掲載されている。

この記事では 2007で変換精度が悪化した理由について

  • IME 2007は変換エンジンが新開発されており、変換候補推測アルゴリズムや学習方式が変更された
  • 変換精度が悪くなったのは、新開発の変換エンジンのチューニング不足
  • 「IME 2007は中国製」というのはデマで、実際は日本で開発されている

などと解説されており、また先日公開された修正パッチがどのような修正を行うかも説明されている。ちなみに、IME 2007を効率よく「賢くさせる」ためには、入力や変換のミスを減らすことが効果的らしい。個人的には入力ミスや変換ミスがあっても意図した文字に変換させるのがあるべき姿だとは思うのだが……。

ちなみに自分はATOKを使っているのでよく分からないのだが、修正パッチでIME 2007は本当に賢くなったのでしょうか? 実際の利用者の感想求ム。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • 2007よりも (スコア:3, すばらしい洞察)

    by suzushiro (30819) on 2008年12月11日 14時32分 (#1471459)
    2003の方をどうにかしてくれないかねぇ。2007のUIを嫌って
    アップグレードを拒む抵抗勢力も多いし。
  • by Anonymous Coward on 2008年12月11日 12時00分 (#1471315)
    ImmGetConversionListで、漢字の読みを列挙できなくなってるんだけど、
    これ本当に日本人が作ってるの?
    • by Novikov (33090) on 2008年12月11日 12時29分 (#1471340)
      日本人が作ったからといってマトモとは限らない。
      親コメント
    • by Anonymous Coward on 2008年12月11日 12時08分 (#1471321)
      > 実際は日本で開発されている

      開発場所が日本だからといって,日本人が開発しているとは限らない。
      親コメント
      • by Anonymous Coward on 2008年12月11日 12時42分 (#1471356)

        しかも中国で開発されているというのが本当にデマなら

        http://furukawablog.spaces.live.com/blog/cns!156823E649BD3714!9079.entry [live.com]

        「MS IME最近どうなっているのよ?」と先週聞いた答えが...「IME開発の主体が、中国にシフトしまっていて我々も手を出せない......個人的にはATOKに切り替えようと思っている」

        これは嘘をついてまで修正を拒否したってことですよね。それじゃどこで開発していようがマトモになるはずないと思うのですが。

        親コメント
    • by Anonymous Coward on 2008年12月11日 13時24分 (#1471389)

      ImmGetConversionListで、漢字の読みを列挙できなくなってるんだけど、
      Vistaは以前から使えないらしいから、XPでということかしら?
      XPでも同じように動作するように変えちゃったのかね。

      これ本当に日本人が作ってるの?
      日本では広く使われているAPIのはずだから作ったのが日本人かどうかはしらないが
      日本でのこのAPIの使われ具合をしらない人間が作ったのはたしかだろうな。
      親コメント
  • 学習機能とは (スコア:1, すばらしい洞察)

    by Anonymous Coward on 2008年12月11日 11時31分 (#1471302)
    >IME 2007を効率よく「賢くさせる」ためには、入力や変換のミスを減らすことが効果的らしい。
    >個人的には入力ミスや変換ミスがあっても意図した文字に変換させるのがあるべき姿だとは思うのだが……。

    入力ミスかどうかというのは、結局機械で自動判別しきれないので
    その入力を学習してしまうのは仕方のないことだと思います。
    (もちろん学習の強弱はつけられるでしょうけど)
    入力ミスを減らすと効率よく学習できるという話と、
    ミスを許容して意図した結果に変換されるというのは決して相反する話ではなく
    両者並び立つ重要な機能ではないでしょうか。
    • ミスを許容して意図した結果に変換される
      例えば変換後0.5秒以内に確定された内容についてはあまり学習させないとか、ユーザーの手癖の傾向を探れば、まだまだできそうなことはあるように思います。
      (同じ単語を変換したときに誤変換データとして収集されるのは面白いアイデアだとは思いましたが)
      親コメント
      • Re:学習機能とは (スコア:2, すばらしい洞察)

        by Anonymous Coward on 2008年12月11日 12時31分 (#1471344)
        提案するのは自由だけど。
        その種の「下駄を履かせる」タイプの処理は、たいてい副作用のほうが大きくなるよ。
        学習アルゴリズムの肝は匙加減だから、過学習の弊害を常に考慮しないと。
        親コメント
    • 入力ミスかどうかというのは、結局機械で自動判別しきれないので
      変換確定後のキー入力(バックスペース)を学習結果に反映することは難しいかな?
      たとえばこのように誤返還した場合 - - - - BS BS 変換 のように修正すると
      「たとえばこのように誤変換した場合」を変換、修正した場合と同じ学習結果にするとか

      もちろん、変換確定する前に修正する習慣をつけるべきですが
      ソフトウェアでどうにかなるならソフトウェアに任せたいですね。

      # MS Office IME 2007 (おそらくパッチ無し) では
      # 何回修正しても御返還になってしまうような?
      親コメント
  • 産地偽装? (スコア:1, 興味深い)

    by Anonymous Coward on 2008年12月11日 12時14分 (#1471326)
    じゃぁこれにある発言は嘘ということ?
    http://furukawablog.spaces.live.com/Blog/cns!156823E649BD3714!9079.entry [live.com]

    >>同社インプット メソッド テクノロジー シニアマネージャの佐藤良治氏によると、IME 2007以前のプロトタイプ開発の際には、日本だけでなく米国レドモントと中国北京にあるMicrosoft Researchとの共同作業が行なわれたという。それが誤解して伝わっているようだ。
    プロトタイプの開発?試作品ってことだよね。
    製品版の開発はどこが?
    試作品だけが共同で、製品版は単独ということなのでしょうか。

    でもさ、試作品なるものがあるということは、機能の大部分はそこからもってきていると推測します。
    ということは鰻の産地偽装と同様の状態じゃないのか。
    大陸で殆ど完成させて、産地偽装のために日本で最終調整。

    所詮推測でしかないんだけどね。
    • Re:産地偽装? (スコア:1, すばらしい洞察)

      by Anonymous Coward on 2008年12月11日 12時49分 (#1471364)
      どうやっても批判に結び付けたいわけですね。

      根拠もなく、想像で産地偽装だという以外に、気の利いた
      批判は思いつきませんでしたか?

      親コメント
    • by numberR (34474) on 2008年12月11日 14時29分 (#1471451)
      ソフトウェアエンジニアリングにおけるプロトタイプは、
      仕様にある機能が実装出来る事を証明するためだけに使われるもので、
      プロトタイプを作る際にはコードの再利用性や性能は問いません。
      よって、プロトタイプのコードはその場しのぎのものが多いので、
      そのまま製品のコードになる事は少ないはずです。

      ちゃんとソフトウェアエンジニアリングが実践されていればの話ですが。
      親コメント
  • by Anonymous Coward on 2008年12月11日 12時23分 (#1471333)
    「まち」を変換すると、「既知」が候補にあがるのは誤変換?
    アップデートをかけてないPCだとこの現象は出ません。

    単に辞書がぶっ壊れているだけでしょうかねぇ。
    • by kicchy (4711) on 2008年12月11日 12時38分 (#1471349)
      >「まち」を変換すると、「既知」が候補にあがるのは誤変換?

      「きち」を激しく打ち間違ったという前提で入っているのでは?

      iPhone3Gのはじめの頃の変換候補を思い出しますね。
      親切すぎて、変換候補がふくれあがったり
      パフォーマンスが異常に悪くなる。
      はじめの頃は推測してくれたような候補も
      最近の版ではでないようになって推測の幅が減ってきていますね。
      こういう過度なエラー訂正のチューニングとかがIME2007にも施されれば
      賢くなったように見えてくるんじゃないですかね。

      まぁ、IME2007を使ったことがないので的外れなのかも知れませんが。

      # とはいえ、パフォーマンスを気にしなければiPhoneの推測は
      # 入力をサボれるから楽だったんだけどなぁ・・・
      # 「つ」の小文字や、濁点は省いても変換してくれて・・・
      親コメント
      • by Anonymous Coward on 2008年12月11日 12時45分 (#1471357)
        激しく打ち間違った可能性と、
        日本語に詳しくない人が「き」と「ま」を見まちがえた可能性は、
        どっこいどっこいな気がする。
        親コメント
        • いや、KICHIとMACHIあるいはGキーとJキーの入力間違いと見るのは
          むしろ厳しいんじゃないか?
          中国に限らないけど、アジアの菓子や花火にある誤植の例として

          あ・お・ゐ・す・む (ゐ願い)
          う・ら・る・ろ・ち・て・さ・ラ (どらかせん・ぐろぐろ)
          め・ぬ (じぬん)
          い・り・リ (くださり)
          だ・せ (くせさい)
          き・ま (なりきす)
          ア・マ (ファイマ)
          サ・タ・カ (タービス)
          ソ・ン・リ (アソパソマソ・ウレタソ)
          ク・ケ (シルケ)
          コ・ユ (ピカチコウ)
          テ・チ (チレビ)
          レ・し (ほレい)

          などが見受けられ、「ま・き]混同も頻繁に見られるので、やはり
          きち/まちの間違いは、変換よみ一覧を見ながら読めない人が字面
          で入力している後者の可能性が高いのでは。(中国とは限らずとも)

          さあ、OFFICE IMEをアップデートして、おもしろ誤植変換を見つけたら
          VOWに投稿だ!(古)
          --
          meme-meme
          -----------------------------
          kenny @ meme design
          -----------------------------
          親コメント
  • by Anonymous Coward on 2008年12月11日 12時49分 (#1471363)
    2chでATOKが絶賛されていたので、お試し版を一ヶ月ほど使ってみたけど、2chでチャット的に使ってる分にはmsのimeとの差が分からなかった。
    • by kaya (8814) on 2008年12月11日 13時40分 (#1471408)
      修正パッチ適用後はマシになってますよ

      と書こうとしたら、「修正パッチ的用語」とか出てきたので
      擁護するのを止めたくなった。

      修正パッチ適用前は

      デフォルトの変換候補がメチャクチャ

      正しく変換して確定

      次に同じ単語を入力するとき、デフォルトの第一候補が
      そのままで、勢いで間違えて確定。結果として、デフォルトの
      第一候補の確定回数が多くなるので、いつまで経っても順位が入れ替わらない。

      期待する単語が第一候補になっていても、別な助詞を使っていると
      デフォルトの第一候補が出てくる。
      勢いで(以下略)

      となって、とっても使いにくかった。
      とりあえず、その状況はだいぶ改善されたかな。

      元記事を読む限り、頭のなかで変換結果を予測しながら一定以上の速度で
      入力しようとするケースには不向きな仕様なんだと思う。
      親コメント
    • by tks256 (30608) on 2008年12月11日 15時55分 (#1471542)
      本当に1ヶ月使いました?

      私も、この3年くらい、ATOKを試しに入れては
      「IMEとかわんねーじゃん」と消してた人です。
      が、2chとかでの信者のせいで過剰な期待をして、
      入れたけど対して変わらないじゃん、で、1週間くらいで使わなくなくなってました。

      今回は1ヶ月使い込んで、しっかり自分の変換の癖を覚えさせたら、
      省入力や、単語訂正時の学習機能などのメリットが大きくなって、購入しましたが。

      過剰な期待を持ちすぎず、1ヶ月しっかり使ってみて、その後IMEに戻しても違和感が無いのであれば、
      無理にATOKにする必要も無いと思います。タダじゃないですし。
      親コメント
    • 「2ちゃん語」とされるモノは誤字脱字や MS IME による誤変換が起源ですからねぇ…
      正しい日本語に変換しようとする ATOK で、自分の意図した通りの入力で2ちゃんねるを楽しむなら、その差は体感できないかと。

      #もちろん私は ATOK に依存してるワケですが。
      --
      -+- 想像力を超え「創造力」をも凌駕する、それが『妄想力』!! -+-
      親コメント
    • by Anonymous Coward on 2008年12月11日 13時05分 (#1471376)
      「はてなダイアリーキーワード辞書」
      を入れて
      「予測変換」
      を常にONにすると・・・
      親コメント
  • Outlook連絡先辞書、Outlookグローバルアドレス一覧辞書を
    を参照して異様に重かったバグは、どうなったのですかネ?
    それが分かって以来、私は使ってないのですが・・・・・・・・・・
  • by shunjim (4488) on 2008年12月11日 14時57分 (#1471486) 日記
    下の弁明が正しいとして、評価もせずに出荷するのは、それ自体が間違っている。
    評価したなら、この結果で出荷するのは企業としてどうかと思う。

    >o IME 2007は変換エンジンが新開発されており、変換候補推測アルゴリズムや学習方式が変更された
    >o 変換精度が悪くなったのは、新開発の変換エンジンのチューニング不足
    >o 「IME 2007は中国製」というのはデマで、実際は日本で開発されている

    IME2002からATOK2006に切り替えたのですが、IMEを使ってた頃は誤変換があまりにも多くて本当に疲れた。それでも間違うし・・・。
    IMEでは、Shift一回で半角英文字にする機能が非常に重宝したのですが、ATOKでも実装して欲しい所です。
  • MS だからぁ (スコア:1, 興味深い)

    by Anonymous Coward on 2008年12月11日 16時50分 (#1471585)
    どこで作っているかは別にして、修正版を出したということは不備があったことを認めたわけで。
    不具合入りを出荷してしまった。ということが最大の問題なんだと思うがどうか。

    日本に責任者がいるなら、なおのこと品質管理ができてない。ということでしょうね

    ある版の VisualStudio は MSIME の特定の版(XP 付属)と一緒だとデバッグ対象アプリケーションが終了できない。
    というバグがあって、ということは日本語環境ではテストしていなかったのかな。というのも今は昔の話。
    • 元中の人 (スコア:3, 興味深い)

      by Anonymous Coward on 2008年12月11日 17時25分 (#1471612)
      >ある版の VisualStudio は MSIME の特定の版(XP 付属)と一緒だとデバッグ対象アプリケーションが終了できない。

      それは黒歴史となっていますからそっとしておいてください。
      R&D は IME をインストールしていなかったし、社内 QA /社外テスターは全員 MS Office または ATOK 等を入れていたため
      気づけなかったのでしゅ
      親コメント
  • 「たたり」の変換候補から「崇り」は消えたのかい?
    「かじ」の変換候補から「鍛治」や「鍜冶」は消えたのかい?

    中国人かどうかはともかく、日本語に不自由な人間を開発に入れるなって言いたい。
    よって漢直最強。
    --
    言葉に貴賎なし、辞書に聖杯なし
typodupeerror

UNIXはシンプルである。必要なのはそのシンプルさを理解する素質だけである -- Dennis Ritchie

読み込み中...