![ソフトウェア ソフトウェア](https://srad.jp/static/topics/software_64.png)
Office IME 2007、本当に賢くなった? 109
ストーリー by hylom
Made in Japan 部門より
Made in Japan 部門より
あるAnonymous Coward 曰く、
ASCII.jpに、先日修正パッチが公開された「Office IME 2007」について、マイクロソフトへ取材を行った記事が掲載されている。
この記事では 2007で変換精度が悪化した理由について
- IME 2007は変換エンジンが新開発されており、変換候補推測アルゴリズムや学習方式が変更された
- 変換精度が悪くなったのは、新開発の変換エンジンのチューニング不足
- 「IME 2007は中国製」というのはデマで、実際は日本で開発されている
などと解説されており、また先日公開された修正パッチがどのような修正を行うかも説明されている。ちなみに、IME 2007を効率よく「賢くさせる」ためには、入力や変換のミスを減らすことが効果的らしい。個人的には入力ミスや変換ミスがあっても意図した文字に変換させるのがあるべき姿だとは思うのだが……。
ちなみに自分はATOKを使っているのでよく分からないのだが、修正パッチでIME 2007は本当に賢くなったのでしょうか? 実際の利用者の感想求ム。
2007よりも (スコア:3, すばらしい洞察)
アップグレードを拒む抵抗勢力も多いし。
ImmGetConversionListのバグ (スコア:2, 興味深い)
これ本当に日本人が作ってるの?
Re:ImmGetConversionListのバグ (スコア:5, すばらしい洞察)
Re:ImmGetConversionListのバグ (スコア:2, おもしろおかしい)
# こないだは「炙り」(あぶり)が出てこなくてどうしようか悩んだ。そういえば「團」(だん)も出なかったな。
マラソンで二位を抜いたら何位?
Re:ImmGetConversionListのバグ (スコア:2, すばらしい洞察)
開発場所が日本だからといって,日本人が開発しているとは限らない。
Re:ImmGetConversionListのバグ (スコア:2, 興味深い)
しかも中国で開発されているというのが本当にデマなら
http://furukawablog.spaces.live.com/blog/cns!156823E649BD3714!9079.entry [live.com]
これは嘘をついてまで修正を拒否したってことですよね。それじゃどこで開発していようがマトモになるはずないと思うのですが。
Re:ImmGetConversionListのバグ (スコア:1)
古川氏の blog は、他の人の blog 等で総ツッコミされてる訳ですが。
真に受ける方がどうかしているレベルのものですよ。リンク元も含めて。
Re:ImmGetConversionListのバグ (スコア:2, すばらしい洞察)
噂というのは真実かどうかより、もっともらしく聞こえるかどうかで流布するもの。
「日本人が作っていないIME」という話に「ああ!やっぱりねぇ!」と納得して頷く人が
いかに多かったか、そういうクォリティレベルの製品だということだろう。
Re:ImmGetConversionListのバグ (スコア:1, 興味深い)
XPでも同じように動作するように変えちゃったのかね。
日本では広く使われているAPIのはずだから作ったのが日本人かどうかはしらないが
日本でのこのAPIの使われ具合をしらない人間が作ったのはたしかだろうな。
学習機能とは (スコア:1, すばらしい洞察)
>個人的には入力ミスや変換ミスがあっても意図した文字に変換させるのがあるべき姿だとは思うのだが……。
入力ミスかどうかというのは、結局機械で自動判別しきれないので
その入力を学習してしまうのは仕方のないことだと思います。
(もちろん学習の強弱はつけられるでしょうけど)
入力ミスを減らすと効率よく学習できるという話と、
ミスを許容して意図した結果に変換されるというのは決して相反する話ではなく
両者並び立つ重要な機能ではないでしょうか。
Re:学習機能とは (スコア:1)
(同じ単語を変換したときに誤変換データとして収集されるのは面白いアイデアだとは思いましたが)
Re:学習機能とは (スコア:2, すばらしい洞察)
その種の「下駄を履かせる」タイプの処理は、たいてい副作用のほうが大きくなるよ。
学習アルゴリズムの肝は匙加減だから、過学習の弊害を常に考慮しないと。
Re:学習機能とは (スコア:3, すばらしい洞察)
Re:学習機能とは (スコア:1)
たとえばこのように誤返還した場合 - - - - BS BS 変換 のように修正すると
「たとえばこのように誤変換した場合」を変換、修正した場合と同じ学習結果にするとか
もちろん、変換確定する前に修正する習慣をつけるべきですが
ソフトウェアでどうにかなるならソフトウェアに任せたいですね。
# MS Office IME 2007 (おそらくパッチ無し) では
# 何回修正しても御返還になってしまうような?
Re:学習機能とは (スコア:3, 参考になる)
気のせいではないです。
私もATOK使いなのでIME 2007のことについてはよく知らないのですが、少なくともATOK 2005(あたりだったかな・・・?うろ覚え)以降では、訂正学習機能があってBackspaceで訂正した内容から学習してくれます。
コレは結構重宝していたりします。
http://support.justsystems.com/faq/1032/app/servlet/qadoc?QID=041193 [justsystems.com]
Re:学習機能とは (スコア:3, 参考になる)
産地偽装? (スコア:1, 興味深い)
http://furukawablog.spaces.live.com/Blog/cns!156823E649BD3714!9079.entry [live.com]
>>同社インプット メソッド テクノロジー シニアマネージャの佐藤良治氏によると、IME 2007以前のプロトタイプ開発の際には、日本だけでなく米国レドモントと中国北京にあるMicrosoft Researchとの共同作業が行なわれたという。それが誤解して伝わっているようだ。
プロトタイプの開発?試作品ってことだよね。
製品版の開発はどこが?
試作品だけが共同で、製品版は単独ということなのでしょうか。
でもさ、試作品なるものがあるということは、機能の大部分はそこからもってきていると推測します。
ということは鰻の産地偽装と同様の状態じゃないのか。
大陸で殆ど完成させて、産地偽装のために日本で最終調整。
所詮推測でしかないんだけどね。
Re:産地偽装? (スコア:1, すばらしい洞察)
根拠もなく、想像で産地偽装だという以外に、気の利いた
批判は思いつきませんでしたか?
Re:産地偽装? (スコア:1)
仕様にある機能が実装出来る事を証明するためだけに使われるもので、
プロトタイプを作る際にはコードの再利用性や性能は問いません。
よって、プロトタイプのコードはその場しのぎのものが多いので、
そのまま製品のコードになる事は少ないはずです。
ちゃんとソフトウェアエンジニアリングが実践されていればの話ですが。
変換精度以前の問題として (スコア:1, 興味深い)
アップデートをかけてないPCだとこの現象は出ません。
単に辞書がぶっ壊れているだけでしょうかねぇ。
Re:変換精度以前の問題として (スコア:2, 興味深い)
「きち」を激しく打ち間違ったという前提で入っているのでは?
iPhone3Gのはじめの頃の変換候補を思い出しますね。
親切すぎて、変換候補がふくれあがったり
パフォーマンスが異常に悪くなる。
はじめの頃は推測してくれたような候補も
最近の版ではでないようになって推測の幅が減ってきていますね。
こういう過度なエラー訂正のチューニングとかがIME2007にも施されれば
賢くなったように見えてくるんじゃないですかね。
まぁ、IME2007を使ったことがないので的外れなのかも知れませんが。
# とはいえ、パフォーマンスを気にしなければiPhoneの推測は
# 入力をサボれるから楽だったんだけどなぁ・・・
# 「つ」の小文字や、濁点は省いても変換してくれて・・・
Re:変換精度以前の問題として (スコア:1, すばらしい洞察)
日本語に詳しくない人が「き」と「ま」を見まちがえた可能性は、
どっこいどっこいな気がする。
Re:変換精度以前の問題として (スコア:5, 興味深い)
むしろ厳しいんじゃないか?
中国に限らないけど、アジアの菓子や花火にある誤植の例として
あ・お・ゐ・す・む (ゐ願い)
う・ら・る・ろ・ち・て・さ・ラ (どらかせん・ぐろぐろ)
め・ぬ (じぬん)
い・り・リ (くださり)
だ・せ (くせさい)
き・ま (なりきす)
ア・マ (ファイマ)
サ・タ・カ (タービス)
ソ・ン・リ (アソパソマソ・ウレタソ)
ク・ケ (シルケ)
コ・ユ (ピカチコウ)
テ・チ (チレビ)
レ・し (ほレい)
などが見受けられ、「ま・き]混同も頻繁に見られるので、やはり
きち/まちの間違いは、変換よみ一覧を見ながら読めない人が字面
で入力している後者の可能性が高いのでは。(中国とは限らずとも)
さあ、OFFICE IMEをアップデートして、おもしろ誤植変換を見つけたら
VOWに投稿だ!(古)
meme-meme
-----------------------------
kenny @ meme design
-----------------------------
ATOKが絶賛されていたので (スコア:1, 興味深い)
Re:ATOKが絶賛されていたので (スコア:3, おもしろおかしい)
と書こうとしたら、「修正パッチ的用語」とか出てきたので
擁護するのを止めたくなった。
修正パッチ適用前は
デフォルトの変換候補がメチャクチャ
↓
正しく変換して確定
↓
次に同じ単語を入力するとき、デフォルトの第一候補が
そのままで、勢いで間違えて確定。結果として、デフォルトの
第一候補の確定回数が多くなるので、いつまで経っても順位が入れ替わらない。
↓
期待する単語が第一候補になっていても、別な助詞を使っていると
デフォルトの第一候補が出てくる。
勢いで(以下略)
となって、とっても使いにくかった。
とりあえず、その状況はだいぶ改善されたかな。
元記事を読む限り、頭のなかで変換結果を予測しながら一定以上の速度で
入力しようとするケースには不向きな仕様なんだと思う。
Re:ATOKが絶賛されていたので (スコア:3, すばらしい洞察)
私も、この3年くらい、ATOKを試しに入れては
「IMEとかわんねーじゃん」と消してた人です。
が、2chとかでの信者のせいで過剰な期待をして、
入れたけど対して変わらないじゃん、で、1週間くらいで使わなくなくなってました。
今回は1ヶ月使い込んで、しっかり自分の変換の癖を覚えさせたら、
省入力や、単語訂正時の学習機能などのメリットが大きくなって、購入しましたが。
過剰な期待を持ちすぎず、1ヶ月しっかり使ってみて、その後IMEに戻しても違和感が無いのであれば、
無理にATOKにする必要も無いと思います。タダじゃないですし。
Re:ATOKが絶賛されていたので (スコア:1)
Re:ATOKが絶賛されていたので (スコア:2)
300円で、最大3ヶ月使うことが出来ますね。
Re:ATOKが絶賛されていたので (スコア:1)
文節毎に変換(スペース)をたたく癖のある人だと,
IMEの性能ってびみょーにわかりにくくなります.
んで,その癖を学習したATOKで,気まぐれに長文を入力して一括で変換しようとすると
結構悲しいことになります.
そういうヤツには,SKKが一番いい気がするなぁw
そうじゃないだろう!
Re:ATOKが絶賛されていたので (スコア:1)
正しい日本語に変換しようとする ATOK で、自分の意図した通りの入力で2ちゃんねるを楽しむなら、その差は体感できないかと。
#もちろん私は ATOK に依存してるワケですが。
-+- 想像力を超え「創造力」をも凌駕する、それが『妄想力』!! -+-
Re:ATOKが絶賛されていたので (スコア:1, 興味深い)
を入れて
「予測変換」
を常にONにすると・・・
Re:ATOKが絶賛されていたので (スコア:1)
これ、人名(著名人の)とか作品名とかを入れるのにすごく便利なんですよ(笑)
# それだから(人間側が)正しく覚えないともいうw
Outlook連絡先辞書で異様に重いバグ (スコア:1)
を参照して異様に重かったバグは、どうなったのですかネ?
それが分かって以来、私は使ってないのですが・・・・・・・・・・
100歩譲って (スコア:1)
評価したなら、この結果で出荷するのは企業としてどうかと思う。
>o IME 2007は変換エンジンが新開発されており、変換候補推測アルゴリズムや学習方式が変更された
>o 変換精度が悪くなったのは、新開発の変換エンジンのチューニング不足
>o 「IME 2007は中国製」というのはデマで、実際は日本で開発されている
IME2002からATOK2006に切り替えたのですが、IMEを使ってた頃は誤変換があまりにも多くて本当に疲れた。それでも間違うし・・・。
IMEでは、Shift一回で半角英文字にする機能が非常に重宝したのですが、ATOKでも実装して欲しい所です。
Re:100歩譲って (スコア:1)
ACさんの教えてくれた方法では、Shiftを押さえたまま、A~Zを押す事になるので、必ず最初が大文字になります。
IME2000(かな?)では、仮名漢字変換出来る状態でShiftを一回押すと半角英数を打てて、再度Shiftを押す事で仮名が入力出来ました。
英語と日本語が混じる文章を良く書いていたので、ATOKに切り替えた後、これが一番困りました…。
Re:100歩譲って (スコア:1)
手元では、無変換を押すと半角英数字を入力できる(&ひらがなが確定されていない)モードになります。
# という動作をご所望、という理解であってます?
今みたら、「半角無変換固定入力(A)ON/OFF」に無変換キーが割り当てられてました。
このモード、自分は辞書を引くときによく使っています。
たとえば、beautifulの意味や綴りを知りたいときは、
無変換キーを押下→beau と入力→Tabキーを押下→beauで始まる英単語がリストアップ→Tabやスペースキーで候補を移動→しばらくほっとくまたはEndキーを押下=意味を表示‥‥‥って感じです。
# いまいちつづることができない、businessやbicycleといった単語をタイプするときにも楽できています。
聞くは一時の恥。聞いたら一生の恥?
Re:100歩譲って (スコア:1)
ただし、「半角無変換固定入力(A)ON/OFF」 をカスタマイズでCtrl+Spaceに割り当てて使ってみたところ、やりたかったことが出来ました。
ただ、出来ればこれをShift(一回)でON/OFF出来るようになればなぁと。若しくは普段使わないキーを一回入力するだけで切り替わる様にしたい所です。
この辺り自分が使いやすいモノを探していきたいと思います。
辞書の検索ですが、今まで使っていた方法より楽なので、今後使わせていただきます。色々ご教授頂きありがとうございました。
Re:100歩譲って (スコア:1)
今回教えていただいたCtrl+@はATOKスタイルなのでIMEスタイルだとCtrl+Tになりますね。Fキーの無いキーボードを利用する時に使わせていただきます!
MS だからぁ (スコア:1, 興味深い)
不具合入りを出荷してしまった。ということが最大の問題なんだと思うがどうか。
日本に責任者がいるなら、なおのこと品質管理ができてない。ということでしょうね
ある版の VisualStudio は MSIME の特定の版(XP 付属)と一緒だとデバッグ対象アプリケーションが終了できない。
というバグがあって、ということは日本語環境ではテストしていなかったのかな。というのも今は昔の話。
元中の人 (スコア:3, 興味深い)
それは黒歴史となっていますからそっとしておいてください。
R&D は IME をインストールしていなかったし、社内 QA /社外テスターは全員 MS Office または ATOK 等を入れていたため
気づけなかったのでしゅ
で、学習どうこう以前に (スコア:1)
「かじ」の変換候補から「鍛治」や「鍜冶」は消えたのかい?
中国人かどうかはともかく、日本語に不自由な人間を開発に入れるなって言いたい。
よって漢直最強。
Re:眉唾だ (スコア:1)
作った本人が使っているかも判らないw
Re:それよりも、 (スコア:2)
ライセンス所有者が利用のほとんどをしめるPCについてはインストールが認められているので、
そのあたりをきちんと説明すればいい気がします。
セキュリティ的に認めていないというのであれば難しいでしょうね。
#コメント似たようなやら変数や長いテーブル名やら書く時に
#省入力によって、手軽に間違えず打てるというのは結構大きいと思うのですけどね。
Re:それよりも、 (スコア:1, すばらしい洞察)
正当(に感じる)に主張できる買う理由があって、しかもそれが会社として収入増に
つながらない限りは、絶対に買ってくれないと思うよ。
あなたの所属しているような規模の会社ならすごく普通の対応だと思う、煽りじゃなく。
消されるのも当然かと、個人のPCじゃないんだし。
まぁ買ってもらえる/入れても文句なしってのは、規模が小さくて見通しが良いか、単に
放置気味なだけなんじゃないかな。
あるいは情シスがIME嫌いだからとかww
Re:それよりも、 (スコア:2, 興味深い)
ATOK を使いたい人は買ってもいいよ、という運用になっています。
買ってくれという側が、打ち込み効率の差による生産性の違いを測定して、ATOKの費用を
(たいした金額でもないし)正当化するくらいはしてあげたらいいんじゃないでしょうか。
Re:それよりも、 (スコア:1, 興味深い)
なら会社でテキストエディタ買ってくれと言うと「Windowsのメモ帳で十分」だそうで。
Re:それよりも、 (スコア:1)
・・・ってか、秀丸を何に使ってますか?
ソレ次第で、いくらでも説明は出来そうな気もしますが。
Re:それよりも、 (スコア:1, すばらしい洞察)
> 情報システム部に「MS-IMEで我慢汁」と言われ、購買部には「Windowsに同じものが
> 入ってるんだからあえて買う理由を出せ」と、拒否られています。
そりゃあ会社のお金を使うんだから、使うに足りる理由を出して納得させなきゃ。
それが出来てないって事はあなたのプレゼンが足りてないんだよ。
Re:ATOKを搭載しろよ (スコア:1)
Re:ATOKを搭載しろよ (スコア:1)
#あなたのオフィスにもMSOfficeよりコストの安くて優秀なJUSTSuiteをどうぞw