かな漢字変換に Google IMEを使う


MS IME初版:2012/06/17
Windows標準の日本語かな漢字変換ツール MS IMEは Windowsを使っている人なら ほとんどの人が使っていると思われるが、近年の搭載変換辞書はヒドイ。誤変換の嵐で、前後の語句によっては目的の漢字が候補に出てこないことも多いし、「日本人の書く文章にこんな文章ないだろう!」 と叫びたくなってしまうような変換にも出くわす。
昔はこんなに酷い誤変換はなかったと思うんだが、Windows7 になってからなのか Office IME 2010が登場したあたりからなのか分からないが、明らかに退化していると思う。かなり昔の情報ながら MS(日本法人)の元会長の古川氏がブログに書いたとも云われる「おバカになっていくIME」では、原因の一端が日本語変換部分開発の一部が日本語が分からない中国に移管されていることにあるとする指摘もうなずける。ただ、その頃の問題は Office2007のIMEであって、すでに対策されたとのことで、最近私が感じているのはまた別の症状かもしれない。(根は多分、中国開発移管などに共通しているんだろうけど)
そこで MS謹製 IMEを見限ってもう少しマシなモノというと、有料なら ATOKがある。一時期私も ATOKを使っていたが、Win7に乗り換えた時にそれまでのバージョンが Win7に非対応だったので、再び MSの掌に引き戻されたという経過がある。それが最近になって もうどうにも我慢ならず、フリーの変換辞書を探していたらあの Googleが出していた。確かに、Googleは最近 スマートフォン向けの日本語O/Sも開発しているし、検索サイトではユーザーの入力文章からキーワードを抽出したり、それも間違った語句を修正した候補を提示したり、インクリメンタルサーチでユーザの入力の先読みをしたりするので、日本語文脈解析やそれに使う辞書は必須の技術になっているはずだから、その流用で出来てしまうんだろう。
ここにはそんな Google IME開発に至るストーリーが公表されている。大本営発表だから、ストーリーにはかなり誇張があるとは思うが。


コンテンツ
  1. Google IMEのインストール
  2. 各辞書の誤変換例
  3. ちょっとやりすぎ?


  1. Google IMEのインストール
    Google IMEのダウンロードとインストールは >>> こちら
    特にインストールには難しい点はないと思う。ダウンロードファイルを実行すれば普通にインストールが出来る。インストールされると 「コントロールパネル」>「地域と言語」>「キーボードと言語」タブを開いて「キーボードの変更」ボタンを押すと下のようなダイアログが表示され、「Google 日本語入力」が表示されてインストールされたことが分かる。

    そして、IMEバーが下図のように青いマークのアイコンに変化する。(上が非変換時、下が変換時)

    もし IMEバーが変わらなければ 文字入力アプリ(Wordやメモ帳など何でもいい)を立ち上げておいて 下図の通り IMEバーの左端アイコン部分をクリックすると、インストールされている IMEツールが表示されるので、 Google 日本語入力をクリックして選択すると上のようなバーに変わるはず。

    Google IMEの特徴は、Googleサイトで検索ワードを入力するときと同様に、文字入力するに従ってワンセンテンス分の変換候補が一字入力するごとに先取り表示(インクリメンタルサーチ)されることで、その候補が使える候補ならそこでクリックするか又は「Tabキー」あるいは下矢印キー<>でその候補を選択すれば全部入力する必要はない。

    ブラインドタッチできる人にとってはたとえ候補が表示されてもホームポジションから離れたキーまで指をずらさないといけないのであまり役立つとも思えず、余計なお節介とも思うが、キー入力が遅い人には結構便利かもしれない。ただ、私も最初のうちは候補を選択させるのは「余計なお節介」と思っていたが、最近になってこの表示はキー入力短縮効果よりも「変換キーで突然候補が表示されるとそのときにはすでにEnterキーを押して確定してしまっていることが多いが、候補が事前に表示されると、そのままEnterキーを押してはいけないことが分かるので、間違いのまま確定することが避けられる」と気づき、誤変換のまま確定することが少なくなった。


  2. 各辞書の誤変換例
    元々 Google IMEをインストールした目的は、Office系 IMEの誤変換に辟易としていたためで、IME辞書の性能は勿論「思った候補が優先順位高く表示されること」であり、どんな付加機能があっても変換精度が低ければ意味がない。
    最近の IME変換辞書は学習機能が搭載されており、ユーザーが過去に変換した文字を優先的にリストアップする傾向が強く、使い続けるとその人の入力環境に合った単語を優先的に表示させるようになる。以下の変換例は学習機能をオフしてから各辞書で実際に入力して確かめたもの。だが、学習機能をオフにしたことで、以前の入力履歴には左右されないのではと期待したが、実際にオフで確認すると正解を入力したあとではその文字が上位候補になる傾向は学習機能のON/OFFにかかわらずあるようなので、私の環境依存によるところが多いものも多分に含まれていると思われる。
    また、下の表では Web上で探した誤変換例や私が思いつくまま試したセンテンスの一部を掲載したので、この表の誤変換の数が少なければ優秀な変換ツールだというわけでもない。
    期待結果Google IMEWindows7 IMEOffice2007 IMEOffice2010 IME
    虫の死骸虫の死骸無視の市外無視の市外無視の市外
    新宿花園郵便局新宿花園郵便局新宿はなぞの郵便局
    新宿は謎の郵便局新宿花園郵便局
    法定速度法定速度法廷速度法定速度法廷速度
    機能の欠陥は損だ機能の欠陥は損だ機能の欠陥は損だ機能の欠陥は損だ昨日の欠陥破損だ
    上記原因欄に記入上記原因欄に記入上機嫌淫乱に記入上記原因欄に記入上機嫌印欄に記入
    マウスに持ち替えるマウスに持ち替えるマウスに持ち帰るマウスに持ち帰るマウスに持ち帰る
    優先順位高く優先順位高く優先順位高く優先順位高く優先順位多角
    今日破格値の特価品を買った今日は各値の特価品を買った今日は書く値の特価品を買った今日は書く根の特価品を買った今日は各根の特価品を買った
    神奈川大生教育神奈川大性教育かなが話題性教育神奈川大生協幾神奈川大性教育
    姉歯医者で母は医者姉歯医者で歯は歯医者姉は医者で母は医者姉は医者では葉は医者姉歯医者で母は医者
    裸のままですけど、包装紙ないんですか裸のママですけど、放送しないんですか裸のままですけど、放送しないんですか裸のままですけど、放送しないんですか裸のままですけど、放送しないんですか

    上記の通り私の使用環境では、Windows系の IMEはかなり陳腐な変換をすることが多いが、Google IMEはそこそこに変換してくれている。上記の表はわざと助詞の「は」を引っ掛けた変換などが多く、Google IMEが 助詞の「は」の変換に弱いのでちょっと意地悪な気もするが今までのところの使用感としては Windows系 IMEよりもずいぶんストレスは少ない。
    Google IMEのその他の弱点として気づいたことは、「裸のママですけど」とか「ははは母の手で (母は母の手で)」など同じ音が続く単語の変換に若干弱いような気がする。当節「○○のまま」という使い方より「○○ちゃんのママ」という名詞のほうが圧倒的に使われているとか、「ははは」と入力して「母は」と変換する人より「ははは」のまま笑い声や自嘲?で使う使い方のほうが多いという、ネット世代の用語が重視されているのだろうか?


  3. おまけ
    ちょっとやりすぎ?
    実は、Google IMEはかなりいい加減な入力間違いでも、よくある打ち間違いなら何の警告も発せずに変換してしまうことがある。
    例えば、下の左側のように「つかいづらい」と打つべきところを「つかいらい」と間違えても何事もなかったかのように正しい候補を表示してくれる。これはある意味ありがたいが、右のように「ふいんき」(「ふんいき」ではない)と入力すると、何と「雰囲気」と修正して候補を表示してくれる。しかも「フインキ」というそのままの候補よりも順位は高い。

    ここまでやってしまうと、ちょっとやり過ぎで、ただでさえ ネット上などでは日本語が乱れているというのに、それがますます助長されないかと心配になってくる。
    ただし、この機能は設定で切り替えられる。IMEバーの スパナマークをクリックして「プロパティ」を開き、「辞書」タブを開いたら右下の「もしかして機能を有効にする」のチェックを外せば、こうした「余計なお節介」をオフすることができる。

    Android端末は勿論 マックやLinuxでも使える
    私は使っていないので恩恵には預かれないが、Google IMEは マッキントッシュや Linux対応のものもある。Windowsだけでなく Macを使う両刀遣いの人には同じツールで漢字変換が可能となるメリットは大きいと思う。(かな漢字変換の理想形は空気のように、どこどこの・・・なんていちいち意識しないで吸える、イヤ使えることなんだけど)



<< サイト TOPへ  ↑ページ TOPへ  MS系IMEの問題解決ページへ >>
Access Counter:  総アクセス数


  Y.Nakajima's Top Page
 one of 技術屋 のページ
  >Google IMEを使う<