五月原清隆のブログハラスメント

これからは、セクハラでもない。パワハラでもない。ブロハラです。

余り当てにならない「声de入力」の音声認識

 まだまだニュースを続けます。

KDDI、携帯電話向け音声認識技術“声de入力”を発表――“EZナビゲーション”に対応機能を追加

http://biz.ascii24.com/biz/news/article/2006/01/12/659940-000.html

 そりゃあ、携帯電話の基本機能は「喋る」事にあるのですから、限られたユーザーインターフェースの中において、音声認識という選択肢はかなり重要視される事でしょう。しかし、これが果たして一般ユーザーにどれだけ受け入れられるかとなると、私はかなり疑問視しています。というのも、現時点において「正確な音声認識」という技術は確立されていないからです。
 その事は、「声de入力」をテストしてみた記事でも見て取れます。

○地名や乗換を声で入力・検索「声de入力」の実力は?

http://plusd.itmedia.co.jp/mobile/articles/0601/12/news067.html

 この記事によると、乗り換え検索では4回に1回、目的地検索ともなると2回に1回以上は、音声での入力を誤認識してしまうとの事です。しかも、「声de入力」には学習機能がない為、システム側で同じ単語を何回も誤認識する危険性があるのです。そして、誤認識に伴う余計なパケット通信料はユーザー負担なのですから、ユーザーにとっては踏んだり蹴ったりです。幾らダブル定額だのダブル定額ライトだのと用意したところで、結局ユーザーには従量負担部分があるのですから、KDDIにとっては見事なマッチポンプです。
 抑も、携帯電話よりも遥かにデータ容量で余裕のあるはずのPCで全然音声認識機能が普及していないという事を考えれば、自然と「声de入力」の将来も分かりそうなものです。まぁ、乗り換え検索や目的地検索という非常に限られた機能でこそ、そこそこ使い物になる可能性はありますが、「声de入力」の汎用化については、まだまだ前途多難と言うべきでしょう。何せ、漸く衆議院の速記が機械化されるというくらいですからね。

参院:伝統120年、国会速記者が消える−−08年めど、衆院も方針

http://www.mainichi-msn.co.jp/seiji/kokkai/news/20060107dde007010067000c.html

 国会用の技術でさえまだこのレベルなんですから、音声認識技術が民生レベルに落ちてくるのは、かなり先の話になりそうです。っていうか、まともに使えるような音声認識技術が出てきたら、ペンタゴンが黙っちゃいませんね。KDDIの技術者は、今から背後に気を付けておいた方が良さそうです。