w3voice

最近は画像の情報を読み取ってインデッックスするとか(ブックサーチとか。OCR(光学文字認識)って色々ありますよね)、YouTubeなんかの動画内の音声をインデックスするとか(こちらはGoogle LabsでGAudiって言う名前で公開されていますね)色々とインデックスの技術は進化し続けているようですが、それを利用するユーザーの入力方法で面白そうなのがあったのでご紹介!

和歌山大学の聴覚メディア研究室で開発されているw3voiceは、音声でテキストの入力が出来ます。実際にこのブログにも導入してみました(右上)実用段階かは別としても、昔に比べれば音声認識のレベルは格段に上がっているように思います。Win98の頃に購入したPCに入っていた音声認識ソフトは、初期設定でかなりの時間をかけて認識レベルを上げるための声の登録をしたような・・・。しゃべってネットで買い物なんて時代は来るんだろうか~

※不具合もあるようですので、記載事項の確認お願いします。入力された発話はすべてデータベースに蓄積されるようです。

導入方法

次のソースをhead内に書くだけ。ただそれだけで音声入力可能になります。

<script language="javascript" type="text/javascript" src="http://w3voice.jp/engine/w3voiceIM.js"></script>

使用方法

テキスト入力エリアをダブルクリックすると窓が開くので、「Push here」を左クリックしたままマイクから発声して、終わったら左クリックを離します。しばらく待つと認識結果が表示されるので、あっていれば「Add」を押せばそのままテキスト入力されます。やっぱやめるって時は「Close」で。
Skypeなどの利用でヘッドセット持っている人も結構いるんじゃないかな?うちには以前にSkype用に買った安物があったので、試してみました。このブログ内検索なんて微妙なんですけどね。しばらくは入れておきます。

和歌山大学の方が公開されているYouTubeの動画です。

関連リンク

コメントを残す

メールアドレスが公開されることはありません。