[English Documents]

使ってみよう音声入力・音声認識Webアプリケーション
w3voice Laboratory @ Wakayama University

w3voice Laboratoryでは、和歌山大学 聴覚メディア研究室で開発を行っている音声入力可能なウェブアプリケーションを公開しています。 音声認識や音声対話、音声合成などの技術を応用したWebサービスを体験してみましょう。 すべてのサービスは無料で御利用いただけます。 また、インターネットにつながり、Javaが動くコンピュータからの利用であれば、特別なプログラムを用意する必要もありません。 コンピュータにマイクを接続してから、アプリケーションにアクセスしてください。 はじめての方は免責事項をお読みください。

[使いかた] [動作環境] [免責事項] [連絡先]

家庭でも使ってみよう音声入力・音声認識Webアプリケーション
[デモビデオの再生(YouTube)]

新着情報

2009/10/16 w3voice.jarをアップデートしました。電子署名の有効期限が2010年8月29までになりました。不具合などが発生した場合はご連絡ください。
2008/12/30 w3voiceアプリリンクを作りました。みなさんがw3voice skeletonで作られたアプリケーションを御紹介します。リンク希望がございましたら、お気軽に御連絡ください。
2008/6/18 Windows用Firefoxをお使いの方へ:詳細は不明ですがFirefoxでJavaアプレットが動作しない症状が頻繁に発生するそうです。私の環境では、FirefoxやJavaの再インストールでは直りませんでした。とりあえずの解決方法が以下のサイトで紹介されています。ご参照ください。FirefoxでJavaをアップデートしたら致命的な不具合が!(OKWave)

ひとくちメモ

w3voiceでは、録音パネルのボタンを押している間、録音します。 ボタンを離すと録音終了です。

- Javascriptによる音声認識ライブラリ w3voiceIM.js を公開しています。
- 音声認識、音声入力に関する情報交換サイト w3voice.jp Wiki をはじめました。
- mixiにw3voiceのコミュニティがあります。mixi住民のみなさん、参加をお待ちしております。

音声入力ウェブアプリケーション ただいま公開中

音声認識・対話アプリケーション

- Web通信販売のデモンストレーション
インターネットで通信販売を使ったことありますか? 将来は、声で商品を注文できるようになるかもしれませんよ。 ここでは、音声認識を使って、声で注文できる未来のくだもの屋さんを作ってみました。 試作段階ですので、実際に商品を買うことはできませんが、看板娘のオタマちゃんに注文してみましょう。
(G4/G5搭載のMacintoshなどbig endianの計算機では、合成音が正しく再生されません。 今後対応予定ですが、当面は、MacintoshはIntel CPU搭載のものを御利用ください。)
- 大語彙連続音声認識 Julius
音声認識とは、コンピュータを使って、声を分析し、テキスト(文字列)に変換する技術です。 Juliusは、オープンソースの音声認識ソフトウェアです。ダウンロードして、みなさんのパソコンで動かすことができますが、ここではダウンロードしなくてもJuliusを試すことができます。 さあ、みなさんの声をJuliusで認識させてみましょう。ちゃんと認識してくれるでしょうか? うまく動かないときは、言語モデルや音響モデル、パラメタの変更による再認識も試してください。
- w3voice.jp Wiki
w3voiceを中心に、音声認識や音声入力に関する情報交換を行うWikiを開設しました。 また、w3voiceIM.jsが組み込まれているので音声認識によるテキスト入力に対応しています。
- Webたけまるくん
たけまるくんは、奈良県生駒市のキャラクタです。 生駒市にある北コミュニティセンターでは、このたけまるくんのアニメーションロボットが受け付けや案内をしてくれます。 たけまるくんはいろいろなおしゃべりをすることができます。だけど、コミュニティセンターの受け付け係なので、施設を案内することが得意です。 毎日多くの市民のみなさんがたけまるくんに話かけてくれます。 みなさんも話しかけてみましょう。
たけまるくんシステムは、このサイトの管理人が大学院生の時に開発しました。 ここでは負荷を軽くするために、少しだけ機能を限定しています。
(G4/G5搭載のMacintoshなどbig endianの計算機では、合成音が正しく再生されません。 今後対応予定ですが、当面は、MacintoshはIntel CPU搭載のものを御利用ください。)
Takemaru-kun system

コミュニケーションツール

- おしゃべり写真 Voice Photo
あなたの写真に熱い魂を吹き込みます。 というのは冗談で、普通の写真のファイルを、しゃべる写真にしてしまうサービスです。 マウスのカーソルを写真の上に移動してみると…。しゃべりました? JPEGファイルにあなたの発話を埋め込んだフラッシュを作成します。 ブログやWebページのアクセントとして使ってみてはいかがでしょうか? (でも、あまり多用するとうるさいかもね…。) 完成したVoicePhotoを、かなりうるさいおしゃべり掲示板に貼ることができます。 しゃべる写真が完成したら、同じページに表示される[掲示板にアップロード]をクリックしてください。 楽しい写真をお待ちしております。
(G4/G5搭載のMacintoshなどbig endianの計算機では、埋め込まれた音声が正しく再生されません。 今後対応予定ですが、当面は、MacintoshはIntel CPU搭載のものを御利用ください。)
- かなりうるさいおしゃべり掲示板
音声入力(発話の投稿)に対応した掲示板システムです。 スピーカーの音量を調整してからアクセスしてくださいね。 私は、定期的にこの掲示板をチェックしていますので、質問など投稿していただくと答えることもあります。 通常のテキスト入力もできますが、音声入力を試してくださいね。 また、みなさんが作ったVoicePhotoも掲載されています。 それじゃあ、Let's Talk!

音声合成・分析アプリケーション

- STRAIGHTボイスチャンジャー
あなたの声を他人に変えてしまうボイスチャンジャープログラム(変声器)です。 マウスによる簡単な操作で、声の高さと発話者寸法の配分を変えることができます。 変換エンジンには、聴覚メディア研究室で開発中の音声分析・合成プログラムSTRAIGHTを用いています。 また、「おしゃべり写真」や「かなりうるさいおしゃべり掲示板」との連動によるプライバシーフィルタ機能(近日公開予定)を提供しています。
- 発話の分析(スペクトログラム)
みなさんの声を分析してみましょう。 このアプリケーションは、録音された信号を周波数分析し、サウンドスペクトログラムにして表示するものです。 このプログラムの内部処理には、MATLABを使用しています。 今後は機能を拡張したいと思っています。

Web開発者向けサービス

- 音声認識Javascriptライブラリ w3voiceIM.js
たった一行追加するだけで、あなたのサイトに音声認識機能を付けられます! Webページの上のテキスト入力フォームに音声認識機能を追加するJavascriptライブラリを公開しています。
- w3voice開発キット w3voice skeleton
本サイトと同様な音声入力Webアプリケーションを構築するのに必要なw3voiceの開発キットです。 アーカイブには、録音プログラム(Javaクラスファイル)及びPerlによるCGIのサンプルプログラムを含みます。 ただし、基本的なUNIXの知識とCGIプログラミングの経験が必要です。 みなさんもおもしろい音声アプリ作ってみませんか? アプリを作成された際には、本サイトからリンクいたしますので、アドレスを御連絡ください。お待ちしております。
- 共有型音声認識エンジン engine.w3voice.jp
w3voiceIM.jsなどのフロントエンドサービスで利用する共有型音声認識エンジンのサービスです。 また、このページから認識辞書に単語を追加することができます。

w3voiceアプリ リンク

みなさんが、w3voice skeleton(開発キット)を使って作られたアプリケーションをぜひ御紹介ください。 このコーナからリンクさせていただきます。 ユニークなw3voiceアプリケーションをお待ちしております! (営利、宗教、政治活動に関するサイト、法律や公序良俗に反するサイト、他者を誹謗中傷するサイトへのリンクはお断りさせていただきます。)

音声入力の使いかた(クリックで表示します)

Recording Panel

動作環境:正しく動作しなかったときにお読みください(クリックで表示します)

以前の新着情報(クリックで表示します)

免責事項:使用するまえに必ずお読みください

連絡先・著作権

謝辞

w3voice Logo

Wakayama University