Podcastleとは

Podcastle(ポッドキャッスル)は,音声版のブログであるポッドキャストを日本語で検索できるサー ビスです.Podcastleのトップページから好きな言葉を 入力し,検索してみてください.あなたの知らなかったポッドキャストと出会えるかもしれません.

音声認識技術で,音声を文字に

Podcastleは,音声認識という技術を使い,音声を文字に変換しています. つまり,コンピュータがポッドキャストの音声を解析・認識し,文字として書き起こします. そして,その文字列から全文検索を行い,検索結果を表示します.産業技術総合研究所 (AIST)の音声認識技術を用いることによって,高精度の認識性能を実 現しています.

認識結果をみんなで訂正する

日本語には,同音異義語が多数あります.また,聞きとりにくい音声は, 人間が聞いても間違えてしまうことがあります.そのような音声は,コンピュータにも 認識できません.また,音声認識技術はまだまだ研究段階なので,人間には容 易に聞き分けられる音声でも間違えてしまうことがあります.つまり,音声認 識では認識誤りを避けることができないのです.

そこでPodcastleでは,音声認識の持つ最大の欠点である認識誤りを, みんなで訂正するという方法で克服できるのではないかと考えました. 検索されたポッドキャストは,簡単な操作で認識誤りを訂正することができます. 訂正した結果を共有することによって,徐々に正しい認識結果を検索すること ができるようになっていくはずです.

成長する検索エンジン

Podcastleは,成長する検索エンジンです.みなさんが認識誤りを訂正すると, 単に認識結果が修正されるだけではなく,音声認識システム自体が, どのような音声が間違えやすいか,何が本当の解だったのかを知り, 学習して成長していくのです.その 結果,これまでよりももっと音声認識の精度が上がっていきます.

つまり,認識誤りを訂正することによって,みんなで音声認識システムを 育てていることにもなるのです.

より詳しく知りたい方へ

Podcastle Wiki

PodcastleのWikiです.情報交換の場としてお使い下さい.

Podcastleのよくある質問や,意見交換などは,Wikiをご覧下さい.

History

Last modified: 2009-12-07 Attached files total: 0Bytes