研究課題別中間評価結果

1.研究課題名
表現豊かな発話音声のコンピュータ処理システム
2.研究代表者
Nick Campbell 株式会社国際電気通信基礎技術研究所 プロジェクトリーダー
3.研究概要
 高度メディア社会の情報処理技術の枠の中で、発話音声が持つ機能的役割、特に、言語情報以上の発話様式で表現する「声が持つ意味」について解明する。人は文字には表れない情報を声の調子によって、発話意図、態度、感情状態を示す。大規模自然音声対話データベースの収集と分類により、発話様式のバリエーションを分析すると共に、声の表情を含む表現豊かな音声合成や言い方認識技術への応用に向けて研究を行う。
4.中間評価結果
4−1.研究の進捗状況と今後の見込み
 当初の計画では、最初の3年間でアプリケーションの開発とフィールドトライアルまでを見込んでいたが、現在までの進捗はコーパスの整備、ツールの開発とモデル化などに力点が置かれ、フィールドトライアルまでは到達していない。しかし、これは基礎的な研究結果のフィードバックによるものであってむしろ望ましい方向といえ、研究は着実に進展していると考えられる。

 感情を表現できる音声合成技術に向けて自然対話の音声データ−ベースの整備が進められ、それらにより新しい韻律パラメータの研究が進んでいる。パラ言語情報、非言語情報としてよいパラメータを設定し、かなり説得力のある説明が出来つつある。

 自然な発話環境での大規模な音声データベースは他の研究を底上げする基盤的な研究リソースとしての意義も大きく、今後のデータベースの充実を期待する。

4−2.研究成果の現状と今後の見込み
 感情を伴った音声のデータベース構築が進行しており、今後幅広い応用を期待できる基礎データの蓄積になりつつある。「声質」を同定するパラメータの有効性の発見が行われるなど、当初の計画では想定されていなかった重要な展開が図られている。

 国際的な論文発表でも注目され、この分野の世界のリーダとなりつつあり、従来の言語学の枠組みを超える研究の方向性を提示するなど、科学的インパクトは大きい。
 データベースがさらに充実すれば、近い将来の音声研究に役に立つ重要な成果になり得る研究であり、コーパスの分析による音声データに関する新たな知見を得られる可能性が高く、研究が加速されることを期待したい。

4−3.今後の研究に向けて
 地味な作業の多いテーマではあるが、目的と効果が明快であり成果が期待できる。分散した組織が個別の要素を追う段階から、それぞれの成果をふまえて統合する段階へと移る時期にきていると思われるので、プロジェクト運営・管理に一段と注意を払い大きな成果に結びつけてもらいたい。
4−4.戦略目標に向けての展望
 感情を表現できる音声合成技術は世界的にもほとんど手がついていない領域を対象にしており、学問的にも実用の面からも新しい分野を切り開くことになる研究である。この研究の内容と成果は国際的に見ても数年先にホットなテーマとなることは間違いないもので、この研究だけが国際的に他を数年抜きんでていると言ってよい。
4−5.総合的評価
 これまでのところ研究は順調に進んでおり、予想以上の成果を挙げている。自然な発話環境での大規模な音声コーパスはこのプロジェクトの研究のみならず、関連分野の研究を底上げし、加速する研究基盤としても意義が大きい。更には周辺の研究も巻き込んで新しい研究分野を立ち上げる事ができる可能性を持っている。他に先駆けてこの問題に取り組み、大きな成果を挙げていることは高く評価できる。今後の進展に期待したい。

<<高度メディアトップ


This page updated on September 12, 2003
Copyright(C)2003 Japan Science and Technology Corporation