研究課題別中間評価結果

1.研究課題名
聴覚の情景分析に基づく音声・音響処理システム
2.研究代表者名
河原 英紀 (和歌山大学システム工学部 教授)
3.研究概要
 聴覚系は視覚系と並ぶ情報の基本的な入力システムであるが、その研究は視覚系に比べれば遅れているといえよう。本研究は、聴覚の機能を環境との相互作用による「聴覚の情景分析」として捉え、従来の常識を超える新しい聴覚情報表現方式を生み出し、これにより音声の分析、認識、変換などを実時間で自由に行える音声・音響情報処理システムを構成する。これは音声認識、音声合成などの新技術を生み出す。さらに、脳の聴覚情報処理の原理に通ずる聴覚の計算理論の構築を目指す。
4.中間評価結果
4−1.研究の進捗状況と今後の見込み
 本研究は、「聴覚の情景分析」を指導原理とし、聴覚の計算理論の確立を目標として遂行されている。そのために、研究代表者の開発したSTRAIGHTという音声変換・合成・分析システムをその中心に据えている。音声の基本アルゴリズムであるSTRAIGHTには多くの工夫・改良が付け加えられ、国際的にも高く評価されて国際標準の一つになりつつあり、研究は順調に進んでいるといえよう。
 計算論グループ、知覚グループ、認識グループ、変換グループなどにおいても研究は順調に進んでいる。音声・音響の工学的研究としては、世界をリードする成果を挙げているものの、しかしそこから一歩踏み出して、脳の仕組みに迫る聴覚計算理論を構築するには至っていない。このためには、方法論の面でも人材の面でも、不十分であることを指摘する必要があろう。
4−2.研究成果の現状と今後の見込み
 STRAIGHTシステムの各構成要素については、聴覚系での情報処理を参考にしつつ、いくつかの重要な改良、新展開がなされた。スペクトル包絡の抽出法、基本周波数抽出法などに優れたさらなる改良があり、これらは特許として申請され、研究の重要な成果となっている。また、こうした改良によりシステムの性能が飛躍的に高まり、国際的にも注目を浴びている。
 また、これらの成果は他の研究グループにも影響を与え、内耳における音の分析モデルであるgammachirpモデルの提唱とその特性の解析、音声認識におけるSTRAIGHTの利用、音響変換、音源分離など、関連する研究の進展は著しい。
 今後はこうした研究がさらに進み、STRAIGHTシステムがより洗練されたものとなるとともに、音声・音響の分野での国際標準としての地位を不動にすることが期待できる。
4−3.総合的評価
 研究代表者の発明であるSTRAIGHTシステムは、音声分野の基本アルゴリズムとして世界的に評価され、その地位を確立しつつある。また、その応用分野も音声・音響分野全体に拡がり、重要な成果をあげており、高く評価できる。
 しかし、聴覚計算理論を確立し、脳情報処理に迫るには、人材の面でも方法論の面でも十分でないことは否めない。また、人間の音声を基にしたこの方法が、自然音を含む聴覚の計算理論の構築にどこまで有効であるか、疑問がないわけではない。
 今後は、STRAIGHTをさらに使いやすいものとして洗練し、関連する分野での応用普及に努力するとともに、将来に向けて真の計算理論を構築するための手がかりを得る試みを開始して欲しい。このためには脳の聴覚システムにかかわる研究との連携が必要である。

戻る