JSTトップその他お知らせ一覧へ > 家庭用インターネットテレビ電話の高音質化を実現(有用特許制度の成果を事業化)

家庭用インターネットテレビ電話の高音質化を実現
(有用特許制度の成果を事業化)

平成23年4月20日

株式会社エー・アール・アイ(ARI)
Tel:042-656-3473(広報担当)

岩手大学
Tel:019-621-6303(工学部・工学研究科)

独立行政法人 科学技術振興機構(JST)
Tel:03-5214-8404(広報ポータル部)

株式会社エー・アール・アイ(ARI)(本社:東京都八王子市、社長 佐藤 克昌)は、JST(理事長 北澤 宏一)の有用特許制度によってライセンスされた「通信系・音響系のためのシステム同定の新技術」に関する特許(特許4444919号)を事業化し、今回、高音質の電話会議システムを実現しました。

ライセンスされたこの特許は、発明者である岩手大学 工学部 西山 清 教授の「通信系・音響系のためのシステム同定の新技術」に関する特許をJSTが出願し、平成22年に登録(特許4444919号)されました。ARIはその内容を早くから高く評価し、特許に基づくエコーキャンセラ注1)の開発に乗り出すため平成20年6月にライセンスを行い、事業化を進めていました。

近年、インターネットを利用した電話会議やテレビ会議が盛んになってきていますが、これは単に経費削減のためだけではなく、人の移動を減らすことによりエネルギーコストを下げるための有効な手段です。ここでは、音質向上のためにエコーキャンセラが用いられていますが、従来のシステムで用いられているエコーキャンセラは計算処理速度が遅く、遠隔地の話者(遠端話者)と受聴者(近端話者)との間で同時通話(ダブルトーク)を行った際のエコーを十分に防止(キャンセル)できないため、音質が劣化し易く、その性能向上が求められています。

エコーキャンセラは、スピーカーとマイクの空間における音の伝わり方(伝達関数)を数学的に計算できるソフトウェアを利用して、受話信号からエコー成分を生成し、マイク入力信号からエコー成分を差し引くことでエコーを防止します(図1)。今回、独自開発したソフトウェア「J-FHF(高速ハイパーH∞フィルタ注2))」では、エコー成分を従来のものより安定に高速同定して除去できるため、同時通話も可能となりました。さらに、今までは難しかったスピーカーやマイクが移動した際の音声の追従もできるようになりました。これにより、テレビ電話の会議において、スピーカーの相手の音声(エコー成分)を高速にキャンセルすることができ、あたかも同一空間にいて会話をしているような擬似同居を実現することができます。

本技術は、パナソニック株式会社より2011年2月に発売されたSkype対応BDレコーダー(DIGA)にエコーキャンセラとして利用されており、これをテレビと一緒に使うことにより、高音質の快適なテレビ電話が可能となります。

有用特許とは、研究者が出願を希望し、有用性が期待できる大学などの研究成果を、JSTが出願人となり出願した特許(有用特許取得制度:平成15年度まで実施)。

本新技術の背景、内容、効果の詳細は次の通りです。

(背景) テレビ会議や電話会議で双方向通話性能の高いエコーキャンセラが要求されています。

現在用いられているテレビ会議や電話会議システムでは、遠端と近端の遠く離れた2者が同時に話をした場合、音声が劣化するため、この劣化を防ぐさまざまな開発がなされています。

しかし、この劣化を防ぐ工夫は多くの場合エコーキャンセラに使われるアルゴリズムの改良というよりは、「2者のどちらが話者か」という判定を制御プログラムにより行い同時に話すということを回避するというものでした。そこで、この問題を根本的に解決するアルゴリズムが望まれています。

(内容) ロバスト性注3)の高いハイパーH∞フィルタ(J-FHF)の開発により高音質な同時通話の実現が期待できます。

エコーキャンセラの処理では、音響エコーの伝達経路と変化に応じたフィルタ処理(適応フィルタ)を行うために、送話信号と受話信号からフィルタの演算係数を常時算出(同定)し、追従する信号処理を実行します(図1)。

伝達経路の変動に追従する速度や精度が劣ると音響エコーを正しく低減できず、かえって雑音を発生してしまうため、高音質通話のためにはフィルタ係数の算出(伝達関数の同定)が高速(図2)で誤差の少ない手法を用いる必要があります。

従来の手法では、フィルタ係数の算出の追従速度を高速化すると、算出した係数の誤差が大きくなり、高速化と精度を両立してエコーキャンセラの性能を向上させるのが困難でした。さらに、同時通話時には、音響エコーと相手の音声が混合した受話信号からエコーの経路の変動のみを推定算出することは難しく、同時通話時においては良好なエコー除去性能を実現することができませんでした。

そのため、テレビ電話ではボイススイッチ(話者を特定するスイッチ)によって同時通話(図4)を避けることでエコー除去性能の低下の回避を図るなどして、通話音声品質の劣化ができるだけ問題とならないような工夫が行われています。

しかし、家庭で用いられるテレビを利用した電話では、スピーカーとマイクは、携帯電話のようなハンドセット(受話器)を用いる方法と比較して話者からの距離があり、音響エコーによって通話音声品質が低下しやすいため、一層のエコーキャンセラの性能が求められます。ボイススイッチの利用は家庭向けのテレビ電話としては現実性が低く、同時通話が発生しても高いエコー除去性能を維持できることが望まれます。

J-FHFによるエコーキャンセラは、相手話者の音声まで含むような信号変化(外乱)に対して、安定(高いロバスト性)した伝達関数の高速同定が可能となり、エコー除去性能が向上するのみにとどまらず、従来技術でも難しかった同時通話時であっても良好なエコーキャンセラを実現します。

(効果) スマートテレビ、テレビ会議、電話会議および遠隔医療など幅広い分野への展開が期待されます。

本技術により、相手が話している時に割り込んで話す自分の声を音質よく相手に伝えることができるようになり、ミスコミュニケーションが大きく改善されました。この同時通話性の大幅な向上により、遠隔地の2地点で電話をするという次元から同一空間に2者が存在するという擬似同居という次元に進化させることができ、快適な会話環境を実現できます。

また、今後、J-FHFのロバスト性、高速処理および追従性が有色信号でも性能劣化が少ないという特徴を生かして、音声認識エンジンの前処理や立体音響再生などの分野へも展開が期待されます。

<参考図>

図1

図1 エコーキャンセラによる音響エコー防止の仕組み

図2

図2 J-FHFと従来方式の同時通話時の適応フィルタ係数比較

J-FHFは同時通話時の適応フィルタ係数が安定しているが、従来方式は近端音声によって係数が乱れている。係数が乱れると送話音声の音質が劣化するが、J-FHFは係数が安定しているため送話音声の音質が劣化しない。

図3

図3 J-FHFと従来方式の有色信号(AR信号)に対する収束性能比較

音声や音楽信号はAR信号と呼ばれている。これと同様の性質を持つAR信号を用いて同定の様子を測定したもの。従来方式は収束に時間がかかるが、J-FHFは高速に収束するため短時間で高いキャンセル量を得ることができる。

図4

図4 同時通話時の受話者の受聴送話音声

同時通話時のエコーキャンセル後の送話信号を時間波形で比較すると、従来方式では係数の劣化により送話音声の間に残留エコーがあるが、J-FHFでは同時通話時でも係数が安定なためエコーがキャンセルされ、快適な会話が可能となる。

<用語解説>

注1) エコーキャンセラ
携帯電話やテレビ会議などの双方向通話において、スピーカーからマイクへ回り込む音響エコーを防止(キャンセル)する技術。
注2) ハイパーH∞フィルタ
H∞(H-infinity)フィルタは、所定の信号系以外から入ってくる妨害信号(外乱)の影響を最小にするフィルタである。最悪外乱に対する出力推定誤差を最小とするので、雑音の特性の変化などに対してロバストとなる。 ハイパーH∞フィルタは、従来のH∞フィルタをさらに最適化し、収束性、追従性およびロバスト性のトレードオフを実現している。
注3) ロバスト性
外乱に対する制御器やフィルタの頑強さを表す。エコーキャンセラでは近端信号が外乱に相当するので、ロバスト性の高いエコーキャンセルアルゴリズムを用いることで、ダブルトークに対して高いキャンセル性能を維持することが可能となる。

<お問い合わせ先>

<開発・製品に関すること>

株式会社エー・アール・アイ
広報担当:佐藤 克昌(サトウ カツアキ)
〒192-0081 東京都八王子市明神町3-17-6
Tel:042-656-3473 Fax:042-656-3422

開発担当:三沢 栄治(ミサワ エイジ)
〒192-0081 東京都八王子市横山町6-9 東京技術センター
Tel:042-656-2771 Fax:042-656-2654

<JSTの事業に関すること>

独立行政法人 科学技術振興機構 イノベーション推進本部 知的財産戦略センター
担当:難波 良雄(ナンバ ヨシオ)、森内 久裕(モリウチ ヒサヒロ)
〒102-8666 東京都千代田区四番町5番地3
Tel:03-5214-8486 Fax:03-5214-8417