● 開発の背景
 SPOCの基本的なアイディアは,平成13年に,独立行政法人通信総合研究所・西田結集型特別グループで開発された参加型自動放送システム(パブリック・オピニオン・チャンネル(POC))から継承されています [1]。これは,視聴者の発信した記事を自動編集して,誰でも親しめるテレビ放送型の様式に変換して配信するシステムです。しかしPOCでは,扱えるビジュアルコンテンツが静止画のみである等の制約がありました。そこでSPOCでは,放送型メディアとして重要であるコンテンツの動的な表現に焦点を当て,(1) 映像的な表現を向上させ,(2) エージェントアニメーションを自動生成する機構を実装し,従来よりも表現力の高いアニメーションシステムで表現することを実現しました。
● システムの仕組み
 SPOCシステムは,以下の4つの主要部分から構成されています(図3)
(1) 知識カード編集ツール:番組は,「知識カード」と呼ばれる,画像イメージ,又は映像クリップ1つと,それについての百文字程度の文章の組み合わせからなるカードを編集し,並べ替えることによって作成されます(図4)。まず,番組作成者は,映像や画像を選択し,そのうちどの部分を利用するのかを指定することによって,素材の切り出しを行います。また,拡大・縮小率,表示範囲の指定により,画像・映像素材に対して,ズーム・パン,チルトなどのカメラワークを付加することも可能です。次に,選んだ素材についての文章を入力します。これで,知識カードが1枚出来上がります。このようにして作成された知識カードを番組編集画面(図2 番組作成)に並べると,そのカードの並びが1つの番組となります。
(2) エージェントアニメーションの自動生成:汎用的なエージェントアニメーション自動生成システム,CAST (The Conversational Agent System for neTwork applications)[2] を開発し,これをSPOCに統合することにより,エージェントアニメーションの自動生成機能を実現しました。これにより,知識カードが作成されると,カード中の文章をもとに,エージェントのジェスチャーや顔表情などの非言語情報が自動的に決定されます。
 CASTでは,まず日本語解析エンジン[3]を用いて文章が解析され,文の構造に応じて,文中の強調すべき部分が決定されます。次に,その部分をどのような非言語情報を用いて強調するのかが決定されます。例えば,重要な概念について述べるときには,強調のジェスチャーを用い,眉を上げて目を大きく見開く,といった非言語情報を用いて強調します。次に文章が音声合成システムに入力され,音声ナレーションが作成されます。同時に,音声とエージェントアニメーションとを同期させるためのタイムスケジュールも計算されます。尚,CASTには,MITで開発されたエージェント動作決定機構[4]の一部が利用されています。
(3) 番組表示ツール:番組配信ツールは,知識カード単位で記録された各シーンの情報を順次解釈し,映像・画像,音声,エージェントアニメーションを同期を取りながら実行します。これによって,カードの束が映像番組へと変換されます。
(4) 質問応答機構:FAQとそれに対する答えをあらかじめ用意しておきます。番組配信中に利用者からの質問がSPOCサーバに送られると,文書検索システム[5] がFAQの中から入力された文に近い質問文を検出し,それに対応する答えを回答カードとして生成します。この回答カードが配信中の番組のカード列に割り込んで再生されることにより,利用者からの質問に即座に答えることができます。
○ 以上のコンテンツ作成,公開,およびインタラクティブな番組視聴の機能は,すべてサーバ側に構築されており,普及度の高いFLASH Player6.0 のみで動作するWEBアプリケーションとして実装されています。従って,利用者側のPCには,特殊なソフトウェアをインストールする必要がありません。また,作成されたコンテンツは,すべてストリーミングによってサーバから配信されるので,利用者側のPCには負荷の少ないサービスです。
● SPOCの応用
○ リスクコミュニケーションのメディアとして.安全に関する考え方,基礎知識,疑問,日常の対策,緊急時の心得等を社会で共有し,育てていくことができます。
○ 教育用メディアとして.講義内容ばかりでなく,学習者の日常の興味や疑問やレポートまで放送すれば,クラスで,教材について実感のある深い知識が育っていくことが期待されます。
○ SPOCの提供する視覚効果の高いメディアは,コンテンツに対する視聴者の注意や興味を高め,それを持続させることが期待されます。

本研究は,社会技術研究システム,ミッション・プログラム「安全性に係わる社会問題解決のための知識体系の構築」(平成13~14年度は日本原子力研究所の事業,平成15年4月1日~9月30日は科学技術振興事業団の事業,平成15年10月1日からは独立行政法人科学技術振興機構の事業)の研究の一環として行われた.
[1] Fukuhara, T., Fujihara, N., Azechi, S., Kubota, H., and Nishida, T. "Public Opinion Channel: A network-based interactive broadcasting system for supporting a knowledge-creating community", In R.J.Howlett, N.S.Ichalkaranje, L.C.Jain, and G.Tonfoni(eds.); Internet-Based Intelligent Information Processing Systems, World Scientific Publishing, chapter 7, pp.227-268, 2003.
[2] Nakano, Y., Murayama, T., Kawahara, D., Kurohashi, S., and Nishida, T. "Embodied Conversational Agents for Presenting Intellectual Multimedia Contents" In Proceedings of the Seventh International Conference on Knowledge-Based Intelligent Information & Engineering Systems (KES'2003) (to appear)
[3] Kurohashi, S. and Nagao, M. 1994. "A Syntactic Analysis Method of Long Japanese Sentences Based on the Detection of Conjunctive Structures". Computational Linuguistics, 20(4): 507-534, 1994.
[4] Cassell, J., Vilhjalmsson, H., Bickmore, T. "BEAT: the Behavior Expression Animation Toolkit". Proceedings of SIGGRAPH '01, pp. 477-486, 2001.
[5] 清田 陽司, 黒橋 禎夫, 木戸 冬子: 大規模テキスト知識ベースに基づく自動質問応答 -ダイアログナビ-, 自然言語処理, Vol. 10, No. 4 (2003).
■ 戻る ■


This page updated on December 2, 2003

Copyright©2003 Japan Science and Technology Agency.