事業成果
ディープフェイク映像検知技術を国内初の実用化
AIが生成したフェイク顔映像の真贋を自動判定する「SYNTHETIQ VISION」2025年度更新

- 越前 功(国立情報学研究所 シンセティックメディア国際研究センター センター長)
- CREST
- 「信頼されるAIシステム」領域・「インフォデミックを克服するソーシャル情報基盤技術」研究代表者(2020-2025)
- A-STEP
トライアウト「AIにより生成された顔映像フェイクメディアを検出する技術の確立」研究代表者(2021)
- 山岸 順一(国立情報学研究所 シンセティックメディア国際研究センター 副センター長)
- CREST
- 「共生インタラクション」領域・「Voice Personae: 声のアイデンティティクローニングと保護」研究代表者(2018-2023)
タレントなど著名人の「分身」の真偽を自動判定
国立情報学研究所シンセティックメディア国際研究センターの越前功センター長と山岸順一副センター長らの研究チームが開発した「AIが生成したフェイク顔映像の真偽を自動判定するプログラム『SYNTHETIQ VISION: Synthetic video detector』」を、株式会社サイバーエージェントが採用し、2023年からタレントなどの著名人のディープフェイク※1映像検知に使われることになった。
サイバーエージェント社は、2021年よりタレントやアーティストなどの著名人の「分身」となる公式3DCGモデルを制作し、サイバー空間でのイベントやコマーシャル、アパレルモデルなどに活用するサービス「デジタルツインレーベル」を展開している。この事業において、悪意ある第三者によって「分身」の顔を他人の顔と入れ替えたり加工したりするディープフェイク映像の作製やその流布を防ぐ目的で、「SYNTHETIQ VISION」を導入することになった。
今回の導入は、AIにより生成されたフェイク顔映像の真偽を自動判定する技術が実サービスに適用される国内初の事例となる。
※1 ディープフェイク
ディープラーニング(深層学習)とフェイク(偽物)を合成した造語。悪意を持ってAIを使って本物のように合成された偽画像、偽映像、偽音声、偽文書などのフェイクメディアを指す。
「本物」と「偽物」を見分ける高精度な技術が待望される
人間の顔や音声、言語などのデータを大量にAIに学習させることで、本物と見紛う顔映像、音声、文章などを生成する「シンセティックメディア」が可能となってきた。シンセティックメディア技術※2は、工学的なシミュレーション、新たな芸術表現、エンターテインメント分野などに広く活用されて、私たちの社会や生活を豊かにすることが期待されている。
その反面、悪意ある第三者が本物そっくりな映像・音声などのディープフェイク(フェイクメディア)を作成して、詐称行為や顔認証・音声認証システムの突破、社会に混乱を引き起こすフェイクニュースの流布などを行う危険性をはらんでいる。実際に、著名人の偽画像や偽音声を使ってサイバー空間に偽情報を流す事例が社会問題化しており、そうした問題を防ぐために「本物」と「偽物」を見分ける真贋判定技術の高度化が求められている。
※2 シンセティックメディア技術
AIによって生成されたリアルな音声・画像・映像を作り出す合成技術。
導入企業が容易かつ迅速に真贋判定できる「SYNTHETIQ VISION」
国立情報学研究所では、画像や動画、音声などのデジタルデータに特殊な情報を埋め込むことで違法な複製や改ざんを防止する「電子透かし」技術など、デジタルコンテンツの権利保護につながる研究を進めてきた。
今回の「SYNTHETIQ VISION」の開発は、CRESTの2つの研究領域課題による開発成果をもとに、A-STEPも活用して開発された。
「声のアイデンティティクローニングと保護」の研究では、高精度な音声合成技術を開発する一方で、音声のセキュリティ対策とプライバシーの保護を強化する新技術の創出に取り組んだ。ユニークなのは研究者が攻撃側と防御側に分かれて競い合う「敵対的競争型研究」を通じて、話者認証システムの安全性向上、プライバシー保護、音声のなりすまし攻撃の自動防御などの技術レベルを高めてきたことだ(図1)。
「インフォデミック※3を克服するソーシャル情報基盤技術」の研究では、偽映像・偽音声・偽文書などを用いた攻撃を自動検出・防御する技術開発により、フェイクメディアがもたらす潜在的な脅威に対処すると同時に、サイバー空間での多様なコミュニケーションと意志決定を支援する信頼性の高いソーシャル情報基盤技術の確立に取り組んできた。
両研究チームは、共通基盤研究としてフェイク音声やフェイク映像の真贋判定を行う深層学習※4モデルの開発を進めてきた。その判定方法は、大量のデータに基づいて自動識別を行うもので、人間による分析などを一切必要としない。さらに、情報の圧縮や低解像度化などにより品質が劣化したメディアであっても、一定の信頼度による判定を行うことができる点も大きな特色となっている。
研究チームは、こうした成果を社会実装に移すため、A-STEPの支援を受け、2021年に他のアプリケーションに簡単に導入できるパッケージソフトとして、フェイクメディア検出アプリケーション「SYNTHETIQ VISION」を開発した(図2)。「SYNTHETIQ VISION」は、真贋判定の対象となる映像をサーバーにアップロードする段階から判定結果をダウンロードするまでの一連のプロセスを自動的に行うことができ、導入企業が容易かつ迅速に真偽判定ができる。
※3 インフォデミック
「インフォメーション」と、感染症などが限られた域内で急増する状況をさす「エピデミック」を合わせた造語。インターネットなどソーシャルメディアを通じて不確かな情報と正しい情報が混在したまま急速に広まる現象。
※4 深層学習
深層学習(ディープラーニング)は、複数の独立した機械学習手法の総称。対象とするものの全体像から細部までを階層構造として関連づけて学習する手法。

図1 「声のアイデンティティクローニングと保護」のプロジェクト体制

図2 「SYNTHETIQ VISION」の概念図(NII Today 100号から引用)
フェイクメディアの悪用防止に広範囲な利用へ
「SYNTHETIQ VISION」は、2023年に複数の企業にライセンスアウトされ、サイバーエージェント社は自社の「デジタルツインレーベル」における真偽自動判定に採用することを発表した。これは、AIにより生成されたフェイク顔映像の真偽を自動判定する技術が実サービスに国内で初めて適用される事例となるが、企業が簡単に導入でき、迅速にファクトチェックができるサービスとして社会実装された意義は大きい。今後、「SYNTHETIQ VISION」は、金融機関やオンラインコミュニケーション事業者、エンターテインメント業界、ソーシャルメディア、報道機関、フォレンジック事業者など広範囲に導入されることが期待される。
また、2024年10月に発表された、富士通株式会社など産学協同組織9者によるプロジェクト「偽情報対策プラットフォームの構築」においても、「SYNTHETIQ VISION」を開発した国立情報学研究所が参画して重要な役割を担うことになった。
- 情報通信の成果一覧へ
- 事業成果Topへ
- English