[実世界知能基盤] 2025年度採択課題

伊藤伸志

実世界の環境に適応するオンライン学習技術の数理基盤

グラント番号：JPMJPR2511

研究者

伊藤伸志

東京大学
大学院情報理工学系研究科
准教授

研究概要

本研究では、バンディットアルゴリズムやオンライン強化学習を含むオンライン学習において、適用環境の前提が明確でない場合でも、自動的に適応し高い性能を発揮できる学習手法の開発を目指します。従来の確率的・敵対的といった環境モデルの区別に依存せず、複雑かつ高次元な構造をもつ意思決定問題や、中間的・非定常な環境にも対応可能な、理論的保証と実装効率を両立するオンライン学習基盤の構築を目指します。

オウギョクセイ

流体環境下の音響センシング知能体の構築

グラント番号：JPMJPR2512

研究者

オウギョクセイ

東京大学
大学院工学系研究科
助教

研究概要

本研究では、流体が音響センシングとロボット動力学に与える影響をモデリングし、次世代水中ロボットシミュレータを構築する。音響情報を活用し、非接触で周囲の流体状況を把握できる機能を基盤に、シミュレータを用いてデータ駆動型動力学モデルの学習とモデル予測制御を適用し、複雑な水中環境への対応力を高める。最終的には、海岸域など実水域の流体外乱下でも安定動作する自律型水中ロボットの開発を目指す。

奥村圭祐

マルチエージェント探索と模倣学習による大規模ロボット群協調

グラント番号：JPMJPR2513

研究者

奥村圭祐

産業技術総合研究所
人工知能研究センター
研究員

研究概要

近年急速に発展したスケーラブルなマルチエージェント経路計画技術を基盤に、エージェントごとの方策を組込んだマルチエージェント探索と、模倣学習による方策改善を反復適用することで、方策と探索の双方を段階的に強化し、マルチロボット協調をゼロから設計可能な汎用的機構を確立する。その有効性を、一人称視覚情報に基づく100台規模の実ロボット群による協調ナビゲーションを通じて実証する。

小林泰介

継続能動学習における双対なジレンマの包括的調律

グラント番号：JPMJPR2514

研究者

小林泰介

情報・システム研究機構
国立情報学研究所
助教

研究概要

これまで個別に議論されることが多かった継続学習と能動学習の統合による実世界で自律的に学習し続けるロボットシステムの実現を目指す．その中でも，継続学習と能動学習が抱えるそれぞれのジレンマに潜むであろう双対性に着目することで，互いのジレンマに矛盾しない所望のバランスで行動・学習可能にする汎用アルゴリズムの開発を進める．

高橋亮

激しい動きにも耐える全身分散スキン知能ネットワーク

グラント番号：JPMJPR2515

研究者

高橋亮

東京大学
大学院工学系研究科
特任助教

研究概要

本研究は、ヒトやロボットの激しい動きの中でもスキンの変形に追従し、生体・触覚データなどを集め、AI解析するスキンデバイスを、電池レス・配線レス・高密度化した状態で駆動できる「服型の全身無線給電・通信ネットワーク」を目指します。服の変形によらず、通信・給電性能を常に高く維持できるようにし、高密度にアレイ化したスキンデバイスからデータを読み取り、ローカル上でこれらの機能を実行できるようにします。

中村友彦

音響シーンに適応する可変解像度音メディア処理基盤

グラント番号：JPMJPR2517

研究者

中村友彦

産業技術総合研究所
人工知能研究センター
主任研究員

研究概要

音メディア処理技術を実環境で動かし続けるためには，接続される機器やシステムの更新に伴う条件の変化や，音環境の変動にも柔軟に対処する必要があります．本研究では，このような変化する環境に対応するため，入出力の時間解像度に依存しないパラメタ表現を用いた時系列信号用深層学習基盤を構築します．この基盤を基に，時間解像度を自律的に調整しながら環境変化に適応できる音環境理解技術の実現を目指します．

西村真衣

経験の蓄積と想起を司る自律型記憶基盤

グラント番号：JPMJPR2518

研究者

西村真衣

オムロンサイニックエックス（株）
リサーチ・アドミニストレイティブ・ディビジョン
シニアリサーチャー

研究概要

実世界で活動するAIが経験を生涯にわたって蓄積し、継続的に学習するための「自律型記憶基盤」を創出する。具体的には、経験ストリームの蓄積・自己組織化・意味的想起という統合的記憶プロセスを、記憶空間の生成的検索を介したタスク駆動最適化によって自律的に実行し、従来静的であった記憶管理を動的に進化させることで、状況に応じた柔軟なスキル獲得とAIの継続的な進化を可能にする新たな学習基盤を開発する。

芳賀達也

脳における内的思考プロセス生成のモデル化と応用

グラント番号：JPMJPR2519

研究者

芳賀達也

情報通信研究機構
未来ICT研究所
テニュアトラック研究員

研究概要

近年、Chain-of-Thought（CoT）により大規模言語モデルに複雑な思考過程を経た推論を行わせることが可能となっています。本研究では、海馬―前頭前野システムにおける内的思考プロセス生成のモデル化により、脳型CoTの理論を構築します。そして、そこに脳ならではの現象であるマインドワンダリングを組み込み、脳のような柔軟な思考や少数データからの学習を行える機械学習モデルの構築を目指します。

久野大介

極限通信環境に適応するTask-OrientedなAI連携型通信技術の開拓

グラント番号：JPMJPR251A

研究者

久野大介

大阪大学
大学院工学研究科
助教

研究概要

本研究は、通信資源が著しく制限される極限的実環境において、マルチモーダルデータを安定かつ効率的に取得・伝送可能とするAI連携型通信システム基盤を構築することを目的とする。特に、極限的実環境として、海中通信環境、深宇宙通信環境、狭帯域セルラー通信環境の3つに注力し、これらの現場から得られる情報をAIシステムが活用可能な形式で確実に伝送できる低遅延かつ高信頼な通信インフラの確立を目指す。