○発表のポイント:
◆環境を「外部記憶」として使う分散的な集団の知能を最適化の観点で捉える理論を構築した。
◆単純な知能しか持たない個体でも、集団で分散的に情報処理することで、高度な知能をもつ単独の個体を超える知性を発揮できることを示した。
◆単純なエージェントの群れやチームが分散的に振る舞いつつも集合として最適な情報処理を実現できることがわかり、今後、医療、人工知能、ロボット工学への応用が期待される。
個による中央集権的な情報処理と単純な知能しか持たない集団の分散的情報処理
○概要:
東京大学 大学院情報理工学系研究科の加藤 雅己 大学院生と、同大学 生産技術研究所の小林 徹也 教授の研究グループは、集団による分散的な情報処理の効率や最適性を捉える新理論を構築しました。従来の知能研究は脳科学に代表されるように人間の知能の理解などに動機づけられており、「個」が行う複雑な判断や記憶、そして、その良さに着目しがちです。しかし、生体には、集団で外敵を認識し学習する免疫系や、群れで環境中の餌を探索する社会性昆虫など多様な知能が存在します。本研究は、最適性の観点で「集団の知能」を捉える理論を構築し、個々には単純な知能しか持たない「集団」が高度な知能をもつ「個」を超える知性を発揮しうることを示しました。さらに、集団が環境自体を「外部記憶」として分散的に情報処理する場合に重要となる、最適な情報書き込みと読み出しの関係(図1)も明らかにしました。この成果は、生体知能の仕組みの理解を深めるだけでなく、AIやロボットなどの問題に多様な知性のあり方を実装する方法論を与え、社会に幅広い影響を与える可能性があります。
図1:単純な知能しか持たない細胞集団による環境探索と、効率的な探索を実現する環境への最適な情報の読み出しと書き込みの概念図
個々の細胞は、環境に分散的に配置された迷路の情報を環境自体に書き込み、それを最適な関係で読み出す。その結果、集団として、高度な知能と記憶を持つ個をも超える効率的な探索が実現できる。
○発表者コメント:加藤 雅己 大学院生の「もしかする未来」
生命システムの本質を抽出し、数理を用いて記述・解析する計算論的生物学は、数理や情報科学が好きで生物にも興味がある自分にとって知的好奇心がくすぐられる刺激的な分野です。この学際的なアプローチは、数理の観点から対象横断的な生命の理解を与えるだけでなく、生命現象に基づいた新たな数学の問題や情報科学技術を提示したりする可能性を秘めています。今後は、生命の理解を深めるだけでなく、新しい数理を生み出してもいきたいと考えています。
○発表内容:
ヒトをはじめとした生物個体が試行錯誤による環境との相互作用を介して最適な振る舞いを学習する過程は、知的な情報処理の一種です。強化学習(Reinforcement learning、注1)は、この試行錯誤による学習の振る舞いや良さを捉える理論として神経科学で生まれ、現在では、人工知能の様々な技術にも応用されています。しかし、高等動物の知能に動機づけられたこの理論は、学習の主体として一定の計算能力と記憶を有する「賢い1個体」を対象としてきました。しかし、自然界をみると、限られた知能しか持たない個体が集団を形成し、全体として高度な情報処理をする事例が数多く見られます。例えば、免疫細胞群は集団で外敵を認識し、速やかに排除する事ができます。また、社会性昆虫なども群れで驚くほど高度な探索やタスクを実現できます。このような集団が持つ知能やその良さをどう理論的に捉えればよいかは未解明の大きな課題でした。
本研究では、「賢い1個体」を対象とした強化学習理論を拡張して、限定的な知能しか持たない個体の集団が環境を共通の記憶装置として分散的に情報の書き込み・読み出しを行うことで実現される集団としての知的な振る舞いを扱う数理理論を構築しました。生物集団が環境に分布する化学物質などを記憶媒体として用いる現象は、アリが餌までの道しるべとしてフェロモンを分泌したり、白血球が傷口の情報を伝達するために化学物質を細胞外に排出したりするなど広く知られています。しかし、集団を構成するそれぞれの個体が、どんなときにどれだけ化学物質を排出し、その濃度(勾配)をどう重みづけて移動方向を決めれば学習や探索が効率的に、すなわち賢くできるのかはわかっていませんでした。本研究の理論は、集団が最適な情報処理をするために必要な情報の読み出しと書き込みの間の最適な対応関係を導き出しました(図1)。例えば、生成した環境中の情報に対して過剰に(過小に)反応するなどして、この対応関係が崩れると、集団は餌や傷口などの目標に集まる効率が落ちてしまいます。
また、迷路を探索するという同一の問題に対して「賢い1個体」と「賢い集団」を比較することで、「賢い1個体」は、探索時の偶然性に大きく左右されてゴールになかなかたどり着けない場合があるのに対して、「賢い集団」では、一部の個体が安定して速やかにゴールにたどり着けることなども明らかにしました(図2)。この結果は、必ずしも脳のような形で1個体に中央集権化された知能がどの側面においても常に優れているというわけではなく、分散化された知能などの多様な知能が共存し得ることを示しています。
本研究の理論は、単純な生物から知能がどう進化的に発展したのかや、発生過程で細胞の集団が全体として複雑な形作りを実現できるのはなぜか、といった生命科学の未解決問題を扱う理論的な糸口になります。また、環境を介した分散的な情報処理という発想は、生物学のみならず、人工知能や分散コンピューティング、ロボット群制御などにも応用可能であり、「多様な知能のあり方」を接点として理学と工学を横断した科学技術の新しい可能性を示すものです。
図2:迷路探索問題を対象とした個体集団と一個体との探索行動の比較
(い)は環境中の情報の分布、(ろ)は個体数の分布、(は)は個体内部の記憶情報の分布をカラーマップで表しており、加えて個体の位置を赤で示している。個体集団・1個体は、それぞれ同一のスタート地点から出発し、目標(餌など)が配置されたゴールに集まることを目指す。集団の外部記憶及び個体の内部記憶は、初期時刻において、迷路内のどの場所がゴールに近いか分からないように記憶情報は一様に初期化されている。集団の各個体及び1個体は、記憶情報が多い場所に高い確率で移動し探索を行う(読み出し)。探索過程において、到達した場所の周囲に目標が配置されていなければ、その場所の「価値」を低く評価し、それぞれ環境中の外部記憶及び個体内の内部記憶に反映する。逆に、偶然ゴール付近に到達した場合は、「価値」を高く評価し記憶に反映する(書き込み)。完璧な内部記憶を有していても1個体で探索する場合は偶然性に大きく左右されてゴールに到達できないことがある一方で、分散的に探索しながら環境を記憶装置として用いて書き込み・読み出しする個体集団は集団として安定してゴールに到達できる。
○発表者・研究者等情報:
東京大学
生産技術研究所
小林 徹也 教授
兼:生物普遍性連携研究機構 教授
兼:大学院情報理工学系研究科 教授
大学院情報理工学系研究科
加藤 雅己 博士課程
○論文情報:
〈雑誌名〉PRX Life
〈題名〉Optimality theory of stigmergic collective information processing by chemotactic cells
〈著者名〉Masaki Kato and Tetsuya J. Kobayashi*
〈DOI〉10.1103/tvfy-lbbl
○研究助成:
本研究は、科研費「生物に学ぶ、環境を通じて記憶を共有する分散的学習システムの構築」(課題番号:24KJ0846)、「原生知能のための最適性理論の構築と応用」(課題番号:24H01465)、「進化情報アセンブリの統合理論と進化則の解読技術の構築」(課題番号: 25H01365)、東京大学プロアクティブ環境学国際卓越大学院プログラム(World-leading Innovative Graduate Study Program in Proactive Environmental Studies, "WINGS-PES")、JST CREST 「構造的・動力学的制約を活用した多元混合化学情報の解読とその応用」(課題番号:JPMJCR2011)の支援により実施されました。
○用語解説:
(注1)強化学習(Reinforcement learning)
エージェントが環境から与えられる報酬を最大化する行動を試行錯誤を通じて学習する機械学習手法で、人工知能(AI)の一分野を形成しています。強化学習は、脳科学および心理学に端を発し、ヒトや動物の知性を理解するための基礎理論となっている他、ゲームAIやChat AI、ロボット制御など様々な技術に応用されています。
○問い合わせ先:
東京大学 生産技術研究所
教授 小林 徹也(こばやし てつや)
Tel:03-5452-6798
E-mail:tetsuya(末尾に"@sat.t.u-tokyo.ac.jp"をつけてください)