Discovery Sagaサイレントキーワード俯瞰

本研究課題では，人間の他者との協調を支える認知情報処理機構の理解を目的とし，認知神経科学・機械学習・ロボティクスの観点を統合したロボット構成論的手法により取り組む．特に，（i）環境変化や他者のふるまいといった外的要因と（ii）自己の将来の行動に関する計画や意図といった内的要因によって生じる協調の形成とその崩壊に関する動的過程に着目する.
令和三年度は，これまでに構築した決定論的なrecurrent neural network（RNN）ベースのフレームワークに対して，より広範な知覚・行動パターンの学習を目指し，確率的な潜在表現を扱えるように拡張を行なった．具体的には，predictive-coding-inspired variational RNN（PV-RNN）と呼ばれる予測符号化に基づく変分推論が可能なRNNに対して，実時間処理を可能にするために償却推論（amortized inference）を導入した．従来のPV-RNNは，変分推論を順伝播計算と逆伝播計算の繰り返しが必要な勾配法ベースの手法に基づいて行うため潜在変数の計算コストが高く，ロボットの行動生成等の実時間処理が必要な部分に適用することが困難であるという問題点があった．そこで本研究では，時間的に現在から過去に向かって順伝播計算を行うbackward RNNを導入し，償却推論によって潜在変数を求めることで，勾配法における複数回の順伝播計算と逆伝播計算を一度の順伝播計算のみで置き換えることを実現した．
拡張したフレームワークをロボットに実装し，人とロボット間の協調の形成とその崩壊に関する学習実験を行った．実験の結果，学習時に損失関数のハイパーパラメータを調整することでロボットの行動選択が決定論的・確率的になりうることを確認した．さらに，backward RNNを利用した償却推論によって，実時間でロボットによる外部環境の知覚・行動生成が可能であることが確認された．