スタンフォード大、日常動画をロボット学習に変換する手法「Masquerade」を開発

ヒューマノイドロボット

スタンフォード大学の研究チームは、人間が日常生活で撮影した動画をロボットの学習データに変換する新手法「Masquerade」を発表した。ロボット研究における最大の課題は「データ不足」であり、画像や言語分野と比べてロボット向けの学習素材は極めて少ないとされてきた。

Masqueradeは、人間の手の動きを推定した上で人物の姿を映像から消去し、代わりにバイマニュアル(二本腕)ロボットを重ね合わせる。この「人間映像のロボット化」によって、日常的な操作動画をそのままロボットの行動データに利用できるようになる。研究チームは、この変換データとわずか50件の実際のロボット実演を組み合わせて調理作業を学習させた結果、未経験の環境でも高い成功率を維持することを確認した。

比較実験では、既存手法と比べ平均62ポイント高い成功率を記録。特に、学習環境と異なる台所でのタスク遂行においても性能が落ちにくく、頑健性が際立った。研究チームは、動画データの規模を拡大すればさらなる性能向上が見込めると指摘している。

今後、家庭や職場にある「何気ない人間の作業映像」がロボットの成長を後押しする可能性があり、生活支援から産業分野まで幅広い応用が期待される。

Masquerade
Masquerade: Learning from In-the-wild Human Videos using Data-Editing
タイトルとURLをコピーしました