東京大学 松尾研究室 ロボット・AI研究チーム「TRAIL」、生成AI活用でロボカップ世界3位
- 投稿日時
- 2023/08/28 09:00
- 更新日時
- 2024/08/19 13:20
結成から1年で世界トップレベルに
5月7日、滋賀ダイハツアリーナに衝撃が走った。RoboCup Japan Open(RCJ)の@Homeリーグ・DSPL(Domestic Standard Platform)部門で、常勝チームを破り東京大学松尾研究室の新星「TRAIL」が全競技で大差をつけて優勝したからだ。
自律移動型ロボット向けの競技会である「RoboCup」の@Home ・DSPL部門は家の中をフィールドとし、生活支援ロボット「HSR(Human Support Robot)」が与えられたコマンドに従って、部屋を片付けたり朝食を用意するといったタスクを実行し、遂行度などを得点化して競い合うもの。TRAILは7月に仏ボルドーで行われた世界大会でも3位入賞を果たすなど、チーム結成から1年足らずにも関わらず活躍が目覚ましい。
上位入賞の理由について、2023年度のTRAILのリーダーを務める綱島颯志さんは「多くの古参チームが既存技術のアップデートをするなか、我々は人工知能研究を進める松尾研究室所属であるというバックグラウンドもあり、基盤モデルや大規模言語モデル(LLM)を積極的に導入した点が大きく寄与した」と話す。
■基盤モデル活用で開発速度UP
基盤モデル(いわゆる生成AI)をどのように活用したのか。一つにはシステム開発の短縮化に役立ったと綱島さんは振り返る。
「1年という短い間に世界大会の出場権を獲得し、世界大会で求められる9つのタスク全てに対し新たなシステムを開発しなければならなかった。高い汎化性が特長である基盤モデルを活用して音声認識と画像認識のシステムを共通化することで、本当に必要なシステム開発に注力できた」(綱島さん)
人から自然言語でランダムにコマンドが与えられる難易度の高いタスク「GPSR(General Purpose Service Robot)」にも基盤モデルが有効であった。これまではその膨大な条件分岐に対応することが難しかったため挑戦者が現れなかったほどだが、TRAILは5つの基盤モデルを活用することで得点した。
「人間から与えられたコマンドの認識・タスク指示と周辺環境についての認識の2つのシステムを組み合わせることで、ロボットを自律的に動かしている。その2つのシステムの随所に基盤モデルを搭載した。ランダムに出される指示に対して、ロボットに適切な動作をさせるために重要となるタスクプランニングには、ChatGPTに使用されているLLMのGPT-3.4を活用。『掴む』や『移動』など23種類のアクションに1対1で対応した23個のスキル関数を用意するだけで、コマンドに合った動作順序を考慮したスキル関数のプランニングを行うことが可能になった。この技術がGPSRのゲームチェンジャーになった」(綱島さん)
■来年は基盤モデル使用が当たり前に
来年の目標はもちろん優勝だが、その道は決して容易ではない。綱島さんがロボカップの特徴を「ロボット研究のコミュニティーとしての機能もあるため、技術を積極的に公開する文化がある」と話すように、来年は基盤モデルを使うのがスタンダードとなる可能性があるからだ。
加えて、日夜より性能が高いモデルやさまざまなタスクに応用できるモデルなどが発表されており、最新の理論をうまくロボットへ実装できたチームは飛躍的に性能が伸びる可能性もある。そのため、綱島さんは「技術の置換が容易なシステムを構築することで、新しい技術を試しつつ性能を上げていくことが大切になる」とみる。
最後に、「ロボットと人間が違和感なく生活できるのはいつごろか」との記者の質問に対し、綱島さんは「人間とロボットの共存が100だとしたら、基盤モデルの登場でやっと10になったくらいの感覚。今までは1ぐらいだったので、グッとレベルアップしたのは間違いないし、あるレベルまでは急激に成長できると思う。基盤モデルでどこまでいけるかを探っていきたい」と先を見据える。
(2023年8月25日号掲載)