チャンピオン
ホームページホームページ > ブログ > チャンピオン

チャンピオン

Jul 16, 2023

Nature volume 620、pages 982–987 (2023)この記事を引用

889 オルトメトリック

メトリクスの詳細

一人称視点 (FPV) ドローン レースは、プロの競技者が 3D サーキットで高速航空機を操縦する、テレビ放映されるスポーツです。 各パイロットは、搭載カメラからストリーミングされたビデオを使用して、ドローンの視点から環境を観察します。 自律型ドローンでプロのパイロットのレベルに達するのは困難です。ロボットは、搭載センサーのみからサーキット内の速度と位置を推定しなが​​ら、物理的限界で飛行する必要があるからです1。 ここでは、人間の世界チャンピオンのレベルで物理的な車両をレースできる自律システムである Swift を紹介します。 このシステムは、シミュレーションにおける深層強化学習 (RL) と物理世界で収集されたデータを組み合わせます。 スウィフトは、現実世界の直接対決レースで、2 つの国際リーグの世界チャンピオンを含む 3 人の人間のチャンピオンと対戦しました。 スウィフトは人間の各チャンピオンに対していくつかのレースで勝利し、最速のレースタイムを記録しました。 この研究は、モバイル ロボティクスとマシン インテリジェンス 2 のマイルストーンを表しており、他の物理システムでのハイブリッド学習ベースのソリューションの展開に影響を与える可能性があります。

Deep RL3 は、人工知能の最近の進歩を可能にしました。 ディープ RL で訓練されたポリシーは、Atari4、5、6、Go5、7、8、9、chess5、9、StarCraft10、Dota 2 (ref. 11)、および Gran Turismo12、13 などの複雑な対戦ゲームで人間を上回りました。 マシン インテリジェンスの機能を示すこれらの印象的なデモンストレーションは、主に、テスト条件の正確なレプリカでのポリシー検索をサポートするシミュレーションおよびボードゲーム環境に限定されています。 この制限を克服し、物理的な競技会でチャンピオンレベルのパフォーマンスを実証することは、自律移動ロボット工学と人工知能における長年の課題です14、15、16。

FPV ドローン レースは、高度な訓練を受けた人間のパイロットが高速機敏な操縦で航空機を物理的限界まで押し上げるテレビ放映されるスポーツです (図 1a)。 FPV レースで使用される車両はクアッドコプターであり、これまでに製造されたマシンの中で最も機敏なマシンの 1 つです (図 1b)。 レース中、車両は自重を 5 倍以上上回る力を発揮し、たとえ狭い空間であっても時速 100 km 以上の速度と重力の数倍の加速度に達します。 各車両はヘッドセットを装着した人間のパイロットによって遠隔操作され、車載カメラからのビデオ ストリームが表示され、没入型の「一人称視点」体験が生まれます (図 1c)。

a、スウィフト (青) は、2019 ドローン レーシング リーグ世界チャンピオンのアレックス ヴァノーバー (赤) と直接対決します。 トラックは 7 つの四角いゲートで構成されており、各周で順番に通過する必要があります。 レースに勝つためには、競技者は相手よりも先に連続 3 周を完了する必要があります。 b. 青色 LED で照らされた Swift と、赤色 LED で照らされた人間が操縦するドローンの拡大図。 この作業で使用される自律型ドローンは、モーション キャプチャ システムなどの外部インフラストラクチャからのサポートがなく、機内の感覚測定のみに依存しています。 c、左から右へ:トーマス・ビットマッタ、マービン・シェイパー、アレックス・ヴァノーバーがトラック上でドローンをレースしている。 各パイロットはヘッドセットを着用し、航空機に搭載されたカメラからリアルタイムで送信されるビデオ ストリームを表示します。 ヘッドセットは、没入型の「一人称視点」体験を提供します。 c、写真:レジーナ・サブロトニー。

人間のパイロットのパフォーマンスに達する自律システムを作成する試みは、2016 年の最初の自律ドローン レース競技会に遡ります (参考文献 17)。 次のゲートの位置を特定するためのディープネットワークの使用18、19、20、シミュレーションから現実へのレースポリシーの移行21、22、認識の不確実性の説明23、24など、一連の革新が続きました。 2019 年の AlphaPilot 自律型ドローン レース コンテストでは、この分野で最高の研究がいくつか披露されました25。 しかし、最初の 2 チームは依然として、プロの人間のパイロットがトラックを完了するのに比べてほぼ 2 倍の時間がかかりました 26、27。 最近では、自律システムが人間の専門的なパフォーマンスに達し始めています28、29、30。 ただし、これらの作業は、外部のモーション キャプチャ システムによって提供されるほぼ完璧な状態推定に依存しています。 人間はドローンからの機内観測にしかアクセスできないため、人間のパイロットとの比較は不公平になります。