研究者は、人工知能(AI)のパフォーマンスを評価するためのベンチマークとして、クラシックビデオゲームのスーパーマリオブラザーズにますます目を向けています。このアプローチは、さまざまなAIモデルをテストするための動的で複雑な環境を提供し、静的データセットにはできない課題を提供します。
任天堂の象徴的なプラットフォーマーのパブリックドメインクローンに基づいたマリオAIベンチマークは、この目的のためのオープンソースのフレームワークとして開発されました。これは、強化学習アルゴリズムとゲームAIテクニックのテストベッドとして機能し、研究者がAIエージェントがゲームの複雑なレベル内でどのようにナビゲートおよび相互作用するかを評価できるようにします。
最近の開発では、カリフォルニア大学の科学者であるサンディエゴのHAO AIラボは、AI機能をテストするためにSuper Mario Bros.を使用して提案しています。彼らは、ゲームの複雑さは、ポケモンのような以前の標準と比較して、より挑戦的なベンチマークを提供すると主張しています。この方法により、リアルタイムのシナリオでAIの学習、適応、および戦略を評価することができます。
関連している:Apple Vision Proは、Mr Headset Latencyベンチマークで競争を押しつぶします
Mario AIフレームワークは、10年目の年次版でも更新されており、以前のバージョンの機能を統合し、新しい機能を追加しています。このフレームワークにより、研究者はAIメソッドをスーパーマリオブラザーズのバージョンに適用し、AIの学習と適応性の実験を促進することができます。
Super Mario Bros.をaテストグラウンド、研究者は、AIモデルがリアルタイムの意思決定、障害物回避、および目標指向のタスクをどのように処理するかを観察できます。このアプローチは、AIの開発を進めるだけでなく、動的環境での理論的研究と実用的な応用との間のギャップを橋渡しします。
