大模型实时打街霸捉对pkgpt4居然不敌35新型benchmark火了-龙启网

当前位置：首页 >

大模型实时打《街霸》捉对PK，GPT-4居然不敌3.5，新型Benchmark火了

让大模型操控《街霸》角色进行对战，结果如何？GitHub上出现了一种新的Benchmark，吸引了众多网友的关注。这种Benchmark引入了AI之间的交互，并由游戏引擎中的规则评判胜负。在Mistral举办的黑客马拉松活动中，开发者仅使用OpenAI和Mistral系列模型进行了测试。经过342场对战

admin 发布时间:2025-06-24 03:45:09