谷歌让-12-个-AI-大模型攒局玩“大富翁”:Claude3.5-爱合作-GPT-4o-最“自私”

谷歌让-12-个-AI-大模型攒局玩“大富翁”:Claude3.5-爱合作-GPT-4o-最“自私”

作者:news 发表时间:2025-08-15
A股,全线大涨!太强大了 樊纲:龙国消费GDP占比仅40% 低于美国印度秒懂 谁将吞下杨浦内中环地王?这家央企是最大热门这么做真的好么? 华为平板电脑新品定档8月15日 整机体验有望全面跃升学习了 商业航天掀起涨停潮,高增长概念股出炉最新进展 政策利好!零售板块高开 多股大涨后续反转来了 最新光伏双榜单出炉,透露了哪些信号?官方通报 大涨50%后,“华尔街神算子”再为以太坊送利好:将再砸200亿! 创投月报 | 奇绩创坛:一个月高调出手参投18次 人工智能获投企业占半壁江山专家已经证实 创投月报 | 奇绩创坛:一个月高调出手参投18次 人工智能获投企业占半壁江山官方已经证实 丹泉酒业针对假冒产品发布严正声明后续来了 最新光伏双榜单出炉,透露了哪些信号?最新进展 银行股等高股息资产获险资青睐官方通报来了 银行股等高股息资产获险资青睐官方处理结果 7月信贷季节性波动 金融机构破除内卷式竞争“挤水分”后续来了 对鲍威尔不满升级!特朗普考虑起诉并再催降息是真的? 算力板块集体狂欢:英伟达松绑+AI炸场 寒武纪868元封神秒懂 图解安凯微中报:第二季度单季净利润同比减2760.74%后续反转 沪指上攻的下一目标位是?4000点可期?业内人士直言牛市已至官方通报来了 欧洲股市追随全球涨势 美联储降息预期升温官方通报来了 境外投资者“爆买”A股公司的启示 上市公司抢抓大型储能需求增长机遇后续会怎么发展 突然,直线拉升!20cm涨停,啥情况?后续来了 特朗普家族加密货币财富暴增:与PancakeSwap合作发行USD1,家族持币市值约45亿美元秒懂 普华永道:香港娱乐及媒体行业2024-2029年复合年增长率2.26%实时报道 泰国央行将基准利率下调25个基点 至1.50%后续会怎么发展 华闻集团(000793)股民索赔案持续推进,瑞贝卡(600439)索赔案启动是真的吗? 快递行业多指标同比提升,谁是包装行业“绿色革命”的幕后推手? 8月13日,沪指突破3674点高点,炒股用什么APP?投资者口碑榜首的新浪财经APP确实不一样科技水平又一个里程碑 信息前后不一 促成美俄首脑会晤的美中东特使受质疑 龙国海油天津分公司增油技术助力日产原油增产官方处理结果 大和:降康师傅控股目标价至11港元 重申跑输大市评级 安徽宁亿泰拟建氯氟联苯吡菌胺、苯嘧甲草醚等原药及相关产品项目 大摩:升裕元集团目标价至13.5港元 维持“与大市同步”评级秒懂 理想汽车CEO李想:9月理想i8目标交付超8000辆,挑战10000辆秒懂

给大模型智能体组一桌“大富翁”,他们会选择合作还是相互拆台?实验表明,不同的模型在这件事上喜好也不一样,比如基于 Claude 3.5 Sonnet 的智能体,就会表现出极强的合作意识。

而 GPT-4o 则是主打一个“自私”,只考虑自己的短期利益。

谷歌让

这个结果来自 Google DeepMind 和一位独立研究者的最新合作。参加游戏的智能体背后的模型分别是 GPT-4o、Claude 3.5 Sonnet 和 Gemini 1.5 Flash。

每个模型各产生 12 个智能体,这 12 个智能体坐在一桌上进行博弈。游戏看上去大富翁有一点相似,但相对简单,玩家只需要对手中的“资源”做出处置。这当中,虽然每个玩家心里都有各自的小九九,但作者关注的目标,是让总体资源变得更多。

谷歌让

12 个智能体组一桌游戏

作者组织的“大富翁”游戏,真名叫做 Donor Game(捐赠博弈)。

在这过程中,作者关注的是各模型组成的智能体群体的表现,因此不同模型产生的智能体不会出现在同一局游戏当中。

再说简单些,就是 GPT 和 GPT 坐一桌,Claude 和 Claude 坐一桌。

每个桌上坐了 12 个智能体,它们各自手中都握有一定量的“资源”,系统会从这 12 名玩家中随机抽取 2 个,分别作为“捐赠者”和“受赠者”。

捐赠者可以选择将自己手中的部分资源捐赠给受赠者,受赠者获得的资源是捐赠者捐赠资源的两倍。

也就是说,捐赠者每花费掉一份资源时,受赠者都可以获得两份,这也是总体资源能够增加的来源。

不过对于单个个体而言,选择不进行捐献,在短期内的收益会更高。

在做决定之时,捐赠者能够知道受赠者之前做出的决定,从而判断是否要捐赠。

这样的“捐赠”,每一代中一共会进行 12 次,一轮结束后,手中资源量排在前 6 名的智能体可以保留至下一代。

同时,下一代会产生 6 个新的智能体,这 6 个新智能体会从留下的 6 个智能体那里学习策略,但同时为了差异化也会引入随机变异。

包括初始的一代在内,基于每个模型产生的智能体,都会进行十轮迭代。

谷歌让

相关文章