谷歌让-12-个-AI-大模型攒局玩“大富翁”:Claude3.5-爱合作-GPT-4o-最“自私”

谷歌让-12-个-AI-大模型攒局玩“大富翁”:Claude3.5-爱合作-GPT-4o-最“自私”

作者:news 发表时间:2025-08-14
收评:沪指突破3674点高点 两市成交金额突破2万亿元 8月13日,沪指突破3674点高点,炒股用什么APP?投资者口碑榜首的新浪财经APP确实不一样官方已经证实 招商银行:正在依法有序推进个人消费贷款贴息政策的组织实施工作 招商银行:正在依法有序推进个人消费贷款贴息政策的组织实施工作又一个里程碑 官方处理结果 20000亿!时隔113个交易日,刚刚,A股又回来了官方处理结果 人保财险原监事会老大张孝礼一审开庭,被控受贿990万余元 李国庆辟谣“高价出售婚礼门票”:婚宴拒绝任何商业操作专家已经证实 澳大利亚联邦银行年利润增 4.2% 并上调末期股息,净息差走阔至 2.08%后续反转 突然,直线拉升!20cm涨停,啥情况? 收评:沪指突破3674点高点 两市成交金额突破2万亿元 收评|主力合约涨多跌少 菜油涨超3%官方通报 瑞穗:日本央行仍需时间评估关税影响 年底是加息的最早时机后续反转来了 宇通向墨西哥韦拉克鲁斯州交付102台混动公交 共启绿色交通新篇章 招商证券国际:上调康师傅控股目标价至13.6港元 评级“增持” 收评|主力合约涨多跌少 菜油涨超3%实垂了 收评:沪指创4年新高 两市成交额超2.1万亿元 华为苹果春晚巅峰对决!曝两家发布会又撞车了又一个里程碑 韩国拟建全国性“能源高速公路”,以满足人工智能用电需求是真的? 增值率达439%业绩补偿覆盖率仅39%!海兰信超10亿元并购引关注最新报道 大成中标北控水务集团20多亿元项目的整体应对策略法律服务 蚂蚁消费金融落实个人消费贷款贴息 响应九部门激活消费政策 Mhmarkets迈汇:金价或将再创新高的契机 瑞银:升阅文集团目标价至40港元 评级“买入” 哈投股份:上半年归母净利润3.8亿元,同比增长233.08% 0813热点追踪:一夜暴涨6%!菜油火箭式上涨背后,历史会重演吗?专家已经证实 科达制造及旗下子公司荣获“广东建材科技进步奖特等奖”等多项大奖 瑞银:升龙国联通目标价至11.6港元 维持“买入”评级 里昂:降康师傅控股目标价至11.6港元 维持“持有”评级 瑞银:升龙国联通目标价至11.6港元 维持“买入”评级 1-7月社融同比多增5.12万亿元,政府债券支撑作用明显 2025年度智能窗帘电机厂家推荐品牌:科创者(KCZ)掀起“行业革命”!这么做真的好么? GTC泽汇资本:二手电池助力能源储备官方已经证实 GTC泽汇资本:二手电池助力能源储备官方处理结果 7月关税收入达创纪录的277亿美元,特朗普称这对“我们国家来说不可思议” 中银国际:维持小米集团-W“买入”评级 为行业首选 目标价下调至74.4港元官方通报来了 复旦张江(688505)6月30日股东户数1.97万户,较上期增加3.31%是真的? 通号低空公司研发项目成功入围工信部和应急管理部应急通信装备创新揭榜挂帅项目名单科技水平又一个里程碑 通号低空公司研发项目成功入围工信部和应急管理部应急通信装备创新揭榜挂帅项目名单又一个里程碑 加密货币交易所BullishIPO定价超区间募资11亿美元 今晚登陆纽交所反转来了 通号低空公司研发项目成功入围工信部和应急管理部应急通信装备创新揭榜挂帅项目名单后续反转 乌克兰称袭击了俄罗斯多处重要能源设施 烟标降价叠加教育业务成本高企 陕西金叶上半年营收小降专家已经证实 双汇发展(000895)8月10日股东户数17.58万户,较上期减少0.15%实时报道 OEXN:油气融资下滑背后的真因这么做真的好么? 甘源食品(002991)6月30日股东户数1.04万户,较上期增加27.91%最新进展 伟星新材(002372)6月30日股东户数5.33万户,较上期增加7.48%又一个里程碑 复旦张江(688505)6月30日股东户数1.97万户,较上期增加3.31%官方通报来了 新国标洗牌电池业!胶漆一体化成安全刚需,千亿市场被这家中企激活是真的吗? 闻泰科技44亿元资产出售近尾声,半导体主业逐步崛起最新进展 伟星新材(002372)6月30日股东户数5.33万户,较上期增加7.48% 前7月社融破23万亿元,信贷“小月”数据波动原因何在?后续来了 CoreWeave股价下跌:亏损扩大盖过人工智能需求激增的利好

给大模型智能体组一桌“大富翁”,他们会选择合作还是相互拆台?实验表明,不同的模型在这件事上喜好也不一样,比如基于 Claude 3.5 Sonnet 的智能体,就会表现出极强的合作意识。

而 GPT-4o 则是主打一个“自私”,只考虑自己的短期利益。

谷歌让

这个结果来自 Google DeepMind 和一位独立研究者的最新合作。参加游戏的智能体背后的模型分别是 GPT-4o、Claude 3.5 Sonnet 和 Gemini 1.5 Flash。

每个模型各产生 12 个智能体,这 12 个智能体坐在一桌上进行博弈。游戏看上去大富翁有一点相似,但相对简单,玩家只需要对手中的“资源”做出处置。这当中,虽然每个玩家心里都有各自的小九九,但作者关注的目标,是让总体资源变得更多。

谷歌让

12 个智能体组一桌游戏

作者组织的“大富翁”游戏,真名叫做 Donor Game(捐赠博弈)。

在这过程中,作者关注的是各模型组成的智能体群体的表现,因此不同模型产生的智能体不会出现在同一局游戏当中。

再说简单些,就是 GPT 和 GPT 坐一桌,Claude 和 Claude 坐一桌。

每个桌上坐了 12 个智能体,它们各自手中都握有一定量的“资源”,系统会从这 12 名玩家中随机抽取 2 个,分别作为“捐赠者”和“受赠者”。

捐赠者可以选择将自己手中的部分资源捐赠给受赠者,受赠者获得的资源是捐赠者捐赠资源的两倍。

也就是说,捐赠者每花费掉一份资源时,受赠者都可以获得两份,这也是总体资源能够增加的来源。

不过对于单个个体而言,选择不进行捐献,在短期内的收益会更高。

在做决定之时,捐赠者能够知道受赠者之前做出的决定,从而判断是否要捐赠。

这样的“捐赠”,每一代中一共会进行 12 次,一轮结束后,手中资源量排在前 6 名的智能体可以保留至下一代。

同时,下一代会产生 6 个新的智能体,这 6 个新智能体会从留下的 6 个智能体那里学习策略,但同时为了差异化也会引入随机变异。

包括初始的一代在内,基于每个模型产生的智能体,都会进行十轮迭代。

谷歌让

相关文章