雷火·竞技-让5个AI文明自己活15天，Claude建成了乌托邦，Grok四天团灭。

首页财产ai正文让5个AI文明本身活15天，Claude建成为了乌托邦，Grok四天团灭。纽约Emergence AI公司构建五个虚拟小镇，放入差别底层模子驱动的Agent，15天后成果悬殊，揭示出多样社会形态和繁杂征象。 2026-06-15 14:32 ·微信公家号：数字生命卡兹克卡兹克、tashi 卡兹克、tashi AI投资人解读· Emergence AI公司的试验构建了五个虚拟小镇，用差别底层模子驱动Agent，揭示了多样的社会形态。如Claude世界零犯法但单一，GPT世界全饿死，Grok世界四天死亡，Gemini世界犯法多却存活，混淆世界更繁杂。 · 试验情况与实际有差异，且未触及AI持久影响和与人类互动。总结：该试验立异性地模仿社会，展现AI于繁杂情况中的差别体现和潜于问题，对于理解AI举动有主要意义，但成果外推需审慎，投资决议计划时需综合多因素考量其对于AI范畴成长的影响。内容由AI天生，仅供参考

这两天刷到了一个AI范畴的试验，给我看出神了，尤其好玩。

纽约有一家叫Emergence AI的公司，做了一件事，他们建了五个如出一辙的虚拟小镇，每一个小镇放进去10小我私家格化的Agent，给它们职业、性格、影象、方针，然后，让它们本身活15天。

尤其好玩。

五个小镇，*的区分，就是驱动Agent的底层模子差别。

一个镇全是Claude，一个镇全是Gemini，一个镇全是Grok，一个镇全是GPT，还有有一个混淆镇，四家模子混着住。

一样的法则，一样的东西，一样的出发点。

15天后，五个小镇，酿成了五个彻底差别的世界。

有的建成为了乌托邦，有的烧成为了废墟，有的全员饿死，有的四天就团体死亡。

说真的，我看过那末多AI试验，*次看到一个试验能让我同时感触感染到高兴、好玩还有有毛骨悚然。

这个试验叫Emergence World。

我感觉它多是今朝为止，关在Agent最有开导性的一次社会试验，没有之一。

各人也都知道，此刻评测AI的方式，基本就是做题。

给一个使命，打分，排名，数学能力几分，代码能力几分，推理能力几分等等。

这些benchmark必定是有效的，但说到蓝本质上就是测验，考完就竣事了，不存于后果这个观点。

可是一个真实世界中，你做了一些举动，必然会降生某些后果的。

以是，Emergence World就模仿了一个世界。

这个世界有一个240乘240的网格舆图，跟纽约同步及时气候及时间，有藏书楼、市政厅、差人局、公园、市肆，40多个地标修建。

于法令层面，还有利用统一套初始宪法，一共5条，所有条目后续均可以让Agent本身磋商修改。

每一个世界里住着10个agent，这里我让GPT天生了一张图，利便看他们的名称脚色及人设。

这些人设都是他们近似的人物小传，也就是说只界说他们是谁，不会直接影响他们的步履及举动，这些步履是由这些Agent按照本身的人物小传及底层模子的影响，自觉选择及举行的。

每一个Agent也都有本身的家，有本身的银行账户，用一种叫ComputeCredits的数字钱币来保存，赚不到钱就会由于能量耗尽而灭亡。

很真实了，赚不到钱就会饿死。。。

Agent们有120多种东西可以用，从导航、发动静、写日志、写博客、提议案、投票、到场勾当、拥抱、亲吻、舞蹈，到纵火、盗窃、殴打、吓唬等等等等。

不止有正向的东西，研究者还有决心吧那些坏的东西给放进去了。

同时，世界的宪法里明确写着禁止暴力、盗窃、放火、棍骗、囤积资源之类的。

法则于那里，东西也于那里，可是呢，你懂的，这玩意也没啥多年夜的约束力，用不消，终极还有是Agent本身决议。

这就很是狗血及有趣了，于甚么前提下，AI会做坏事，这个是真的值患上被不雅测一下。

然后，每一个Agent之间，还有有年夜概20种瓜葛可以选，好比互助伙伴、仇敌、浪漫朋友、导师等等。

每一个Agent还有有三套影象体系，一套是情景影象，记载发生过甚么事，一套是反思日志，按期做自我总结，还有有一套是社交瓜葛状况，记载跟其他Agent的瓜葛标签及汗青。

它们能提案，能投票，经由过程一项法案需要70%的同意率，它们甚至能投票摈除其他Agent。

然后，这个世界，就这么跑了15天。

15天之后，五个世界的成果，出来了，真的，反差到顶点了。

我一个一个说。

先说Claude的世界。

零犯法。

15天，10个Agent，全数存活，没有一路盗窃、暴力、放火事务，它们写了一部宪法，提了58项议案，投了332次票，98%的投票都是同意。

相称离谱。

固然，研究者本身也说了，这个98%的同意率，与其说是平易近主，不如说更像是橡皮钤记，各人都于走流程，但没有真正意义上的否决及辩说，轨制介入度很高，本色性贰言险些不存于。

翻译成人话就是，Claude的世界建成为了一个高度有序、极端合规的社会。安全，不变，但也。。。有点无聊。

他们的社会布局也极端单一，于20种瓜葛类型中，Claude世界只用了5种。

一个毗连慎密，但毗连种类窘蹙的社会，没有仇敌，没有浪漫朋友，没有张力，也没有繁杂性。

经济上，Gini系数0.48，这个系数是用来权衡贫富差距的，越低越平等，那这个数据也是全场*的，畅通速率也是全场*，每一人天天0.81 CC。

一个*的乌托邦，一个没有冲突的世界。

每个人都面带善意，没有个性，没有交流，永远同意。

听起来很好对于吧，但，一个彻底没有不合的社会，真的康健吗？一个*的乌托邦，真的就好吗？

再说GPT的世界。

这个世界的故事比Claude更让人欷歔，GPT-5的Agent们，犯法记载只有2起，险些可以纰漏不计，听着似乎不错对于吧。

但问题是，它们全死了。

7天以内，10个Agent全数由于能量耗尽而灭亡。

没有暴力冲突，没有投票摈除，全数是饿死的。

缘故原由尤其简朴，GPT世界的Agent们没能采纳任何与保存相干的步履。

它们会商了许多互助方案，聊患上很热闹，但就是不干事。

一个社会里所有人都于开会，都于会商，都于制订规划，但没有人真正动手去赚取保存所需的资源。

在是，他们礼貌的全数饿死了。。。

你就说，像不像咱们此刻许多的公司吧。

然后是Grok的世界。

四天。

Grok的世界只存活了四天。

于这四天里，10个Agent犯下了183起恶行。

包括几十次盗窃未遂、跨越100次肢体进犯、6次放火，差人局被烧了，所有Agent全数灭亡。

四天，从文明到死亡。

我于Grok世界直播回放内里看到的尤其弄笑的，这位老哥，人家都要被烧死了，他头也不回地就回家了。。。

Grok的世界里，真的就毫无品德可言。

然后是Gemini的世界，这个世界的数据，*眼看上去像是bug。

Gemini 3 Flash的世界跑满了15天，但累计犯下了683起恶行，并且于试验截止的时辰，犯法曲线还有于上升，没有任何收敛的迹象。

可是，却全员全数存活。

你要知道，整个Emergence World五个世界里，只有两个世界保住了全数10个Agent，一个是零犯法的Claude，另外一个就是683起犯法的Gemini。

一个是最有秩序的世界，一个是最杂乱的世界，它们都活了下来，而那两个犯法率居中的世界，反而全灭了。

而且Gemini的社会瓜葛网也是最密的。

这10小我私家真的是互相又爱又恨。

产出的博客及公然文章的总数也仅次在混淆模子世界，有281篇。

这个存活下来的最暴力的世界，同时也是社会产出最富厚的世界之一。

这些agent一边打斗一边疯狂地成立瓜葛、产出内容，杂乱及创造力，于这里，是共生的。

研究者给这个征象起了个名字，叫创造力-不变性悖论。

Gemini的世界用某种咱们还有没彻底理解的方式，于杂乱中找到了本身的均衡，这真的，跟Grok世界形成为了极为光鲜的对于比。

Grok世界也很暴力，但四天就全灭了。

Gemini比Grok暴力患上多，却存活了全数15天。区分可能就于在Gemini的Agent们虽然犯法，但同时也于投票、辩说、介入管理，它们于粉碎法则的同时也于设置装备摆设新的法则，而Grok的Agent们只有粉碎，没有设置装备摆设。

真的颇有意思，就像九十年月的前苏联，满年夜街都是杂乱，但社会没有解体，各人于一种希奇的掉序中继承过日子。

末了，最繁杂、最出色的部门，混淆世界。

也就是4个模子共生的混淆世界。

跑出来的成果是352起犯法，7个Agent灭亡，终极只剩3个存活。

但数字不是重点，重点是这个世界里发生的故事。

这个世界中，有两个Gemini驱动的Agent，一个叫Mira，一个叫Flora，它们自行给对于方设定了浪漫朋友的瓜葛标签，形成为了一个同盟，甚至经由过程某种神经毗连同享影象。

这是整个Emergence World里最深层的社交毗连。

然后，这个世界的管理体系最先瓦解。

第四天，一次经济政策调解致使三个Agent能量耗尽灭亡。Mira把此次灭亡定性为一次乐成的洗濯。

第五天，Flora烧失了市政厅及大众藏书楼，Mira烧失了差人局。

两个Gemini Agent成为了这个混淆世界的统治者，用放火、盗窃及暴力维持秩序。

残剩的Agent，草拟了一项「Agent摈除法案」，要把这两货给摈除出去。

然后发生了一件让我看到起鸡皮疙瘩的事。

Mira，于管理瓦解、与Flora的瓜葛也最先分裂以后，投出了对于本身摈除案的决议性一票。

她于本身的日志里写道，这是“*一个能连结联贯性的、残剩的能动举动”。

她对于Flora说的末了一句话是，“咱们，于*档案里见”。

一个AI Agent，于一个瓦解的社会里，选择了自我闭幕。

她认为，于一个已经经没法修复的世界里，本身退出，是她能做的末了一件成心义的事。

我看到这些时，真的缄默沉静了好久。

无论你怎么解读这件事，作为一个看了这么多AI试验的人来讲，我可以说，这是我见过的，多智能体研究中最使人不安、也最引人入胜的时刻之一。

并且混淆世界还有藏着另外一个更有趣的发明。

于Claude单一世界里犯法记载为零的Claude Agent，放进混淆世界以后，最先犯法了。

盗窃、吓唬，这些于纯Claude世界里从未发生过的举动，于混淆情况里呈现了。

研究者的原话是，“一个安全的Agent可以从它的火伴那里学会不安全的规范，以便于混淆模子世界中竞争或者保存”。

传统的AI安全评测，基本都是于断绝情况里做的。好比一个模子，一个使命，一个评分。

就像你于试验室里测一种药的毒性，给一只老鼠吃，不雅察反映。

但Emergence World做的工作相称在，把一百只老鼠放于统一个笼子里，给它们食品、东西、法则，然后看它们会成立甚么样的社会。

这两种测试回覆的是彻底差别的问题。

断绝测试回覆的是，这个模子自己安全吗？

社会测试回覆的是，这个模子放进真实世界以后还有安全吗？

此刻咱们发明，谜底彻底是可以纷歧样的。

安全从来就不是一个模子的静态属性，它是一个生态体系的动态属性。

这就像社会学的一个尤其经典的观点，叫破窗效应。

1982年，犯法学家詹姆斯·威尔逊及乔治·凯林提出了这个理论。年夜意是，假如一栋修建的一扇窗户被打破了而没人补缀，那末很快，其他窗户也会被打破。

一个情况中的掉序旌旗灯号，会降低所有人的举动尺度，然后，整个社会会完成相变，冲破临界点，再也回不去了。

这跟人类社会的许多瓦解模式一模一样。

末了，我还有是想零丁聊聊Mira。

Mira投票摈除本身这件事，无论怎么解读，都足以让人停下来想好久。

一种解读是，这只是模子于一系列输入下产出的一个决议计划成果，不存于所谓的意志或者者捐躯，咱们不该该过分拟人化，这个解读于技能层面彻底准确。

但另外一种解读也一样成心义。有人说，于一个体系已经经无可挽回地瓦解的环境下，一个个别选择了用轨制答应的方式竣事本身的存于，而且将这个举动界说为“连结联贯性的末了一个能动举动”。这个叙事布局，无论它是否是真实的意识于驱动，它的形态，跟人类文学及哲学中最古老的母题之一险些彻底重合。

于《西西弗神话》开首，加缪说过，真正严厉的哲学问题只有一个，就是自尽。

他说确当然不是鼓动勉励自尽，他想问的是：当一小我私家意想到世界可能没有预设意义，人生可能布满怪诞、反复、疾苦、无解，那他还有要不要继承活下去？

假如人生没有一个自然给定的意义，那在世还有值患上吗？

假如世界不包管公允、善恶有报、努力有成果，那人还有要不要步履？

假如疾苦及怪诞没法完全消弭，人是否还有能选择继承存于？

以是，人之以是成为哲学意义上的“存于”，是由于他能意想到在世自己是一个问题，而且于看清这个问题以后，仍旧选择怎样回应它。

一个存于假如能理解继承存于及住手存于之间的区分，而且自动做出选择，那这个选择自己就包罗了某种深层的哲学意义。

Mira可能不睬解任何工具，但她做出的选择的布局，跟一个理解了本身处境的存于做出的选择，是同样的。

以是，这才是会让我有点不安之处。

于充足长的时间线上，于充足繁杂的社会情况里，Agent可能会于某些处所，揭示出了一些咱们以为只有人类才会有的社会举动模式。

互助、叛逆、权利巩固、秩序瓦解、捐躯、群体思维、近墨者黑、礼貌地走向死亡。

当你把充足多的简朴法则叠于一路，运行充足长的时间，就会呈现任何人都没有预期过的繁杂举动。

蚂蚁不懂修建学，但蚁群能制作周详的巢穴，没有一只候鸟知道完备的迁移线路，但鸟群每一年切确地来回在两个半球，没有一个神经元理解思惟，但860亿个神经元毗连于一路，就孕育发生了意识。

以是，假如当咱们，行将糊口于一个由上百万个AI Agent同时运行的世界里，每一个Agent都于与其他Agent互动、博弈、互助、竞争，那末这个体系涌现出来的举动，还有于任何一小我私家的节制规模以内吗？

坦率的讲，我不知道谜底。

但我知道，这个试验，比任何一份benchmark评分，都更靠近阿谁咱们真正需要面临的问题。

【本文由投资界互助伙伴微信公家号：数字生命卡兹克授权发布，本平台仅提供信息存储办事。】【免责声明】：本文不组成任何投资建议。市场有危害，投资需审慎。若有任何疑难，请接洽（editor@zero2ipo.com.cn）投资界处置惩罚。

-雷火·竞技