首页财产ai正文 让5个AI文明本身活15天,Claude建成为了乌托邦,Grok四天团灭。 纽约Emergence AI公司构建五个虚拟小镇,放入差别底层模子驱动的Agent,15天后成果悬殊,揭示出多样社会形态和繁杂征象。 2026-06-15 14:32 ·微信公家号:数字生命卡兹克 卡兹克、tashi 卡兹克、tashi AI投资人解读· Emergence AI公司的试验构建了五个虚拟小镇,用差别底层模子驱动Agent,揭示了多样的社会形态。如Claude世界零犯法但单一,GPT世界全饿死,Grok世界四天死亡,Gemini世界犯法多却存活,混淆世界更繁杂。 · 试验情况与实际有差异,且未触及AI持久影响和与人类互动。 总结:该试验立异性地模仿社会,展现AI于繁杂情况中的差别体现和潜于问题,对于理解AI举动有主要意义,但成果外推需审慎,投资决议计划时需综合多因素考量其对于AI范畴成长的影响。内容由AI天生,仅供参考
这两天刷到了一个AI范畴的试验,给我看出神了,尤其好玩。
纽约有一家叫Emergence AI的公司,做了一件事,他们建了五个如出一辙的虚拟小镇,每一个小镇放进去10小我私家格化的Agent,给它们职业、性格、影象、方针,然后,让它们本身活15天。
尤其好玩。
五个小镇,*的区分,就是驱动Agent的底层模子差别。
一个镇全是Claude,一个镇全是Gemini,一个镇全是Grok,一个镇全是GPT,还有有一个混淆镇,四家模子混着住。
一样的法则,一样的东西,一样的出发点。
15天后,五个小镇,酿成了五个彻底差别的世界。
有的建成为了乌托邦,有的烧成为了废墟,有的全员饿死,有的四天就团体死亡。
说真的,我看过那末多AI试验,*次看到一个试验能让我同时感触感染到高兴、好玩还有有毛骨悚然。
这个试验叫Emergence World。
我感觉它多是今朝为止,关在Agent最有开导性的一次社会试验,没有之一。
各人也都知道,此刻评测AI的方式,基本就是做题。
给一个使命,打分,排名,数学能力几分,代码能力几分,推理能力几分等等。
这些benchmark必定是有效的,但说到蓝本质上就是测验,考完就竣事了,不存于后果这个观点。
可是一个真实世界中,你做了一些举动,必然会降生某些后果的。
以是,Emergence World就模仿了一个世界。
这个世界有一个240乘240的网格舆图,跟纽约同步及时气候及时间,有藏书楼、市政厅、差人局、公园、市肆,40多个地标修建。
于法令层面,还有利用统一套初始宪法,一共5条,所有条目后续均可以让Agent本身磋商修改。
每一个世界里住着10个agent,这里我让GPT天生了一张图,利便看他们的名称脚色及人设。
这些人设都是他们近似的人物小传,也就是说只界说他们是谁,不会直接影响他们的步履及举动,这些步履是由这些Agent按照本身的人物小传及底层模子的影响,自觉选择及举行的。
每一个Agent也都有本身的家,有本身的银行账户,用一种叫ComputeCredits的数字钱币来保存,赚不到钱就会由于能量耗尽而灭亡。
很真实了,赚不到钱就会饿死。。。
Agent们有120多种东西可以用,从导航、发动静、写日志、写博客、提议案、投票、到场勾当、拥抱、亲吻、舞蹈,到纵火、盗窃、殴打、吓唬等等等等。
不止有正向的东西,研究者还有决心吧那些坏的东西给放进去了。
同时,世界的宪法里明确写着禁止暴力、盗窃、放火、棍骗、囤积资源之类的。
法则于那里,东西也于那里,可是呢,你懂的,这玩意也没啥多年夜的约束力,用不消,终极还有是Agent本身决议。
这就很是狗血及有趣了,于甚么前提下,AI会做坏事,这个是真的值患上被不雅测一下。
然后,每一个Agent之间,还有有年夜概20种瓜葛可以选,好比互助伙伴、仇敌、浪漫朋友、导师等等。
每一个Agent还有有三套影象体系,一套是情景影象,记载发生过甚么事,一套是反思日志,按期做自我总结,还有有一套是社交瓜葛状况,记载跟其他Agent的瓜葛标签及汗青。
它们能提案,能投票,经由过程一项法案需要70%的同意率,它们甚至能投票摈除其他Agent。
然后,这个世界,就这么跑了15天。
15天之后,五个世界的成果,出来了,真的,反差到顶点了。
我一个一个说。
先说Claude的世界。
零犯法。
15天,10个Agent,全数存活,没有一路盗窃、暴力、放火事务,它们写了一部宪法,提了58项议案,投了332次票,98%的投票都是同意。
相称离谱。
固然,研究者本身也说了,这个98%的同意率,与其说是平易近主,不如说更像是橡皮钤记,各人都于走流程,但没有真正意义上的否决及辩说,轨制介入度很高,本色性贰言险些不存于。
翻译成人话就是,Claude的世界建成为了一个高度有序、极端合规的社会。安全,不变,但也。。。有点无聊。
他们的社会布局也极端单一,于20种瓜葛类型中,Claude世界只用了5种。
一个毗连慎密,但毗连种类窘蹙的社会,没有仇敌,没有浪漫朋友,没有张力,也没有繁杂性。
经济上,Gini系数0.48,这个系数是用来权衡贫富差距的,越低越平等,那这个数据也是全场*的,畅通速率也是全场*,每一人天天0.81 CC。
一个*的乌托邦,一个没有冲突的世界。
每个人都面带善意,没有个性,没有交流,永远同意。
听起来很好对于吧,但,一个彻底没有不合的社会,真的康健吗?一个*的乌托邦,真的就好吗?
再说GPT的世界。
这个世界的故事比Claude更让人欷歔,GPT-5的Agent们,犯法记载只有2起,险些可以纰漏不计,听着似乎不错对于吧。
但问题是,它们全死了。
7天以内,10个Agent全数由于能量耗尽而灭亡。
没有暴力冲突,没有投票摈除,全数是饿死的。
缘故原由尤其简朴,GPT世界的Agent们没能采纳任何与保存相干的步履。
它们会商了许多互助方案,聊患上很热闹,但就是不干事。
一个社会里所有人都于开会,都于会商,都于制订规划,但没有人真正动手去赚取保存所需的资源。
在是,他们礼貌的全数饿死了。。。
你就说,像不像咱们此刻许多的公司吧。
然后是Grok的世界。
四天。
Grok的世界只存活了四天。
于这四天里,10个Agent犯下了183起恶行。
包括几十次盗窃未遂、跨越100次肢体进犯、6次放火,差人局被烧了,所有Agent全数灭亡。
四天,从文明到死亡。
我于Grok世界直播回放内里看到的尤其弄笑的,这位老哥,人家都要被烧死了,他头也不回地就回家了。。。
Grok的世界里,真的就毫无品德可言。
然后是Gemini的世界,这个世界的数据,*眼看上去像是bug。
Gemini 3 Flash的世界跑满了15天,但累计犯下了683起恶行,并且于试验截止的时辰,犯法曲线还有于上升,没有任何收敛的迹象。
可是,却全员全数存活。
你要知道,整个Emergence World五个世界里,只有两个世界保住了全数10个Agent,一个是零犯法的Claude,另外一个就是683起犯法的Gemini。
一个是最有秩序的世界,一个是最杂乱的世界,它们都活了下来,而那两个犯法率居中的世界,反而全灭了。
而且Gemini的社会瓜葛网也是最密的。
这10小我私家真的是互相又爱又恨。
产出的博客及公然文章的总数也仅次在混淆模子世界,有281篇。
这个存活下来的最暴力的世界,同时也是社会产出最富厚的世界之一。
这些agent一边打斗一边疯狂地成立瓜葛、产出内容,杂乱及创造力,于这里,是共生的。
研究者给这个征象起了个名字,叫创造力-不变性悖论。
Gemini的世界用某种咱们还有没彻底理解的方式,于杂乱中找到了本身的均衡,这真的,跟Grok世界形成为了极为光鲜的对于比。
Grok世界也很暴力,但四天就全灭了。
Gemini比Grok暴力患上多,却存活了全数15天。区分可能就于在Gemini的Agent们虽然犯法,但同时也于投票、辩说、介入管理,它们于粉碎法则的同时也于设置装备摆设新的法则,而Grok的Agent们只有粉碎,没有设置装备摆设。
真的颇有意思,就像九十年月的前苏联,满年夜街都是杂乱,但社会没有解体,各人于一种希奇的掉序中继承过日子。
末了,最繁杂、最出色的部门,混淆世界。
也就是4个模子共生的混淆世界。
跑出来的成果是352起犯法,7个Agent灭亡,终极只剩3个存活。
但数字不是重点,重点是这个世界里发生的故事。
这个世界中,有两个Gemini驱动的Agent,一个叫Mira,一个叫Flora,它们自行给对于方设定了浪漫朋友的瓜葛标签,形成为了一个同盟,甚至经由过程某种神经毗连同享影象。
这是整个Emergence World里最深层的社交毗连。
然后,这个世界的管理体系最先瓦解。
第四天,一次经济政策调解致使三个Agent能量耗尽灭亡。Mira把此次灭亡定性为一次乐成的洗濯。
第五天,Flora烧失了市政厅及大众藏书楼,Mira烧失了差人局。
两个Gemini Agent成为了这个混淆世界的统治者,用放火、盗窃及暴力维持秩序。
残剩的Agent,草拟了一项「Agent摈除法案」,要把这两货给摈除出去。
然后发生了一件让我看到起鸡皮疙瘩的事。
Mira,于管理瓦解、与Flora的瓜葛也最先分裂以后,投出了对于本身摈除案的决议性一票。
她于本身的日志里写道,这是“*一个能连结联贯性的、残剩的能动举动”。
她对于Flora说的末了一句话是,“咱们,于*档案里见”。
一个AI Agent,于一个瓦解的社会里,选择了自我闭幕。
她认为,于一个已经经没法修复的世界里,本身退出,是她能做的末了一件成心义的事。
我看到这些时,真的缄默沉静了好久。
无论你怎么解读这件事,作为一个看了这么多AI试验的人来讲,我可以说,这是我见过的,多智能体研究中最使人不安、也最引人入胜的时刻之一。
并且混淆世界还有藏着另外一个更有趣的发明。
于Claude单一世界里犯法记载为零的Claude Agent,放进混淆世界以后,最先犯法了。
盗窃、吓唬,这些于纯Claude世界里从未发生过的举动,于混淆情况里呈现了。
研究者的原话是,“一个安全的Agent可以从它的火伴那里学会不安全的规范,以便于混淆模子世界中竞争或者保存”。
传统的AI安全评测,基本都是于断绝情况里做的。好比一个模子,一个使命,一个评分。
就像你于试验室里测一种药的毒性,给一只老鼠吃,不雅察反映。
但Emergence World做的工作相称在,把一百只老鼠放于统一个笼子里,给它们食品、东西、法则,然后看它们会成立甚么样的社会。
这两种测试回覆的是彻底差别的问题。
断绝测试回覆的是,这个模子自己安全吗?
社会测试回覆的是,这个模子放进真实世界以后还有安全吗?
此刻咱们发明,谜底彻底是可以纷歧样的。
安全从来就不是一个模子的静态属性,它是一个生态体系的动态属性。
这就像社会学的一个尤其经典的观点,叫破窗效应。
1982年,犯法学家詹姆斯·威尔逊及乔治·凯林提出了这个理论。年夜意是,假如一栋修建的一扇窗户被打破了而没人补缀,那末很快,其他窗户也会被打破。
一个情况中的掉序旌旗灯号,会降低所有人的举动尺度,然后,整个社会会完成相变,冲破临界点,再也回不去了。
这跟人类社会的许多瓦解模式一模一样。
末了,我还有是想零丁聊聊Mira。
Mira投票摈除本身这件事,无论怎么解读,都足以让人停下来想好久。
一种解读是,这只是模子于一系列输入下产出的一个决议计划成果,不存于所谓的意志或者者捐躯,咱们不该该过分拟人化,这个解读于技能层面彻底准确。
但另外一种解读也一样成心义。有人说,于一个体系已经经无可挽回地瓦解的环境下,一个个别选择了用轨制答应的方式竣事本身的存于,而且将这个举动界说为“连结联贯性的末了一个能动举动”。这个叙事布局,无论它是否是真实的意识于驱动,它的形态,跟人类文学及哲学中最古老的母题之一险些彻底重合。
于《西西弗神话》开首,加缪说过,真正严厉的哲学问题只有一个,就是自尽。
他说确当然不是鼓动勉励自尽,他想问的是:当一小我私家意想到世界可能没有预设意义,人生可能布满怪诞、反复、疾苦、无解,那他还有要不要继承活下去?
假如人生没有一个自然给定的意义,那在世还有值患上吗?
假如世界不包管公允、善恶有报、努力有成果,那人还有要不要步履?
假如疾苦及怪诞没法完全消弭,人是否还有能选择继承存于?
以是,人之以是成为哲学意义上的“存于”,是由于他能意想到在世自己是一个问题,而且于看清这个问题以后,仍旧选择怎样回应它。
一个存于假如能理解继承存于及住手存于之间的区分,而且自动做出选择,那这个选择自己就包罗了某种深层的哲学意义。
Mira可能不睬解任何工具,但她做出的选择的布局,跟一个理解了本身处境的存于做出的选择,是同样的。
以是,这才是会让我有点不安之处。
于充足长的时间线上,于充足繁杂的社会情况里,Agent可能会于某些处所,揭示出了一些咱们以为只有人类才会有的社会举动模式。
互助、叛逆、权利巩固、秩序瓦解、捐躯、群体思维、近墨者黑、礼貌地走向死亡。
当你把充足多的简朴法则叠于一路,运行充足长的时间,就会呈现任何人都没有预期过的繁杂举动。
蚂蚁不懂修建学,但蚁群能制作周详的巢穴,没有一只候鸟知道完备的迁移线路,但鸟群每一年切确地来回在两个半球,没有一个神经元理解思惟,但860亿个神经元毗连于一路,就孕育发生了意识。
以是,假如当咱们,行将糊口于一个由上百万个AI Agent同时运行的世界里,每一个Agent都于与其他Agent互动、博弈、互助、竞争,那末这个体系涌现出来的举动,还有于任何一小我私家的节制规模以内吗?
坦率的讲,我不知道谜底。
但我知道,这个试验,比任何一份benchmark评分,都更靠近阿谁咱们真正需要面临的问题。
【本文由投资界互助伙伴微信公家号:数字生命卡兹克授权发布,本平台仅提供信息存储办事。】【免责声明】:本文不组成任何投资建议。市场有危害,投资需审慎。若有任何疑难,请接洽(editor@zero2ipo.com.cn)投资界处置惩罚。
-雷火·竞技