首页财产阐发评论芯片半导体正文 百芯年夜战 一年来ASIC成长超预期,成AI竞争要害。英伟达GPU虽仍主要,但份额将被蚕食。googleTPU乐成,海内外年夜厂纷纷加年夜自研ASIC投入。 2026-02-02 08:16 ·微信公家号:锦缎海星 AI投资人解读· ASIC因能精准匹配年夜厂专属需求,且成本与功耗低,于AI武备竞赛中上风凸显,市场范围有望扩容至千亿$。googleTPU已经乐成走向外部市场,英伟达份额将被ASIC蚕食。海内外年夜厂纷纷结构自研ASIC。· 危害提醒:行业竞争加重,可能致使市场份额争取激烈;技能更新换代快,若企业不克不及和时跟上,可能面对产物掉队危害。总结:ASIC成长迅猛,市场潜力年夜,googleTPU已经获验证。海内外年夜厂踊跃投入,虽面对竞争与技能危害,但仍是AI竞争要害范畴,具有投资价值,值患上存眷其技能进展与市场拓展环境。内容由AI天生,仅供参考
一年前,咱们于《DeepSeek掀起算力革命,英伟达挑战加重,ASIC芯片悄然突起》一文中,更多的是看好ASIC带来近似博通及晶圆代工的财产时机。
一年后的今天,ASIC的成长速率远超预期。特别近半年以来,ASIC甚至逐渐成为AI竞争的胜败手:海内外年夜厂开年以来股价体现*的别离是baidu、google及阿里。
googleTPU+自研模子+云+内部运用的王炸,已经经让其立在不败之地;海内互联网年夜厂,近期被重估的只有自研ASIC芯片拆分自力IPO的baidu(规划拆分昆仑芯IPO)及阿里(规划拆分平头哥IPO)。
如今,ASIC早已经不只是纯真的财产趋向,更成为AI巨头必炼的内功。
0一、ASIC趋向比预期还有要猛
1.AI投资计划越年夜,ASIC上风就越较着
ASIC(Application Specific Integrated Circuit,专用集成电路)与GPU的焦点差异,于在ASIC是针对于特定算法及运用的“定制化优化”,而GPU则是适配多场景的“通用型选手”。
每一个年夜厂都有本身怪异的运用、模子、云及SaaS,ASIC能精准匹配这些专属需求,同时具有更低的成本与功耗上风——这也是咱们去年看好其于推理时代发作的焦点缘故原由。
当前AI武备竞赛愈演愈烈,10万美元/颗的GPU已经让年夜厂不胜重负(英伟达FY2025年总体毛利率达75.5%,净利率57%,单颗GPU成本不足3万美元)。头部厂商的AI本钱开支已经迫近千亿美元,甚至需要经由过程融资、租赁外部算力等方式弥补缺口。
性价比更高的ASIC是以变患上更为主要性:于AI算力向推理端歪斜、数据中央成本节制诉求进级的配景下,ASIC芯片依附显著经济性,正慢慢打破GPU垄断格式。
google自研芯片的乐成,无疑更是行业的一针强心剂。以是近期,超年夜范围云办事商都最先测验考试挣脱对于英伟达的依靠,加快构建本身的芯片护城河,以寻求*的TCO(总拥有成本)及供给链安全。

图:GPU与ASIC比力 资料来历:西南证券
2.AI专用芯片迈过10亿美元经济存亡线
理论上,所有范畴的芯片都该走向专用化——专用芯片的适配性与效率*,但可否落地,要害于在下流市场可否支撑昂扬的自研成本。
当前2nm芯片流片成本已经达7亿美元,加之团队搭建用度3亿美元,自研门坎高达10亿美元,这需要超100亿美元的下流市场范围才能笼罩成本。
●乐成的代表是手机,每一年全世界近5000亿美元的市场,自研主控SoC做的*的是苹果及华为,不仅降低了成本,更主要的是晋升了手机机能,支撑溢价。
●但于好比汽车智驾范畴,,因为市场空间其实不够年夜,主机厂自研其实不具有经济性,终极仍是英伟达、地平线如许的企业盘踞主流。
数据中央市场AI芯片单颗价值很是高,只需要有数百万颗出货量便可冲破经济存亡线;显然2025年最先,一个年夜厂内部采购的AI芯片数目就轻松跨越100万颗,容量已经经彻底能满意流片及昂扬的雇用用度。
仍以google为例,Techinsight数据显示,其2023年自用TPU就超200万颗,按年20亿$研发成本计较,单颗分摊成本仅几千$。
经济性的开释,直接驱动数据中央ASIC出货量连续爬升。据芯智讯援引DIGITIMES数据,ASIC出货量将进入加快通道,2027年将冲破1000万颗,靠近同期GPU 1200万颗的程度。
出货量激增将同步动员市场范围扩容,AI用ASIC有望快速发展为千亿$赛道(对于应单颗价值1万美元摆布,仅为英伟达GPU的1/5-1/10)。作为年夜厂ASIC焦点互助方,博通给出更乐不雅预期:2027年年夜客户ASIC可办事市场将达600-900亿美元;Marvell也猜测,2028年定制芯片将占数据中央加快计较市场25%的份额。

图:可办事AISC市场范围估算资料来历:Marvell
0二、GPU及ASIC之争继承,结论是英伟达难垄断
先说结论:于高速增加、求过于供的算力需求这一年夜配景下,英伟达GPU作为基石的作用仍不成替换,但其份额将逐渐被ASIC蚕食。
咱们将于持久看到持久两者共存态势:小型模子主导场景更利好GPU的矫捷性,超年夜型模子连续增加则为TPU提供增加空间。
详细缘故原由下面睁开。
1.英伟达的*,此刻靠生态、财产链优先供给
英伟达GPU是当前最昂贵的计较加快器,适配各种AI场景,客户粘性强,由于有两年夜上风。
英伟达明面上*的上风于在算法生态:CUDA生态与开发者习气形成强壁垒、同时英伟达NVLink及InfiniBand持久主导GPU互联。
以是中小模子与研发场景持久仍将以GPU为主;于年夜模子训推中,CUDA生态仍*其他方案至少一年半的时间。
2.别的一个于暗处的上风是财产链优先撑持英伟达。
就像纵然设计程度同样,苹果的芯片也至少*其他手机厂商一年,由于台积电*进的芯片产能,苹果是包圆的。
一样,英伟达因为出货量*,是财产链优先撑持的芯片厂,如:
● 代工产能优先:英伟达是台积电3nm 产能的优先互助伙伴,而google等其他厂商于CoWoS 封装、3nm 芯片产能上面对竞争劣势。
●HBM优先锁定:全世界仅3家HBM供给商(三星、海力士、美光),2026年产能已经售罄,2027年仍可能求过于供,美光已经明确暗示不会因需求增长分外扩产,致使非英伟达客户产能患上不到保障。
咱们最新相识到googleTPU于2026年上半年有跨越50%的产能缺口致使难年夜范围交付、微软Maia 200也难产,都是因为财产链产能限定。
3.但以上问题,均可以靠时间获得解决。
生态上:
●googleTPU于AI计较年支出超10亿美元超年夜型模子部署场景中已经经有成本上风了,以是将连续渗入年夜厂内部市场;
●此外,UALink、Ultra Ethernet等开放尺度正于突起,有望打破英伟达对于互联的垄断。据测算,于10万节点集群中,Ethernet架构相较英伟达InfiniBand,总拥有成本TCO最高可节省20%。
别的跟着扩产,估计上游产能于2027年慢慢放量,供给链瓶颈最先减缓。同时2027年练习与推理芯片本钱开支占比将趋近50:50,给ASIC更年夜施展本身的舞台。

图:将来互联技能选择变多资料来历:锦缎研究院总结
4.更年夜的变局是googleTPU扯开英伟达垄断的裂痕
假如说去年头咱们对于ASIC究竟是否能分患上一杯羹还有存于夷由的话,google技能及贸易闭环上的乐成,已经经完全撤销了咱们的疑虑。
googleTPU的焦点竞争力,起首源在技能层面的差异化上风。
自2016年*TPU V1发布并用在数据中央推理以来连续举行迭代,其最新的TPU v7搭载Inter-Chip Interconnect技能,可撑持至多9000个节点的超年夜范围集群,旌旗灯号损耗低。
硬件配置上,TPU采用HBM3E内存,虽于容量及单体系算力上不和英伟达产物,但功耗与以太网成本更具上风,FP4精度下每一PFLOPS每一小时成本仅0.40美元,性价比凸起。
5.实战体现是*的验证。
googleNano Banana等模子100%基在TPU完成练习与推理,也支撑其内部语音搜刮、图片搜刮等焦点功效,成本低在GPU,google内部机能体现优秀,于部门场景优在GPU。
同时乐成走向外部市场,特别是最新的V7版本:
●Meta,规划2026年租用TPU,并从2027年最先采办超100万颗、价值数十亿美元的TPU,用在Llama模子部署,经由过程以太网与功耗优化实现15%-20% TCO节省;
●OpenAI告竣互助和谈,将部门推理事情负载从英伟达芯片迁徙至TPU;
●Anthropic已经承诺于GCP集群中利用TPU练习模子,2025年10月签订100万TPU定单;
●Apple 2024年就采购TPU用其举行LLM练习;
●潜于客户:部门新兴云厂商(如Fluidstack、TeraWulf)因GCP提供付款担保而测验考试采用TPU。

图:googleTPU有清楚的线路图资料来历:浙商证券
英伟达的真正挑战者,并不是AMD、英特尔等偕行,而是google如许的跨界玩家。
咱们调研相识到,单颗TPU芯片售价估计1—1.5万美元,订价对准AMD,用意经由过程低价挤压竞争敌手,倒逼英伟达降价。仅Meta一家就可能为google带来10亿美元以上的收入。
乐不雅测算,到2027年,TPU可能抢占英伟达15%的练习市场份额:现有英伟达用户迁徙虽需时间,但新增事情负载更容易转向TPU。Semianalysis更是猜测2027年googleTPU(v6-v8)合计出货量到达600万颗。
这一猜测其实不激进——2027年推理场景占比将达50%,ASIC将负担此中50%的事情负载,对于应ASIC于算力芯片中的渗入率超20%,而googleTPU拿下此中一半份额(当前份额75%)难度不年夜。
6.来自EDA的财产链验证
上述趋向,获得了芯片行业最上游EDA范畴的两重验证。
作为整个芯片行业最上游的EDA行业,Synopsys及Cadence最新的指引为:将来EDA行业增加焦点来自苹果、google、特斯拉等“体系公司”,而不是第三方芯片设计厂;详细来讲,这种体系性客户占当前EDA营收的45%摆布,将来2-3年将超50%。
这象征着,年夜厂自研芯片,并经由过程外售摊薄成本(如google、baidu、阿里)的模式,将从本年起加快推进。
0三、google树模效应下,年夜厂纷纷豪赌自研ASIC
1.成本集约、降低功耗切合*性道理
于《马斯克说“中国将终极博得AI竞争”,有甚么深意?》一文中,咱们提到,当前AI用电还有只占美国用电的5%摆布,到2030年AI耗电占到10%,到2035年占比靠近20%,将来越发缺电。
除了了增长发电容量外,降低单芯片功耗也一样要害。ASIC对于在年夜厂而言,不单单是降低成本,还有能降低名贵的额功耗。
GPU作为通用计较芯片存于30-40%功效冗余,肯定致使功耗华侈,而ASIC可针对于特定事情负载优化,降低成本与功耗,成为年夜厂的必选。
主流ASIC于算力机能上已经基本对于齐英伟达H系列GPU,但能效比上风凸起,同代际芯片详细指标对于比:
●算力方面,英伟达H100 FP16算力为990 TFLOPS,googleTPU V6e为918 TFLOPS,AWS Trainium2为667 TFLOPS;
●功耗上,H100达700W,TPU V6e仅383W,Trainium2为500W;
●互联带宽上,H100以900GB/s*,TPU V6e为448GB/s,Trainium2为512GB/s。
2.北美年夜厂近两年加快
为搭上ASIC这班高速列车,海外云厂CSP纷纷加码自研ASIC,并依托外部芯片设计互助伙伴简化落地难度,焦点互助厂商包括Marvell、Broadcom、Alchip等。
这是因为年夜厂仅具有部门自研能力,例如google、亚马逊可完成前端设计(代码编写、综合),但物理层技能(如SerDes、互换机、相关光模块)存于高壁垒,需依靠外部成熟产物与IP,后端验证、流片等体力活也需外部撑持。

图:互助的ASIC厂商好坏势对于比 资料来历:锦缎研究院总结
google已经深耕TPU十年,前文已经有具体会商;其他北美年夜厂则是近两年加快跟上,动作最先变年夜。
亚马逊:Trainium2在2023年发布,由16颗Trainium2芯片撑持的EC2 Trn2实例,性价比相较GPU-based实例超出跨越30-40%,今朝已经办事超200位客户,笼罩运营商、航空、零售等范畴,2024年出货量年增率冲破200%,2025年估计增加70%以上,但项目有些延迟,将来将重点聚焦Trainium3芯片,投入公有云基础举措措施和电商平台AI运用。
Meta:MTIA系列专为保举推理使命设计。2024年MTIA v2采用台积电5nm工艺,TDP仅90W显著降低功耗,可高效处置惩罚社交媒体内容保举、告白优化等内部使命;2025年推出MTIA v3,将搭载HBM内存,2026年有望实现放量。
微软:2024年宣布Maia 100,采用台积电5nm工艺与CoWoS-S技能,当前承载内部10%-20%事情载荷,聚焦年夜范围AI事情负载的成本与效率优化;跟着Maia 300量产与workload适配深化,方针定制ASIC相较英伟达件成本节省80%,能耗成本降低50%,持久TCO优化达80%;
OpenAI:2024年暴光首颗芯片,将采用台积电A16工艺,专为Sora视频运用打造,且与博灵通成100亿美元互助,结合开发专属推理芯片,方针12个月内交付。
特斯拉:规划2025年末推出下一代Dojo 2芯片,机能有望媲美英伟达B200,焦点办事在Dojo练习计较机项目。xAI则是正式启动x1芯片自研,规划本年量产。

图:海外CSP巨头自研ASIC时间表资料来历:申万宏源

图:北美厂商ASIC芯片和互助伙伴梳理资料来历:东吴证券
3.海内年夜厂:芯片项目主要水平跳升
海内头部年夜厂自研ASIC的时间早在北美偕行,但此前多为小打小闹。于googleTPU验证可行性、英伟达芯片受限的两重驱动下,ASIC已经上升为焦点战略,并已经取患上阶段性结果。
baidu昆仑芯:
昆仑芯拥有15年技能堆集,一直锚定AI练习与推理加快的焦点场景,兼容CUDA生态,今朝已经迭代至第三代。
昆仑芯2024年出货量6.9万片、营收20亿,2025年估计出货13万片、营收冲35亿。对于外客户,实现万卡集群部署并中标中国挪动10亿定单,现实上外部客户是2026年高增的重要来历,已经进入中国挪动、南边电网、比亚迪、招商银行、处所智算中央等供给链。
阿里平头哥:
焦点产物线包括倚天、含光、PPU三类,此中PPU作为年夜算力芯片是市场核心,又分为两款主力产物:高端款单颗算力超300T、显存96G,采用进步前辈制程,仅以整机情势发卖,2024-2025年合计出货预计30万张,低端款采用中芯国际12nm(N+1)工艺,由灿芯卖力后道IP和接口设计,单价不超2-3万元,2026年Q1启动流片量产,估计出货50万颗。
发卖模式之内部消化为主,对于外发卖需搭配阿里云方案,无自力适配场景,2026年PPU总体出货估计80万颗。
字节跳动:字节结构CPU与ASIC两类芯片,自研进程掉队在平头哥、昆仑芯,当前采纳“外采低端芯片+推进海外研发+海内进步前辈制程列队”计谋,2026年将完成国内外进步前辈工艺设计,等候产能流片,规划2026年前实现量产。
腾讯:后发追逐,自研紧急性较强,终止对于燧原投资并重启“紫霄”自研项目,以数倍薪酬挖角*人材,需求集中于游戏、AIGC、数字孪生等范畴。
但相对于海外巨头,海内年夜厂面对更年夜的挑战,表现于几个方面:
●主业挣钱不如海外年夜厂,股东对于在内部芯片营业吃亏不满,以是阿里baidu都最先分拆上市均衡短时间吃亏与持久战略投入;
●进步前辈产能资源越发稀缺,海内因为美国的封锁,中芯国际等进步前辈制程产能求过于供;
●配套AI芯片办事厂近似博通、Marvell,因为制裁缘故原由也很难为海内企业提供定礼服务,海内相干的芯原股分、翱捷科技等于技能堆集、IP沉淀、经验上都有比力较着的差距。
0四、结语:AI竞争锚点之变
AI财产的竞争,已经从模子算法的比拼,延长到算力底层的硬核博弈。ASIC芯片依附*的能效比与成本上风,正于重塑全世界AI格式,成为巨头们修筑竞争壁垒的焦点抓手。
没有自研ASIC芯片,于这场更烧钱、更磨练综合实力的AI竞赛中,终将掉去话语权。芯片已经经内化成生态的一环了,咱们将于今后的文章中进一步睁开。
对于在海内企业而言,这既是适应财产趋向的一定选择,也是直面挑战的艰巨征程。只管于盈利能力、进步前辈产能、财产链配套等方面面对着比海外企业更严重的磨练,但自研ASIC已经是没法逃避的战略标的目的。
baidu昆仑芯的稳步起量到阿里平头哥的分拆提速,都宣告2026是海内年夜厂加快转向之年。对于此咱们是偏乐不雅的,于技能攻坚与生态构建的连续投入下,海内企业终将于全世界ASIC赛道盘踞一席之地。
【本文由投资界互助伙伴微信公家号:锦缎授权发布,本平台仅提供信息存储办事。】若有任何疑难,请接洽(editor@zero2ipo.com.cn)投资界处置惩罚。
-雷火·竞技