撰文:Techub News 整理
近日,AI芯片初创公司Cerebras Systems提交了IPO申请,计划融资高达48亿美元,其股票在发行前便获得了20倍的超额认购,成为今年最受瞩目的科技IPO之一。在最新一期的Limitless Podcast节目中,主持人们深入探讨了Cerebras独特的技术路径、与OpenAI的深度绑定,以及其IPO对整个AI硬件竞争格局可能带来的深远影响。
“整张披萨”的芯片:Cerebras的颠覆性架构
要理解Cerebras为何备受关注,首先要理解其芯片设计的根本性创新。传统芯片制造如同将一张硅晶圆(wafer)——其大小约如餐盘——切割成许多小块,每一小块成为一个独立的芯片。而Cerebras的创始人提出了一个看似简单却极为大胆的问题:如果不切割这张“披萨”,把整个晶圆作为一个巨大的芯片会怎样?
他们做到了。Cerebras的“晶圆级引擎”(Wafer-Scale Engine, WSE)正是这样一个“整张披萨”式的芯片。这种设计带来了数量级的提升:最新一代WSE-3芯片集成了高达4万亿个晶体管,而英伟达当前旗舰的Blackwell GPU芯片的晶体管数量约为2080亿个。巨大的物理尺寸差异带来了本质的性能优势。
关键在于,将所有计算核心和内存集成在单一的巨大芯片上,极大地缩短了数据在不同组件间传输的距离和延迟。传统GPU架构中,计算单元需要频繁访问独立且相对较远的高带宽内存(HBM),这构成了性能瓶颈。而Cerebras将海量的静态随机存取存储器(SRAM)直接集成在芯片上,使得数据访问速度呈指数级提升。
这种架构带来的直接效益在AI推理(inference)任务上体现得尤为淋漓尽致。推理指的是训练完成的AI模型处理实际请求(如回答问题、生成代码)的过程。随着AI应用从训练转向大规模部署,推理的速度和成本变得至关重要。根据摩根大通的最新报告,未来AI推理市场的规模预计将是训练市场的10到50倍。
“这不仅仅是理论概念,”主持人在节目中强调,“OpenAI大约半年前向Cerebras投资了100亿美元,并获得了其芯片设计的优先使用权。”这种合作已经落地:OpenAI世界领先的代码AI模型Codex,其“快速模式”——GPT Codex Spark——就运行在Cerebras的芯片上,实现了接近零延迟的响应速度。对于需要快速迭代的软件工程师或分秒必争的金融交易场景,这种速度优势意味着巨大的价值。
IPO狂热:48亿美元与英伟达王座的挑战
Cerebras的IPO规模之大,超出了最初的预期。公司最初计划融资35亿美元,每股定价约115美元。但由于机构投资者需求极其旺盛,出现了20倍的超额认购。公司随即修订条款,增发200万股,并将股价提升至150美元,使得总融资额达到约48亿美元。
这一现象传递出一个强烈信号:市场对AI硬件公司的渴求已近“饥渴”状态。主持人将Cerebras的IPO视为一系列重磅AI公司上市的“第一张多米诺骨牌”,后续可能还有SpaceX、OpenAI、Anthropic、Databricks等公司排队入场,潜在市值总和可达数万亿美元。
此次IPO的核心叙事,是Cerebras作为英伟达在AI芯片领域垄断地位的“第一个真正威胁”。长期以来,英伟达凭借其GPU和CUDA生态构筑了几乎不可逾越的护城河,市值高达5.3万亿美元。然而,其成功也暴露了自身架构的局限性,尤其是在推理优化方面。
Cerebras的挑战并非孤例。就在上周,谷歌发布了其自研的第五代张量处理单元(TPU),并用以训练其Gemini模型,其性能表现甚至在某些方面超越了英伟达的GPU。谷歌的市值也因此一度超越英伟达。这表明,英伟达的护城河并非绝对坚固,新的架构创新正在动摇其根基。
“关键在于推理与训练的范式转变,”主持人分析道,“过去十年,人们认为AI训练是赚钱的地方,英伟达也深耕于此。但最近的变化是,训练之后发生的事情——即模型如何被亿万用户查询和使用——价值更大。推理才是未来价值所在,而Cerebras正精准地切入这一点。”
英伟达自身的行为也印证了这一趋势。其以200亿美元收购另一家专注于推理优化的芯片公司Grok,正是对Cerebras所代表技术方向的变相认可。
SRAM vs. DRAM:速度与成本的终极权衡
Cerebras芯片性能飞跃的核心技术秘密,在于其对静态随机存取存储器(SRAM)的极致运用,这与主流GPU使用的高带宽内存(HBM,基于动态随机存取存储器DRAM)形成了鲜明对比。
主持人用了一个生动的比喻:SRAM类似于固态硬盘(SSD),而DRAM更像是机械硬盘(HDD)。DRAM(HBM)容量大、成本相对较低、易于扩展,是目前几乎所有GPU的选择。但它有一个致命缺点:为了保持数据不丢失,需要不断“刷新”,这带来了额外的延迟和功耗。
SRAM则完全不同。只要持续供电,它就能无限期地保存数据,无需刷新,因此访问速度极快、能效更高。Cerebras将海量的SRAM(其WSE-3芯片集成高达44GB的片上SRAM)与计算核心紧密集成,实现了超低延迟的数据供给,这正是其推理速度惊人的根本原因。
当然,这种优势并非没有代价。SRAM成本高昂,且在同一面积上集成的密度远低于DRAM,这也是Cerebras芯片必须做得如此巨大的原因之一——它需要足够的物理空间来容纳海量的SRAM。这也导致了其芯片成本极高。
“但想想看,如果你的AI模型迭代速度能快上数倍甚至数十倍,能为你创造的价值是多少?”主持人提出了关键问题。对于对冲基金而言,快几毫秒的量化交易算法可能价值数十亿美元;对于拥有数百万用户的企业级应用,更快的响应意味着更好的用户体验和更高的收入。因此,为极致速度支付溢价,在AI推理这个高价值战场上,可能是一笔划算的交易。
性能数据支撑了这一论断。根据节目引用的基准测试,在运行Llama 3.1(一个700亿参数模型)时,Cerebras芯片的推理速度比英伟达最新的Blackwell旗舰芯片快20倍。对于越来越依赖“深度思考”和长链推理的AI智能体(Agent)而言,这种速度优势将直接转化为更强的能力。
机遇与隐忧:亢奋市场中的冷思考
尽管前景一片光明,但主持人对Cerebras的IPO也保持着审慎的观察,指出了几个潜在的风险点。
首先是高昂的估值。Cerebras此次IPO的估值倍数高达51倍营收,相比之下,许多大型科技公司的营收倍数通常在20倍左右。如此高的溢价意味着,上市后短期内股价可能会出现波动,甚至回调。主持人提醒,典型的IPO首日涨幅在30%到80%之间,零售投资者如果追高买入,可能面临价格压力。
其次是客户集中度与潜在的竞争。Cerebras目前最大的客户和战略合作伙伴是OpenAI,后者不仅进行了巨额投资,其联合创始人Sam Altman(萨姆·奥尔特曼)和Greg Brockman(格雷格·布罗克曼)也个人投资了Cerebras。这种深度绑定是巨大的优势,但也构成了风险。
一个关键的疑问是:OpenAI自身也在与博通、联发科等公司合作,开发自研的AI推理芯片。Sam Altman(萨姆·奥尔特曼)曾明确表示,解决推理问题是其核心目标之一。那么,Cerebras对OpenAI而言,究竟是一个长期的战略伙伴,还是一个过渡性的解决方案?未来OpenAI是否会逐渐弃用Cerebras的芯片?这是悬在Cerebras头上的达摩克利斯之剑。
此外,Cerebras还需要面对英伟达CUDA生态系统的强大护城河。无数AI开发者和企业已经深度融入CUDA的软件栈,迁移到新的硬件平台需要时间和成本。
不过,Cerebras也在积极构建自己的生态和分销渠道。除了OpenAI,其芯片也已集成到亚马逊的AWS Bedrock平台中。亚马逊AWS几乎垄断了企业级云计算市场,这为Cerebras提供了至关重要的分销渠道。
“所以,分销问题解决了,从0到1的SRAM技术创新解决了,通过OpenAI的消费者渠道也打通了,”主持人总结道,“所有这些听起来都非常乐观,但估值和长期客户关系仍是需要关注的风险。”
AI芯片战局新纪元:推理为王时代的开启
Cerebras的IPO不仅仅是一家公司的上市,它更是一个强烈的行业信号:AI硬件竞赛进入了一个以推理性能为核心的新阶段,而单一的垄断格局正在被打破。
随着OpenAI、Anthropic等AI巨头不断刷新营收纪录(节目中提及Anthropic年化营收已达450亿美元,并目标在年底达到1000亿美元),对更高效、更快速推理硬件的需求只会越来越迫切。谁能更快地生成token(AI输出的基本单位),谁就能在未来的AI应用生态中占据主导。
“假设我们继续需要token,并且这些token能够产生利润,那么那些能够比其他人更快地分发和生产这些token的人将会获胜。”主持人如是说。这个简单的逻辑,正是支撑Cerebras及其投资者信心的底层逻辑。
Cerebras以其“披萨芯片”的极端物理形态,开辟了一条区别于传统GPU的差异化技术路径。它的成功与否,将检验市场是否愿意为极致的推理速度支付高昂溢价,也将测试英伟达的护城河究竟有多深。无论结果如何,Cerebras的登场,已经为波澜壮阔的AI芯片战争,增添了一个充满变数且令人兴奋的新角色。其IPO的表现,将成为观测整个AI投资热潮温度的关键风向标。
免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。