


“不作念 GPU,只作念速率。”
作家丨姚单
{jz:field.toptypename/}裁剪丨余快
雷峰网独家获悉,国内一家专注超快流式推理芯片的创业公司——「寒序科技」布告完成数千万元融资,投资方为启高成本、赛意产业基金,源合成本担任本轮独家财务照管人。
客服QQ:88888888此前,寒序科技一直较为低调,其AI推理系列(SpinPU-E Series)产物的关系分解在往日两年间并未对外系统表示。
知情东谈主士走漏,寒序科技首颗芯片样片回片测试后果“相称理思”,要害方针中,其「单元面积带宽」与Groq LPU(Language Process Unit,言语贬责单元)表示一致,a8体育官方网站达到惊东谈主的100 GB/s/mm^(2),这是掂量AI芯片推感性能的最首要方针,亦然直指2000Tokens/s的底气。
在业内看来,这类能力决定了大模子(LLMs)推理时能否实在把“流式输出”、“高Tokens/s”作念出来。要害的是,这家公司下一代芯片依然在流片中,米兰app官网以“片上MRAM+SRAM”和“详情趣流式乘加单元”,目的性能指向夸张的2000Tokens/s+,反不雅现在主流对话模子推理速率仅约30-50Tokens/s。
在现时推理芯片竞争中,这真的是最具辨识度的硬方针之一。也因此,接近神色的东谈主士将其评价为:国内少有的、实在沿着Groq标的往下打的团队。
值得看重的是,业内近期多量别传,NVIDIA已以约200亿好意思元估值级别锁定Groq的推理时刻互助,并有野心在NVIDIA GTC 2026行将发布的新一代AI推理系统中继承Groq芯片瞎想。寒序决议被业界以为是最迫临该决议的超大带宽流式贬责芯片。
与GPU阶梯不同,这家公司礼聘的是更聚焦、更极致的产物界说:不卷大而全,不卷通用稽察,而把资源压到推理速率上,核热沈念四个字——唯「快」不破。
寒序科技成就于2023年8月,源于国内磁学连络首要高地「北京大学磁学中心」。中枢团队是国内首个有能力跑通从物理、材料、器件到异质集成、芯片瞎想、算法的交叉团队。
有接近本轮融资的东谈主士告诉雷峰网,这家公司之是以近期启动对外开释信息,一个首要布景是:其要害时刻与样片考证依然走过最危急阶段。现在,该公司新一轮融资也已在鞭策中。
更多创业神色,添加微信ydinitialheart了解。






