
据《钞票》杂志官网近日报谈称,主要面向东谈主工智能(AI)推理任务应用的晶圆级AI芯片厂商Cerebras Systems告示,其旗下晶圆级AI芯片(应该是指WSE-3)扩充700亿个参数的DeepSeek-R1中型模子的速率,要比现时最快的GPU还要快57倍。
Cerebras Systems CEO Andrew Feldman受访时暗意,企业客户对中国AI大模子厂商DeepSeek最新推出的R1推理模子极为关切。他说DeepSeek-R1发布十天后,“咱们招待了暴增的需求。”
凭证官方府上泄漏,WSE-3仍是是选拔了一整张12英寸晶圆来制作,基于台积电5nm制程,芯单方面积为46225普通毫米,领有的晶体管数目达到了4万亿个,领有90万个AI中枢,44GB片上SRAM,合座的内存带宽为21PB/s,结构带宽高达214PB/s。使得WSE-3具有125 FP16 PetaFLOPS的峰值性能,比拟上一代的WSE-2耕作了1倍。
DeepSeek-R1推理模子以极低查验资本,炒黄金就赢得了性能失色OpenAI 等竞争敌手的发轫进的推理模子的性能,对现存时期阶梯具有颠覆性,而况DeepSeek还将该模子进行了开源,这也使得全球的科技厂商皆大概快速诳骗该模子来构建我方的AI应用,干系AI芯片厂商也大概快速的针对该模子进行适配和优化,以充分诳骗AI芯片的性能,即就是英伟达AI GPU除外的AI芯片也能从中获益。
为示范Cerebras的AI工作器扩充DeepSeek-R1速率,股票配资代理Andrew Feldman现场提示模子以Python说话撰写海外象棋游戏,只花1.5秒便可完成,比拟之下OpenAI最新发布的 o1-mini 推理模子却要花22秒才调用传统GPU完成调换任务。但因OpenAI模子属顽固系统,无法径直在Cerebras硬件测试,故难透顶平等的进行比较。
不外,Andrew Feldman仍强调,数学与花式任务,DeepSeek-R1施展较OpenAI-o1优异。对些类型任务,“你能更快赢得精准谜底。”
但由于R1是中国的大模子时期厂商DeepSeek所拓荒,因此也激发了泰西列国基于政事身分而以阴私安全等问题为由进行发难。好意思国国会已入部下手立法,拟全面龙套来自中国的先进AI模子。好意思国国防部、国会、舟师、NASA以及德克萨斯州已接踵龙套在政府官方建筑上使用DeepSeek模子。
Andrew Feldman也暗意,DeepSeek推出的基于其AI大模子的AI聊天应用是全天下最受迎接的APP,若径直使用,数据例必会被传回中国。因此,他要大师“别这样作念”,提议取舍好意思国企业托管的大型说话模子(LLM),举例Cerebras、Perplexity等业者。
诚然Feldman坦言DeepSeek如实有些潜在风险,但使用者只需保抓基本判断力即可。他比方“当你用电锯时,应衣裳钢头靴和护目镜。但不代表不应用电锯,而是要严慎使用。”
牵扯剪辑:鹿角