最新报告称,中国初创科技公司DeepSeek(深度求索)的硬件成本应该远高于5亿美元。此外,其研发成本和总拥有成本应该也很高。
半导体研究和咨询公司SemiAnalysis在1月31日发表的一份研究报告中说,DeepSeek仅在GPU方面的硬件支出就超过五亿美元,服务器总资本支出约为16亿美元,其中高达9.44亿美元用于运行其芯片集群。
据悉,DeepSeek的主要投资方“幻方量化”(High-Flyer)早在2021年美国出口管制生效前,就囤积了一万块英伟达(Nvidia,辉达)的A100 GPU。
600万美元研发出媲美OpenAI 专家斥假新闻
硅谷科技投资公司Altimeter Capital创始人布莱德‧格斯特纳(Brad Gerstner)在X平台发帖直接说,报导DeepSeek用不到600万美元就研发出媲美OpenAI、Anthropic等美国公司耗资数十亿的AI工具,这是“假新闻”。
因为哪怕就是一对一来比对,也不是这个结果。首先,OpenAI并未公开其AI产品“o1”的研发投入。根据格斯特纳的推测,“o1”成本在1500万美元左右,所以要比较OpenAI与DeepSeek的训练成本,应该是1500万美元 v.s 600万美元。
其次,考虑到DeepSeek的发布时间比OpenAI晚了接近一年,成本理应降低50%以上。
根据科技公司Anthropic的最新报告,DeepSeek的性能落后他们7—10个月。按照常理,随着技术成本下降,每年会带来3—4倍的效率改进。
格斯特纳告诉CNBC,也就是说,DeepSeek只能算普遍符合预期,“这不是一个重大的价格突破”。
低成本宣传酿恐慌 导致美股暴跌
DeepSeek的研究人员2024年12月在公开网站alphaXiv发表了一篇论文称,他们即将在1月10日推出的DeepSeek-V3模型在多项数据上超越国内外一众大模型产品,但他们使用的是英伟达的非高端H800芯片训练,且训练成本仅557万美元。
随后,他们在1月20日又发布推理模型DeepSeek-R1,称性能比肩OpenAI o1正式版。
刚开始,关于DeepSeek与OpenAI的ChatGPT的信息和搜索活动在X上只出现了小幅飙升,但到了1月24日开始出现了大涨,并在周末持续上涨。
纽约在线分析公司Graphika在一份提交给美国政府的报告中指出,大量中共网军在美国社交媒体炒作DeepSeek(深度求索)的消息,包括中共外交人员、大使馆和官方媒体。这些网军除试图放大关于DeepSeek的新闻报导,它们也宣传“DeepSeek挑战美国在AI领域主导地位”的说法。
1月27日,DeepSeek登上苹果美国应用商店下载排行榜榜首。在媒体片面报导DeepSeek的低成本训练后,外界对英伟达最快最强芯片的必要性和竞争力,以及对科技公司天价投资AI模型和数据中心产生了质疑。芯片制造商英伟达和博通(Broadcom)当日市值蒸发约8000亿美元。
训练成本与研发成本有别
不过,即便是DeepSeek自己的报告也注明了,不到600万的成本仅包括DeepSeek-V3的正式训练(只计算了英伟达图形处理单元的租赁价格),并不包括与架构、算法或数据方面的先前研究和实验相关的所有其它成本。
训练成本往往跟整个研发成本不成比例。比如Anthropic的Claude 3.5 Sonnet训练成本“高达数千万美元”,但为此它需要从亚马逊和谷歌筹集数十亿美元。
“这是因为他们必须进行实验,提出新的架构,收集和理清数据,支付员工工资等等。”SemiAnalysis的报告也说。
伯恩斯坦研究公司美国半导体和半导体资本设备董事总经理、高级分析师斯泰西‧拉斯贡(Stacy Rasgon)在一份报告中更直言,DeepSeek的训练成本数字具有很大的误导性。
“DeepSeek真的‘以五百多万美元创立了OpenAI’吗?当然不是。”他质疑道。
美国资本公司Archerman Capital指出,Meta和OpenAI等花钱多是因为前沿探路,探路就意味着就会有浪费,而后发追赶是站在别人的肩膀上,当然可以避开很多浪费。
“打个不恰当的比方,创新药的研发需要十年几十亿美元,而仿制药的研发一定会更快更省,另外成本的统计口径也没有统一的标准,可以有很大的差别。”报告写道。
(大纪元: https://www.epochtimes.com/gb/25/2/1/n14427531.htm)