新研究：DeepSeek仅硬件成本就超过5亿美元

最新报告称，中国初创科技公司DeepSeek（深度求索）的硬件成本应该远高于5亿美元。此外，其研发成本和总拥有成本应该也很高。

半导体研究和咨询公司SemiAnalysis在1月31日发表的一份研究报告中说，DeepSeek仅在GPU方面的硬件支出就超过五亿美元，服务器总资本支出约为16亿美元，其中高达9.44亿美元用于运行其芯片集群。

据悉，DeepSeek的主要投资方“幻方量化”（High-Flyer）早在2021年美国出口管制生效前，就囤积了一万块英伟达（Nvidia，辉达）的A100 GPU。

600万美元研发出媲美OpenAI 专家斥假新闻

硅谷科技投资公司Altimeter Capital创始人布莱德‧格斯特纳（Brad Gerstner）在X平台发帖直接说，报导DeepSeek用不到600万美元就研发出媲美OpenAI、Anthropic等美国公司耗资数十亿的AI工具，这是“假新闻”。

因为哪怕就是一对一来比对，也不是这个结果。首先，OpenAI并未公开其AI产品“o1”的研发投入。根据格斯特纳的推测，“o1”成本在1500万美元左右，所以要比较OpenAI与DeepSeek的训练成本，应该是1500万美元 v.s 600万美元。

其次，考虑到DeepSeek的发布时间比OpenAI晚了接近一年，成本理应降低50%以上。

根据科技公司Anthropic的最新报告，DeepSeek的性能落后他们7—10个月。按照常理，随着技术成本下降，每年会带来3—4倍的效率改进。

格斯特纳告诉CNBC，也就是说，DeepSeek只能算普遍符合预期，“这不是一个重大的价格突破”。

低成本宣传酿恐慌导致美股暴跌

DeepSeek的研究人员2024年12月在公开网站alphaXiv发表了一篇论文称，他们即将在1月10日推出的DeepSeek-V3模型在多项数据上超越国内外一众大模型产品，但他们使用的是英伟达的非高端H800芯片训练，且训练成本仅557万美元。

随后，他们在1月20日又发布推理模型DeepSeek-R1，称性能比肩OpenAI o1正式版。

刚开始，关于DeepSeek与OpenAI的ChatGPT的信息和搜索活动在X上只出现了小幅飙升，但到了1月24日开始出现了大涨，并在周末持续上涨。

纽约在线分析公司Graphika在一份提交给美国政府的报告中指出，大量中共网军在美国社交媒体炒作DeepSeek（深度求索）的消息，包括中共外交人员、大使馆和官方媒体。这些网军除试图放大关于DeepSeek的新闻报导，它们也宣传“DeepSeek挑战美国在AI领域主导地位”的说法。

1月27日，DeepSeek登上苹果美国应用商店下载排行榜榜首。在媒体片面报导DeepSeek的低成本训练后，外界对英伟达最快最强芯片的必要性和竞争力，以及对科技公司天价投资AI模型和数据中心产生了质疑。芯片制造商英伟达和博通（Broadcom）当日市值蒸发约8000亿美元。

训练成本与研发成本有别

不过，即便是DeepSeek自己的报告也注明了，不到600万的成本仅包括DeepSeek-V3的正式训练（只计算了英伟达图形处理单元的租赁价格），并不包括与架构、算法或数据方面的先前研究和实验相关的所有其它成本。

训练成本往往跟整个研发成本不成比例。比如Anthropic的Claude 3.5 Sonnet训练成本“高达数千万美元”，但为此它需要从亚马逊和谷歌筹集数十亿美元。

“这是因为他们必须进行实验，提出新的架构，收集和理清数据，支付员工工资等等。”SemiAnalysis的报告也说。

伯恩斯坦研究公司美国半导体和半导体资本设备董事总经理、高级分析师斯泰西‧拉斯贡（Stacy Rasgon）在一份报告中更直言，DeepSeek的训练成本数字具有很大的误导性。

“DeepSeek真的‘以五百多万美元创立了OpenAI’吗？当然不是。”他质疑道。

美国资本公司Archerman Capital指出，Meta和OpenAI等花钱多是因为前沿探路，探路就意味着就会有浪费，而后发追赶是站在别人的肩膀上，当然可以避开很多浪费。

“打个不恰当的比方，创新药的研发需要十年几十亿美元，而仿制药的研发一定会更快更省，另外成本的统计口径也没有统一的标准，可以有很大的差别。”报告写道。

(大纪元: https://www.epochtimes.com/gb/25/2/1/n14427531.htm)