1 月 20 日,中国相对不知名的人工智能研究实验室 DeepSeek 发布了一个开源模型,该模型很快成为硅谷的热门话题。根据该公司撰写的一篇论文,DeepSeek-R1 在多项数学和推理基准测试中击败了 OpenAI o1 等业界领先模型。事实上,在许多重要指标上——能力、成本、开放性——DeepSeek 正在与西方人工智能巨头展开竞争。 DeepSeek 的成功表明了中美科技冷战的意外结果。美国的出口管制严重限制了中国科技公司以西方方式在人工智能领域竞争的能力,即通过购买更多芯片和更长时间的培训来无限扩大规模。因此,大多数中国企业都专注于下游应用,而不是建立自己的模型。但通过其最新版本,DeepSeek 证明了还有另一种获胜方式:通过改进人工智能模型的基础结构并更有效地利用有限的资源。
