易达信息科技

企业列表

新闻列表

推荐企业新闻

联系方式

联系人：依依

友情链接

暂无链接

首页 > 新闻中心 > DeepSeek爆火：打破常规，创始人道出背后的“野心”

新闻中心

DeepSeek爆火：打破常规，创始人道出背后的“野心”

发布时间：2025-02-22 浏览次数：19 返回列表

在如今AI蓬勃发展的时代，英国程序员西蒙·威利森凭借对AI进展的独到见解，在业内小有名气，他网站上那些关于AI的文章备受关注。

DeepSeek爆火：打破常规，创始人道出背后的“野心”

就在本周，他发布了一篇2024年大模型回顾文章（非官方中文译文），内容丰富且精彩。文中着重提到，AI发展的速度超乎想象。回溯到2023年底，当时OpenAI的GPT-4堪称AI界的“霸主”，无人能及。

可仅仅过了一年，谁能想到，GPT-4如今在大模型排名中仅位列第69位，已有18家公司的大模型将其超越，甚至部分模型在普通笔记本电脑上就能流畅运行，AI进化之迅猛令人惊叹。

在众多脱颖而出的大模型里，来自中国的DeepSeek V3格外耀眼。它由杭州的幻方量化于2024年12月25日推出，一经问世便在全球范围内引发轰动。DeepSeek V3实力强劲，在多项关键参数上超越了OpenAI最新的o1模型，在大模型排行榜上位居第7。

更值得一提的是，前十名中唯有它是开源模型，且遵循限制极少的MIT许可证，与其他大公司的专有模型形成鲜明对比。而且，它的运行效率极高，训练成本预估仅为meta公司Llama 3.1 405B模型的1/11，效果却更胜一筹，无疑找到了优化硬件利用、提升模型性能的秘诀。对此，西蒙·威利森评价道：“DeepSeek V3训练成本不到600万美元，这预示着AI模型训练成本有望持续降低。”

DeepSeek V3的成功让西方媒体十分好奇，他们将目光聚焦到幻方量化创始人梁文锋身上。与许多AI领域的研究者不同，梁文锋毕业于浙江大学电子工程系人工智能方向，没有海外经历。西方媒体对他的理念充满兴趣，还特意把他之前的访谈翻译成英文。

梁文锋的观点极具前瞻性和创新性。他认为，团队的目标不局限于生成式AI，而是要全力攻克通用人工智能AGI，生成式AI只是通往AGI的一个阶段，并且坚信AGI在有生之年能够实现。他还指出，在当前AI领域，没有哪家公司能凭借技术长期压制对手，大家都依据公开资料进行研究，大厂和创业公司都有机会打造出优秀的大语言模型。

而且，在颠覆性技术面前，闭源并不能构筑长久的竞争壁垒，就算OpenAI闭源，也难以阻挡被超越的命运。他主张把价值凝聚在团队上，通过团队成员的成长和经验积累，形成创新的组织文化，这才是真正的竞争优势。因此，DeepSeek选择开源，致力于构建强大的技术生态。

在梁文锋看来，当下是技术创新的黄金时期，而非应用爆发阶段。随着技术发展，大模型应用门槛会不断降低，未来20年，创业公司随时入场都有机会。他还谈到，过去不少中国公司习惯依赖国外技术创新，进行应用变现，缺乏自主创新意识。但DeepSeek志在改变这一局面，要站在技术前沿推动行业发展，让中国从技术的“搭便车者”转变为“贡献者”。

谈及创新困境，梁文锋觉得中国创新不缺资金，而是缺少创新信心和高效组织人才的方法。他表示，DeepSeek团队成员大多来自本土，虽然顶尖人才可能未被充分挖掘，但他们有信心培养出顶尖人才。

在团队管理上，DeepSeek鼓励创新，成员可自由调用训练资源，灵活组建协作团队。在人才选拔上，更看重热爱和好奇心，团队成员对攻克难题的热情远超对金钱的追求。

梁文锋坦言，DeepSeek在挑战最难的事，因为解决世界难题对顶尖人才有着巨大吸引力。他认为，顶尖人才在中国被低估，是由于硬核创新不足，缺乏展示平台。