新闻| 文章| 资讯| 行情| 企业| wap手机版| article文章| 首页|会员中心|保存桌面|手机浏览
普通会员

易达信息科技

企业列表
新闻列表
推荐企业新闻
联系方式
  • 联系人:依依
友情链接
  • 暂无链接
首页 > 新闻中心 > DeepSeek爆火:打破常规,创始人道出背后的“野心”
新闻中心
DeepSeek爆火:打破常规,创始人道出背后的“野心”
发布时间:2025-02-22        浏览次数:16        返回列表

在如今AI蓬勃发展的时代,英国程序员西蒙·威利森凭借对AI进展的独到见解,在业内小有名气,他网站上那些关于AI的文章备受关注。

DeepSeek爆火:打破常规,创始人道出背后的“野心”

就在本周,他发布了一篇2024年大模型回顾文章(非官方中文译文),内容丰富且精彩。文中着重提到,AI发展的速度超乎想象。回溯到2023年底,当时OpenAI的GPT-4堪称AI界的“霸主”,无人能及。

可仅仅过了一年,谁能想到,GPT-4如今在大模型排名中仅位列第69位,已有18家公司的大模型将其超越,甚至部分模型在普通笔记本电脑上就能流畅运行,AI进化之迅猛令人惊叹。

在众多脱颖而出的大模型里,来自中国的DeepSeek V3格外耀眼。它由杭州的幻方量化于2024年12月25日推出,一经问世便在全球范围内引发轰动。DeepSeek V3实力强劲,在多项关键参数上超越了OpenAI最新的o1模型,在大模型排行榜上位居第7。

更值得一提的是,前十名中唯有它是开源模型,且遵循限制极少的MIT许可证,与其他大公司的专有模型形成鲜明对比。而且,它的运行效率极高,训练成本预估仅为meta公司Llama 3.1 405B模型的1/11,效果却更胜一筹,无疑找到了优化硬件利用、提升模型性能的秘诀。对此,西蒙·威利森评价道:“DeepSeek V3训练成本不到600万美元,这预示着AI模型训练成本有望持续降低。”

DeepSeek V3的成功让西方媒体十分好奇,他们将目光聚焦到幻方量化创始人梁文锋身上。与许多AI领域的研究者不同,梁文锋毕业于浙江大学电子工程系人工智能方向,没有海外经历。西方媒体对他的理念充满兴趣,还特意把他之前的访谈翻译成英文。

梁文锋的观点极具前瞻性和创新性。他认为,团队的目标不局限于生成式AI,而是要全力攻克通用人工智能AGI,生成式AI只是通往AGI的一个阶段,并且坚信AGI在有生之年能够实现。他还指出,在当前AI领域,没有哪家公司能凭借技术长期压制对手,大家都依据公开资料进行研究,大厂和创业公司都有机会打造出优秀的大语言模型。

而且,在颠覆性技术面前,闭源并不能构筑长久的竞争壁垒,就算OpenAI闭源,也难以阻挡被超越的命运。他主张把价值凝聚在团队上,通过团队成员的成长和经验积累,形成创新的组织文化,这才是真正的竞争优势。因此,DeepSeek选择开源,致力于构建强大的技术生态。

在梁文锋看来,当下是技术创新的黄金时期,而非应用爆发阶段。随着技术发展,大模型应用门槛会不断降低,未来20年,创业公司随时入场都有机会。他还谈到,过去不少中国公司习惯依赖国外技术创新,进行应用变现,缺乏自主创新意识。但DeepSeek志在改变这一局面,要站在技术前沿推动行业发展,让中国从技术的“搭便车者”转变为“贡献者”。

谈及创新困境,梁文锋觉得中国创新不缺资金,而是缺少创新信心和高效组织人才的方法。他表示,DeepSeek团队成员大多来自本土,虽然顶尖人才可能未被充分挖掘,但他们有信心培养出顶尖人才。

在团队管理上,DeepSeek鼓励创新,成员可自由调用训练资源,灵活组建协作团队。在人才选拔上,更看重热爱和好奇心,团队成员对攻克难题的热情远超对金钱的追求。

梁文锋坦言,DeepSeek在挑战最难的事,因为解决世界难题对顶尖人才有着巨大吸引力。他认为,顶尖人才在中国被低估,是由于硬核创新不足,缺乏展示平台。