专题:DeepSeek为何能震动全球AI圈
近日,中国AI公司DeepSeek发布的R1模型(DeepSeek R1)刚刚第7天,热度飙升。
1月24日,在专业大模型排名Arena上,DeepSeek-R1基准测试已经升至全类别大模型第三,其中在风格控制类模型(StyleCtrl)分类中与OpenAI o1并列第一;而其竞技场得分达到1357分,略超OpenAI o1的1352分。在中国市场,DeepSeek超越了豆包。
华尔街知名风投A16Z创始人马克·安德森在社交媒体发言称,DeepSeek R1是其见过的最令人惊叹,最令人印象深刻的突破之一,并且是开源的,是给世界的礼物。
OpenAI前政策主管、Anthropic联合创始人杰克·克拉克表示,其认为DeepSeek“雇佣了一批高深莫测的奇才”,还认为中国制造的大模型“将和无人机、电动汽车一样,成为不容忽视的力量。
图灵奖得主、 meta 的首席人工智能科学家杨立昆(Yann LeCun)说,他认为,开源模式代码正在超越闭源模式。“DeepSeek 的成功带来的最大启示是保持 AI 模型开源的重要性,这样每个人都能从中受益。”
DeepSeek之所以收到追捧主要归因于其高性价比、技术创新和开源特性。
DeepSeek-R1在数学、编程和推理等关键领域的表现优异,能力接近OpenAI o1,非常适合教育领域。
多知体验发现,“深度思考(R1)”这个功能非常重要,其思考过程能让学习者看到知识的关联性,引领学习者有思辨能力,从而培养自主学习的习惯,同时,其给出的解答细致入微,考虑周到。
一个非常简单的prompt,就能看到它思考是方方面面的。可以说,DeepSeek 使用易上手,对于小白用户很友好。回答多维度思考,甚至还给出了补充说明,答用户所问,也答用户所未想到的地方。
再上一些难度。
公开报道中,DeepSeek团队最大特点是名校、年轻,即使是团队Leader级别,年纪也多在35岁以下。不到140人的团队,工程师和研发人员几乎都来自清华大学、北京大学、中山大学、北京邮电大学等国内顶尖高校,工作时间都不长。