推广 热搜:   中国  未来  系统  政策  行业  设备  基金  快速  教师 

一文看懂DeepSeek如何火爆全球?

   日期:2025-02-21     作者:caijiyuan    caijiyuan   评论:0    移动:http://mip.tpjde.com/news/13259.html
核心提示:短短两周,中国人工智能初创公司火爆出圈。它拿下了美国和中国区App Store免费榜的双料第一,成为首个超越OpenAI ChatGPT的AI助

短短两周,中国人工智能初创公司火爆出圈。它拿下了美国和中国区App Store免费榜的双料第一,成为首个超越OpenAI ChatGPT的AI助手类应用。外媒用“震动硅谷”形容DeepSeek带给美国的行业震撼,其主打的低成本开源模型概念更冲击华尔街,英伟达市值一周缩水超5000亿美元。

一文看懂DeepSeek如何火爆全球?

DeepSeek是什么?

DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,成立于2023年7月17日,总部位于浙江杭州。它由量化资管巨头幻方量化创立,专注于大语言模型(LLM)及相关AI技术的研发。

DeepSeek为何如此震撼?

DeepSeek能够引发业界震动的主要原因在于其低廉的成本和开源等特点。该公司去年底发布的大型语言模型DeepSeek-V3,训练成本仅为557.6万美元,与美国OpenAI最新版chatGPT的训练成本相比,差距约为20倍。API调用成本更是只有OpenAI的三十分之一。

AI产业是否存在泡沫化?

自从2022年底OpenAI掀起旋风以来,「不动辄重砸数十亿美元没法训练出强大AI系统」始终是主流观点,市场认为唯有像微软、Google、meta等科技巨头才玩得起先进AI,英伟达这类AI芯片厂更是一片光明的景象。

然而DeepSeek仅花费约560万美元和相对原始的运算能力训练自家系统,这比meta建构旗下最新AI所花资金便宜约10倍,引来AI产业反思,是否真有必要砸天文数字的资金?AI产业又是否存在泡沫化?

DeepSeek是如何办到使用较少芯片?

美国的顶尖AI工程师们表示,DeepSeek的研究论文提出一些让人印象深刻的巧思来降低芯片使用量,简言之就是种让芯片分析数据时更有效率。

先进AI系统需归纳文字、图片、影音等大量数据来学习技能,DeepSeek则把这些数据分析工作分配给多个不同模型,每个模型负责特定领域,如此一来维持高效数据处理的同时还缩短运算时间。这种方法之前不是没有人用过,只是没法像DeepSeek用更少的运算能力做到。

精通建构高效AI系统的卡内基美隆大学(CMU)计算机科学教授戴特摩斯(Tim Dettmers)说:「现在看显然除OpenAI这类公司外,其他人也能玩。DeepSeek使用的方法人人都能依样画葫芦。」.

何谓开源AI?

与许多公司一样,DeepSeek也把自身最新的AI系统「开源」,即把支撑AI的运算代码公开给其他企业和研究人员,让所有人都能使用这些技术来建构、推广自己的产品。DeepSeek与其他企业能如此迅速拿出具竞争力的AI产品,部分也是受惠于他人开源。

中美科技巨头争相接入DeepSeek

DeepSeek爆火后,海外巨头率先接入DeepSeek模型。

1月31日,英伟达宣布DeepSeek-R1模型登陆NVIDIANIM。同日,亚马逊和微软也接入了DeepSeek-R1模型。英伟达称,DeepSeek-R1是最先进的大语言模型。

2月份,国内几大云平台也宣布上线DeepSeek系列模型。

2月1日,华为云在官微宣布,与硅基流动联合首发并上线基于昇腾云服务的DeepSeek R1/V3推理服务,其性能可与全球高端GPU部署模型相媲美。

2月2日,腾讯云称,将DeepSeek-R1大模型一键部署至其“HAI”平台,开发者仅需3分钟即可接入调用。

2月3日,百度智能云也宣布,其千帆平台正式上架DeepSeek-R1和DeepSeek-V3模型。阿里云也称,其PAI Model Gallery支持云上一键部署DeepSeek-V3和DeepSeek-R1模型,

2月4日,字节跳动旗下火山引擎也宣布,全面支持DeepSeek系列大模型,包括V3和R1等不同尺寸的模型,企业用户可在火山引擎机器学习平台veMLP中部署或通过火山方舟平台直接调用。此外,联通云、天翼云等平台也宣布接入DeepSeek模型。

.......

芯片厂商加速对接完成适配

在芯片领域,国内几大GPU厂商加速跟DeepSeek模型的对接,完成适配,提供算力支持。

2月5日,华为官方表示,DeepSeek系列新模型正式上线昇腾社区;Gitee AI同日表示,DeepSeek-V3满血版在国产沐曦GPU首发体验上线。

中科曙光国家先进计算产业创新中心有限公司发文宣布,海光信息技术团队已完成DeepSeek V3和R1模型与海光DCU的适配并上线;

摩尔线程也宣布,已实现对DeepSeek蒸馏模型推理服务的部署,并即将开放自主设计的夸娥(KUAE)GPU智算集群,支持DeepSeek V3、R1模型及新一代蒸馏模型的分布式部署。天数智芯也称,联合Gitee AI正式上线DeepSeek R1模型服务。

据不完全统计,截至2月7日,已有17家国产芯片企业相继宣布适配或上架DeepSeek模型服务,分别为华为昇腾、沐曦、天数智芯、摩尔线程、海光信息、壁仞科技、太初元碁、云天励飞、燧原科技、昆仑芯、灵汐科技、鲲云科技、希姆计算、算能、清微智能、芯动力、龙芯中科等。

有机构认为,DeepSeek通过模型层面创新,在芯片受限与低算力投入的背景下,达到全球顶尖闭源模型的性能水平,属于生态级突破,有望带动国内AI全产业快速发展,同时其开源与低成本特性也有望赋能AI应用厂商,加速推动端侧AI落地。

附:DeepSeek时间线梳理

本文地址:http://www.tpjde.com/news/13259.html    推平第 http://www.tpjde.com/ , 查看更多
 
 
更多>同类行业资讯
0相关评论

新闻列表
企业新闻
推荐企业新闻
推荐图文
推荐行业资讯
点击排行
网站首页  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  鄂ICP备2023001713号