编辑《证券时报》 阮润生
凭借卓越的性价比,国内开源大模型DeepSeeek已成为世界上增长最快的人工智能应用,引发了全球科技界的热烈讨论和计算能力信仰冲击,进一步增强了建设开放人工智能生态的信心。目前,不仅是英伟达,AMD、英特尔等国际芯片巨头宣布集成DeepSeek模型并提供计算支持。国内GPU制造商、云计算制造商和应用程序制造商等人工智能产业链合作伙伴也迅速支持调用DeepSeek来升级他们的产品和技术。
造成巨大的计算能震
DeepSeeek作为幻方量化旗下的AI公司深度搜索开发的国产开源大模型,最近连续发布了DeepSeek V3、DeepSeek-R1等人工智能模型显示出惊人的效果和低培训成本。移动应用分析机构Sensortower的数据显示,其应用软件在18天内下载了1600万次。截至2025年2月4日,Depsek日活用户数已超过2000万,成为世界上增长最快的人工智能应用。
人工智能业内人士告诉《证券时报》,DeepSeeek证明,大型模型可以在没有堆叠计算能力的情况下完成。
总的来说,DeepSeeek提供了一种高效的模型蒸馏技术,可以通过Multi将大规模模型的能力转移到更小更高效的版本-Head Latent Attention(MLA)和DeepSeek MoE两大核心技术显著降低了显存占用,优化了模型性能。
Trendforce集邦咨询研究指出,Deepseek采用蒸馏模型(Model Distillation)技术,压缩大型模型,提高推理速度,减少硬件需求,充分发挥英伟达hopper降级芯片的效益,最大限度地利用计算资源。其成本优势来自于高效的硬件选择、新的蒸馏技术和API开源策略,这不仅优化了技术和商业应用之间的平衡,而且显示了人工智能产业向高效发展的趋势。
DeepSeeek已经成为一个非凡的人工智能应用程序,这也引起了对计算能力信仰的质疑。全球计算能力巨头英伟达股价1月27日下跌近17%,逐步稳定;1月27日,A股光通信模块领头羊中际徐创下跌约10%,2月5日进一步成交量下跌,工业富联下跌6.76%,寒武纪-U下跌12.46%。
在这方面,英伟达此前曾发表声明,称DeepSeek的进展显示了其芯片在中国市场的实用价值,未来将需要更多的英伟达芯片来满足DepSeek的服务。
Trendforce集邦咨询最新指出,虽然Deepseek模型降低了人工智能培训的成本,但人工智能模型的低成本预计将扩大应用场景,从而增加全球数据中心的建设量。作为数据中心连接的关键组件,光收发模块将受益于高速数据传输的需求。预计2023年全球出货量超过400Gbps的光收发模块将达到640万,2024年出货量约为2040万,预计到2025年将超过3190万,年增长率将达到56.5%。
积极适应AI芯片
对DeepSeek的认可不仅体现在排名和用户下载上,也体现在国际AI芯片巨头的兼容性和当地厂商的积极适应上。
1月31日,英伟达发布了Deepsek-R1 “英伟达NIM微服务”预览版671b显著提高了人工智能模型的运行效率,简化了企业部署流程,降低了人工智能落地的技术门槛。
此外,AMD还将新的DeepSek-V3模型集成到Instincttin MI300X GPU上;英特尔还表示,其开发的AI芯片/GPU芯片可以支持DeepSeek,打算与中国芯片合作,打破英伟达创造的生态垄断。
根据行业分析,Deepseek使用了英伟达的PTXX(Parallel Thread Execution)语言可以在接近汇编语言的层次上实现,通过优化细粒度,可以更底层、更准确地控制GPU硬件。
业内人士告诉编辑,使用PTX证明DepSeek有能力实现更底层的技术本质上对国内GPU也有好处。一些分析人士指出,通过精通PTX语言的使用,预计将有助于国内GPU进行有针对性的算子优化,提高国内GPU模型的运行效率。
除国际巨头外,海光信息作为国内人工智能芯片企业,于2月4日晚宣布成功完成DeepSeekV3和R1模型与海光人工智能加速卡DCU的适应,并正式推出,预计将推动人工智能技术在更多行业的实施和普及。2月5日,该公司股价上涨11.19%。
此外,陆晨科技与华为盛腾联合发布了基于盛腾计算能力的DeepSeek-R1系列推理API和云镜像服务,实现了盛腾计算能力与DeepSeek-R1系列模型的推理适应性优化,其性能与高端GPU的使用相同。此外,DepSeek系列模型正式在盛腾社区推出,支持一键获取DepSeek系列模型,支持盛腾硬件平台开箱即用,推理快速部署。
国内GPU制造商穆西宣布与Deepseek合作,摩尔线程宣布部署Depseek蒸馏模型推理服务,提高计算效率和资源利用率;天数智能芯宣布适应Depsek-R1千问蒸馏模型,提供更高效、更稳定的推理服务,满足不同规模和需求的应用场景。
2月5日,壁伦科技宣布,自主研发的壁锐TM系列产品完成了对DeepSeek-R1全系列蒸馏模型的支持,涵盖了从1.5B到70B的各级参数版本,包括LLAMA蒸馏模型和千问蒸馏模型,为开发者提供高性能、低成本的大型模型部署和开发解决方案。
接入云制造商和应用程序端
除了人工智能硬件制造商外,许多云计算巨头还入围了“朋友圈”,华为云、腾讯云、阿里巴巴云、百度云等已宣布支持DepSeek模型的部署。此外,联通云宣布实现国内和主流计算能力适应多规格DepSeek-R1模型,考虑私有化和公共场景,提供全面的运营服务保障,为客户带来开箱体验;实现多产品场景调用,可预部署270多个骨干云池,全面访问联通云桌面、编程助理等多产品场景;提供全方位的安全服务保障,实时提供抗DDOS等三种安全服务,并有大型元景安全模型支持。
除云制造商外,应用端制造商还在积极探索和部署DeepSeek模型。
2月4日,万兴科技表示,已完成深度搜索(DeepSeek)最新推理大模型DeepSeek-R1的深度适应,其视频创意、绘图创意、文档创意软件业务产品,如万兴喵影、亿图图示、亿图脑图MindMaster等、万兴PDF已经整合了DeepSeek-R1大模型的相关能力,用户可以获得新的体验。接入DeepSeek-R1后,用户使用产品的门槛降低,大型模型应用的成本进一步降低。
此外,北信源微信官方账号显示,其自主研发的“密信AI能力平台”首次完成了与DeepSeek的技术对接,将为信源密信和第三方应用提供DeepSeek大模型AI能力;奇安信宣布已完成与DeepSeek的全面深入接入,自主研发的QAX-GPT安全模型经过DepSeek-R1优化蒸馏后,运营成本大幅降低,威胁研判等场景性能明显提升,安全专业问答整体性能分数提升约16%。
当虹科技官微显示,公司Blackeye多模态视听大模型正式集成DeepSeek-R1和DeepSeekek Janus Pro,并完成视听媒体、工业卫星、车载智能驾驶舱等行业垂直场景的数据优化培训,为视听媒体、工业卫星、车载智能驾驶舱等行业客户提供更低成本的大型模型部署和新的大型模型体验。
易点天下宣布,其KreadoAI、许多核心产品,如数眼智能和zMaticooADX,将整合DeepSeek-R1大型模型的相关能力,提升用户的智能营销体验。
2月5日,盛天网络在互动平台上回复了“公司人工智能产品是否与DeepSeek模型合作或使用”等问题。该公司已经进行了相关的合作,并正在使用DeepSeek模型进行对接。公司通过在线API接口和私有化部署开源模型进行了工作,已部署并进入测试阶段。公司预计,DeepSeek模型可应用于公司的社交产品带和小麦,探索更好的产品和服务,进一步提高公司的业务生产力,结合公司的弹性计算池,有效降低计算能力成本。目前,该公司的一款与DepSeek对接的社交游戏已经完成了一轮内部测试。
根据中文在线消息,基于DeepSeekek V3和R1提出的技术路线,中文在线专注于研发和培训升级版的“中文逍遥”,以进一步提高大模型的创作能力。
2月5日,阅文集团宣布其作家辅助创作产品——作家助手集成了独立部署的大型Deepseek-R1模型。阅文邀请全行业网络作家参与,用户可以下载作家助手到最新版本进行试用并参与内部测试。
此外,2月5日,华为终端BG首席执行官何刚在微博上透露,华为小艺助手已接入DepSeek,小艺App智能体广场已推出DepSeek-R1Beta版,升级为原生鸿蒙系统体验。
编辑:金杜