DeepSeek作为AI领域的创新先锋,正在通过工程创新和技术突破,显著提升普惠优质AI的可获得性,激发全产业的创新活力。
DeepSeek加速了AI技术的普惠化进程。通过工程创新,DeepSeek将训练效率提升了2~3倍,推理效率提升了5~7倍,极大地缩短了模型开发和部署的时间成本,推动了从基础研究到商业应用的全产业链变革。
在企业端(To B),不分行业,各企业以冲刺方式接入DeepSeek,获取流量。自R1发布后的20天内(截至2月12日),国内外已有160多家企业集体接入DeepSeek。
在消费端(To C),用户呈爆炸式增长,超级APP快速出现,加速了LLM的全面普及。DeepSeek以现象级表现提升了社会对LLM的认知,促进了新商业模式的成型,实现了商业正循环。
DeepSeek正通过极致工程优化,提升算力利用率,稳定可靠的算力底座仍是模型创新的关键。
据了解,DeepSeek模型发布即原生支持昇腾,国内70%客户、伙伴基于昇腾快速上线。截至2月12日,80+ 客户/伙伴基于昇腾已上线DeepSeek,20+适配测试中(预计两周内全部上线),昇腾助力20+省、25城市AICC启动部署DS系列模型,全国超70%区域可获取本地支持。
在训练能力方面,昇腾超节点支持DeepSeek全系模型预训练及微调,支持DualPipe、跨节点All2All等DeepSeek核心优化技术,超大带宽通信域更适合DeepSeek的流水线并行算法及冗余专家等能力。DeepSeek R1是强化学习RL模型,昇腾超节点是更适合DeepSeek V3/R1的解决方案。
在推理能力方面,昇腾通过并行推理优化技术+专家负载均衡能力,助力DeepSeek模型推理性能提升30%+。DeepSeek小专家创新架构,带来的是通信耗时及专家负载不均挑战,更多的小专家并行,引入极大的通信开销,更多专家的数据负载难以均衡。
目前,昇腾联合伙伴推出形态丰富的产品和解决方案(如:一体机、云服务、硬件+开源社区等)帮助企业快速部署,已覆盖互联网、金融、运营商、政务、教育等多个行业。(御风)
智玩元宇宙微信公众号
全部评论