据报道,DeepSeek R2将彻底摆脱NVIDIA,全部基于华为芯片,其总参数量达到了1.2万亿,相比R1提升了1倍,这一重要进展标志着华为芯片在人工智能领域的强大实力和深远影响,有望推动人工智能技术的更广泛应用和发展。
电脑知识网报道,4月29日消息,年初DeepSeek R1的问世,无疑在美国AI圈掀起了巨大的波澜,甚至对NVIDIA的股价造成了暴跌的影响,而今,更加强大的DeepSeek R2即将登场。 据最新市场消息透露,R2大模型将采用先进的混合专家模型(MoE),相较于前代R1,其总参数量提升了大约一倍,预计达到惊人的1.2万亿,而R1的总参数量则为6710亿,更为引人注目的是,DeepSeek R2的单位推理成本相较于GPT-4大幅降低了97.4%。 在中美科技战和贸易战不断升级的背景下,NVIDIA的H20芯片面临新的出口管制挑战,而DeepSeek R2的预期发布,使得各界高度关注中国在缺乏美国芯片资源的情况下,其大模型的发展动向。 据传,R2的规模与ChatGPT的GPT-4 Turbo以及谷歌的Gemini 2.0 Pro相当,更为令人期待的是,R2将结合更智能的门控网络层(Gating Network),以优化高负载推理任务的性能。 值得注意的是,R2将彻底摆脱NVIDIA芯片的限制,据悉,R2的训练全程均未使用NVIDIA显卡,而是完全基于华为的昇腾910B(Ascend 910B)芯片集群平台,在FP16精度下,其计算性能达到了512 PetaFLOPS,芯片利用率高达82%,整体性能约为NVIDIA上一代A100集群的91%。 市场预期,这一变革有望降低中国对海外高端AI芯片的依赖,华为全新的昇腾910C芯片也开始进入大规模量产阶段,这不仅对中国AI产业具有重要意义,也将对全球AI格局产生深远影响。 成本方面,DeepSeek-R2的表现同样出色,其单位推理成本较OpenAI的GPT-4降低了97.4%,具体到数值,R2输入每百万个字符仅需0.07美元,而输出每百万个字符仅0.27美元,这无疑是一个令人振奋的消息。 分析人士认为,如果R2如传闻般强大,可能会再次引发市场对AI基础设施需求的质疑,结合华为AI芯片的国产替代效应,其对NVIDIA的影响将进一步扩大。 图片描述:“总参数量1.2万亿 比R1提升一倍!DeepSeek R2将彻底摆脱NVIDIA,全面采用华为芯片”的图片已经上传至本站,图片展示了DeepSeek R2的巨大潜力和行业关注度。