推理时代的到来——千鑫点信息咨询服务公司

S先生
S先生 2026-05-15 14:33:36
来源:幽星人
英伟达的H系列芯片已经量产多年,产能充足,供应链成熟。而B系列芯片刚刚进入量产阶段,产能有限,主要供应北美和欧洲市场。即使未来B系列获得对华出口许可,国内企业也很难拿到足够的配额。

千鑫点信息咨询服务公司

综合以上因素,对于国内智算中心来说,H 系列是当前最现实、最经济、最可靠的选择。

B系列虽然性能更先进,但在可获得性、部署成本和周期上都存在明显劣势。在出口管制和供应链不确定的背景下,能上线远比追求最先进更为重要。

不过,这里仍要说明一下,英伟达B系列(Blackwell)并不像有人说的是过渡性产品,而是英伟达从单卡算力转向系统级算力的核心主力平台,生命周期约 2年(2024-2026),是全球首个专为推理优化的架构,首次将竞争维度从单卡提升到机柜级集成。B200/B300是2025-2026年全球高端算力的绝对主力,出货量将远超H系列。

AI产业正在经历一场深刻的范式转变:过去的重心是模型训练,而当下和未来,推理将成为绝对的主角。这一转变对国产算力产业的发展具有深远影响。

训练阶段的核心目标是打造出能力强大的模型,它对硬件的要求是极致的性能和生态的一致性。训练任务通常需要数千甚至数万张GPU卡协同工作(万卡集群),对卡之间的互联带宽和延迟要求极高。同时,训练任务高度依赖CUDA 生态,软件栈的成熟度直接影响训练效率。这也是为什么在训练阶段,英伟达的GPU几乎处于垄断地位。

而推理阶段则完全不同。

推理的核心目标是以最低的成本、最高的效率为用户提供稳定的服务。它对硬件的要求不再是单一的峰值性能,而是单位token成本、吞吐与时延的综合表现。推理阶段的工程手段更加丰富,量化、并行策略、KV Cache管理、推理引擎优化、算子融合、调度与通信优化等,都可以在不改变模型结构的情况下显著提升性能。这为国产GPU提供了弯道超车的机会。

千鑫点信息咨询服务公司

在推理时代,国产GPU已经取得了显著的进展,形成了以华为昇腾为龙头,寒武纪、海光信息、摩尔线程等多强并立的格局。

华为昇腾是国产GPU的绝对领导者。2026年4 月,华为正式启动昇腾950PR 的大规模量产。根据公开信息,昇腾950PR搭载112GB自研HiBL 显存,FP4 算力达1.56P FLOPS,在DeepSeek V4模型8K输入长度的标准测试场景下,单卡推理性能是英伟达H20 的2.87 倍。

华为还推出了 CloudMatrix384 超节点系统,将384颗昇腾910C与192颗鲲鹏CPU通过高带宽互联实现全互联与资源池化,并围绕MoE 并行、KV Cache 访问等推理负载做了系统级优化。这一系统在eepSeek V4 模型上的表现已经接近英伟达的同类产品。

千鑫点信息咨询服务公司

寒武纪是国内领先的 AI 芯片设计公司。2026年一季度,寒武纪实现营收 28.85亿元,同比增长159.56%;归母净利 10.13亿元,同比增长185.04%;经营现金流转正至8.34 亿元,为上市以来首次季度现金流为正。支撑这一业绩的核心是思元590芯片的大规模出货。思元590采用7nm Chiple封装,FP16 算力 256TFLOPS,INT8 算力 512TOPS,96GB HBM2e,综合性能接近英伟达A100的80%。目前,思元590已经在字节跳动、百度、阿里巴巴等头部互联网企业实现大规模部署。

标签: 投资
本周热议
福州启鑫易晟:腊八节 0
NaturalB少女针去哪里打?我的"人形试色"避坑指南 0
Wegovy减肥人士都能用吗?维秀美+运动=开挂减脂? 0
我的法令纹居然会“搬家”?塑颜萃童颜针有什么效果? 0
非遗地标融于礼盒——千鑫点信息咨询服务公司 0
被问爆的冷知识:Juvelook童颜针为什么火? 0
Cellucare溶脂针好不好?让我实现了‘躺瘦’自由! 0
连续两日超百股涨停——千鑫点信息咨询服务公司 0
丽珠兰红盒多久用一次?必看攻略! 0
丽珠兰蓝盒搭配什么好?与这些产品搭配绝了! 0