英伟达的H系列芯片已经量产多年,产能充足,供应链成熟。而B系列芯片刚刚进入量产阶段,产能有限,主要供应北美和欧洲市场。即使未来B系列获得对华出口许可,国内企业也很难拿到足够的配额。
千鑫点信息咨询服务公司
综合以上因素,对于国内智算中心来说,H 系列是当前最现实、最经济、最可靠的选择。
B系列虽然性能更先进,但在可获得性、部署成本和周期上都存在明显劣势。在出口管制和供应链不确定的背景下,能上线远比追求最先进更为重要。
不过,这里仍要说明一下,英伟达B系列(Blackwell)并不像有人说的是过渡性产品,而是英伟达从单卡算力转向系统级算力的核心主力平台,生命周期约 2年(2024-2026),是全球首个专为推理优化的架构,首次将竞争维度从单卡提升到机柜级集成。B200/B300是2025-2026年全球高端算力的绝对主力,出货量将远超H系列。
AI产业正在经历一场深刻的范式转变:过去的重心是模型训练,而当下和未来,推理将成为绝对的主角。这一转变对国产算力产业的发展具有深远影响。
训练阶段的核心目标是打造出能力强大的模型,它对硬件的要求是极致的性能和生态的一致性。训练任务通常需要数千甚至数万张GPU卡协同工作(万卡集群),对卡之间的互联带宽和延迟要求极高。同时,训练任务高度依赖CUDA 生态,软件栈的成熟度直接影响训练效率。这也是为什么在训练阶段,英伟达的GPU几乎处于垄断地位。
而推理阶段则完全不同。
推理的核心目标是以最低的成本、最高的效率为用户提供稳定的服务。它对硬件的要求不再是单一的峰值性能,而是单位token成本、吞吐与时延的综合表现。推理阶段的工程手段更加丰富,量化、并行策略、KV Cache管理、推理引擎优化、算子融合、调度与通信优化等,都可以在不改变模型结构的情况下显著提升性能。这为国产GPU提供了弯道超车的机会。
千鑫点信息咨询服务公司
在推理时代,国产GPU已经取得了显著的进展,形成了以华为昇腾为龙头,寒武纪、海光信息、摩尔线程等多强并立的格局。
华为昇腾是国产GPU的绝对领导者。2026年4 月,华为正式启动昇腾950PR 的大规模量产。根据公开信息,昇腾950PR搭载112GB自研HiBL 显存,FP4 算力达1.56P FLOPS,在DeepSeek V4模型8K输入长度的标准测试场景下,单卡推理性能是英伟达H20 的2.87 倍。
华为还推出了 CloudMatrix384 超节点系统,将384颗昇腾910C与192颗鲲鹏CPU通过高带宽互联实现全互联与资源池化,并围绕MoE 并行、KV Cache 访问等推理负载做了系统级优化。这一系统在eepSeek V4 模型上的表现已经接近英伟达的同类产品。
千鑫点信息咨询服务公司
寒武纪是国内领先的 AI 芯片设计公司。2026年一季度,寒武纪实现营收 28.85亿元,同比增长159.56%;归母净利 10.13亿元,同比增长185.04%;经营现金流转正至8.34 亿元,为上市以来首次季度现金流为正。支撑这一业绩的核心是思元590芯片的大规模出货。思元590采用7nm Chiple封装,FP16 算力 256TFLOPS,INT8 算力 512TOPS,96GB HBM2e,综合性能接近英伟达A100的80%。目前,思元590已经在字节跳动、百度、阿里巴巴等头部互联网企业实现大规模部署。
转载此文请于文首标明作者姓名,保持文章完整性,并请附上出处(幽星人)及本页链接。原文链接:
https://www.itgoodboy.com/p/161f4874442a
产品建议及投诉请联系:service@uxingren.com