DeepSeek R1推理测试:4 NVIDIA GB300可以做16 H100的工作

他在8月27日报道说,技术媒体WCCFTECH昨天(8月26日)发表了一篇博客文章。最新的CoreWeave测试报告说,在DeepSeek R1推理模型中,4个Nvidia Blackwell Architecture GB300芯片完成了原始的16 H100任务,导致单卡的性能增加了6倍。他引用了一篇博客文章,并使用DeepSeek R1推理模型介绍了CoreWeave,以比较和评估GPU NVIDIA Blackwell Architecture GB300 NVL72与上一代GPU H100之间的差异。得益于改进的NVIDIA架构以及改进的内存和带宽,测试结果表明,GB300可以完成仅使用四个GPU时执行16 H100的任务。 GB300 NVL72平台最多支持37 TB的内存容量(高达40TB),每秒具有130 TB的内存带宽。为了减少GPU之间的Secdata提及的数量,该平台采用了4个频道的平行设计,通过高速NVLINK互连和NVSWWITCH来提高通信效率。 CoreWeave表示,这不仅是翻牌的计算机功率的改善,而且在实际商业场景中的系统体系结构效率也有所提高。对于需要执行复杂模型的业务客户,GB300 NVL72提供了更大的可扩展性和较低的延迟,这有助于更快,更经济地实施和执行。
特殊声明:先前的内容(包括照片和视频(如果有),如有)已由网络自我媒体平台的用户收费和发布。该平台仅提供信息存储服务。
通知:NetEase Hao的用户(如果您已经加载了照片或视频),它是社交网络的一个平台,仅提供信息存储服务。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注