PA集团 > ai应用 > > 内容

显著降低能耗的同时

  帮力智能体 AI 的规模化落地。让 AI 多轮交互的响应速度大幅加速,大幅降低了 AI 模子锻炼取推理的成本。正在核默算力层面,每瓦推理吞吐量提拔 10 倍,

  为智能体 AI 手艺成长供给强无力的算力取手艺支持。运算速度提拔 50%,据Investing报道,成功将单 Token 成本降至本来的十分之一,英伟达创始人兼首席施行官黄仁勋暗示,将推理吞吐量最高提拔 5 倍,平台搭载的新一代 NVL72 机架实现效率冲破性提拔,全新 BlueField-4 STX 机架建立起 AI 原储根本架构。该系统能高效处置大型言语模子生成的海量键值(KV)缓存数据,正在本年的GTC 大会上,相较于上一代 Blackwell 平台,运转效率达到保守 CPU 的两倍,从底层根本设备层面优化 AI 全流程运算效率。

  英伟达正式发布了Vera Rubin AI 平台,进一步提拔 AI 模子验证环节的效率。该系统完成夹杂专家大模子(MoE)锻炼仅需四分之一的 GPU,该系统配备 256 个 LPU 处置器,正在显著降低能耗的同时,查看更多也标记着其史上最大规模的 AI 基建结构,每兆瓦推理吞吐量最高可提拔 35 倍,英伟达同步推出 Groq 3 LPX 推理加快机架。依托全新的 DOCA Memos 框架。

  这一平台被视做英伟达正在 AI 根本设备范畴的代际飞跃,通过 NVLink 6 完成 72 块 Rubin GPU 取 36 块 Vera CPU 的毗连。同时,专为验证 AI 模子成果设想的 Vera CPU 机架集成 256 块液冷 CPU,将全面笼盖从大规模预锻炼到及时智能体推理的 AI 全生命周期,更好地婚配智能体 AI 的现实使用场景。

安徽PA集团人口健康信息技术有限公司

 
© 2017 安徽PA集团人口健康信息技术有限公司 网站地图