DeepSeek是一款基于AI技术的智能搜索引擎,结合深度学习与自然语言处理,提供精准、高效的搜索体验。探索DeepSeek,感受未来智能搜索的无限可能!
有限公司(以下简称“联想”)宣布旗下首款AMD AI大模型训练服务器联想问天WA7785a G3在单机部署671B(满血版)DeepSeek大模型,可实现极限吞吐量6708token/s,将单台服务器运行大模型的性能推向了新高,展现了联想在AI基础设施领域技术的深厚积淀与研发的快速响应能力。在AI算力竞争日趋白热化的今天,联想再次以硬核技术实力树立了行业新标杆。
依托联想万全异构智算平台,联想通过访存优化、显存优化等诸多创新方式,对大模型从预训练、后训练到推理的全流程进行持续优化。相关成绩意味着单台联想问天WA7785a G3可以支撑1500人规模企业的正常使用,是继联想问天WA7780 G3服务器单机部署满血版DeepSeek大模型总吞吐量突破2500 token/s之后,单机部署该大模型推理性能的又一次突破。
此次突破是联想中国基础设施业务群、联想研究院ICI实验室和AMD联合设计、协同调优、共同实现的。据了解,联想与AMD还在持续尝试深度调优新方法,实现更高调优突破。
该款联想问天服务器具有强大算力引擎、超大显存、特有创新架构等优势,为服务器的稳定性和可靠性提供了有力保障。
据了解,联想将持续深化与产业伙伴的技术协作,通过架构创新、算法优化与硬件技术创新,不断突破性能边界,为各行业提供更高密度、更低能耗、更易部署的AI算力基础设施,推动AI算力向更高效、更普惠、更可持续的方向演进,助力中国智算产业的持续发展。