联想发布首款AMD AI服务器DeepSeek大模型吞吐量创纪录6738 tokens！

DeepSeek | 2025-04-15 20:44

　　DeepSeek是一款基于AI技术的智能搜索引擎，结合深度学习与自然语言处理，提供精准、高效的搜索体验。探索DeepSeek，感受未来智能搜索的无限可能！

　　在科技创新的浪潮中，每一次突破都像是一颗明星划过夜空，引发无数瞩目。近日，联想又一次引领潮流，宣布其首款基于AMD的AI大模型训练服务器——联想问天WA7785aG3，成功实现单机部署满血版的DeepSeek大模型时，令人咂舌的吞吐量高达6708 token/s！

　　这个数字不仅是一个技术指标，更是将单台服务器的运算能力推向了一个全新的高峰，让人不禁想象未来AI应用的无限可能。

　　依托于联想万全异构智算平台的强大支持，联想通过一系列创新手段来优化大模型的全流程，从预训练到推理，似乎在向我们展示一场AI领域的“炼金术”。这些创新包括内存和显存的优化、全互联的PCIe5.0架构，甚至精挑细选了SGLang框架中最优的算子。每一步的精细调校，都在稳步推进大模型的效率提升。

　　具体来说，在模拟问题对话场景时（上下文序列长度为128/1K），服务器最高支持158个并发，会话处理时间（TPOT）仅需93毫秒，而整体推理时间（TTFT）更是仅2.01秒；而若是在进行代码生成（上下文序列长度为512/4K）时，并发数也不逊色，达到140，TPOT为100毫秒，TTFT为5.53秒。这样的效率意味着，单台联想问天WA7785aG3可以满足1500人规模企业的日常运作，显然是助力业务更上一层楼的重要支持。

　　此次突破结果是联想、中国基础设施业务群、联想研究院ICI实验室与AMD紧密合作的结晶，充分展现了团队协作的力量。然而，这并不是终点，联想与AMD将继续探索新的深度调优方法，力求在日后的技术迭代中不断创新突破。

　　总而言之，联想的这项成果不仅是在技术产品上的领先，更是对未来智能化社会的坚定信心和承诺。这一切，只是未来科技密集交织的开端。返回搜狐，查看更多