免费xxx8888|秋霞成人午夜鲁丝一区二区三区|久久视频这里只精品10|歪漫漫画网页入口|久久91超碰色中文字幕总站|和老师C了一节课|月夜直播APP 下载

  • 中文科技資訊 CWX中文科技資訊官方網站!

華為攜手湖北移動完成全國運營商首例AI推理加速測試:性能顯著提升

   時間:2026-06-26 15:28 來源:快訊作者:柳晴雪

在2026 MWC上海展期間,華為攜手中國移動通信集團湖北有限公司(以下簡稱“湖北移動”)共同宣布,雙方已順利完成全國運營商首個AI推理加速解決方案的現網測試,標志著AI技術在運營商領域的應用邁出重要一步。

此次測試依托華為OceanStor A800存儲系統與昇騰A3超節點架構,并引入UCM(Unified Cache Manager,推理記憶數據管理)技術,在長序列AI推理場景中實現了顯著突破。測試數據顯示,Token吞吐率最高提升達372%,為運營商智算業務的高效部署提供了強有力的技術支撐。

測試在湖北移動現網環境中展開,采用vLLM-Ascend框架,針對MiniMax M2.5、GLM-5.1等主流大模型,模擬了8K至190K的長序列輸入場景。這一設計旨在全面評估AI推理加速方案在不同長度上下文下的性能表現。

在MiniMax M2.5模型測試中,啟用UCM技術后,首Token延遲(TTFT)優化幅度達到26%至62%,單NPU卡Token輸出效率(TPS)顯著提升。具體而言,在64K序列長度下,TPS提升58%;在128K序列長度下,TPS提升78%,展現了該方案在長序列推理中的高效性。

而在GLM-5.1模型測試中,UCM的加速效果更為突出。TTFT優化幅度高達51%至93%,TPS提升范圍則達到56%至372%。特別是在64K序列長度下,TPS提升313%;在128K序列環境下,TPS最高提升372%,進一步驗證了AI推理加速方案在復雜場景下的卓越性能。

華為方面表示,測試結果表明,隨著上下文長度的增加,AI推理加速方案的優勢愈發明顯。該方案有效解決了長序列推理中的KV Cache容量瓶頸問題,為運營商在大模型推理、智能客服、內容生成、行業智能體等長序列AI業務場景中提供了更高效的資源利用方案,同時降低了長上下文推理帶來的性能壓力。

 
 
更多>同類內容
全站最新
熱門內容