中國移動已建成運營商最大單集群智算中心——中國移動智算中心(哈爾濱),并正式投產使用,為全國的科技創新與產業升級帶來強大助力。
該智算中心部署超1.8萬張AI加速卡,AI芯片國產化率達100%,可提供6.9EFLOPS(每秒690億億次浮點運算)智能算力。首次探索通過國產網絡設備將所有AI加速卡打造成1個集群,實現超大規模算力資源聚合,支持全部1.8萬張卡并行訓練、自動續訓,可為萬億級模型訓練提供高效、穩定的算力底座。
技術架構上,中國移動智算中心(哈爾濱)采用參數面與數據面獨立RDMA組網,參數面帶寬可達1.6Tbps,數據面吞吐可達15TB/s,能夠為大規模并行計算和復雜模型訓練提供堅實保障。此外,中心還實現了1.8萬卡超大規模云化納管、萬卡并行訓練以及分鐘級斷點自動續訓,極大提高了大模型訓練的效率與穩定性。
值得一提的是,為保障大模型訓練高效與穩定,智算中心上線了由移動云自研的智算管控平臺。該平臺實現了對主流AI卡多樣化異構算力的統一納管,支持大規模集群算、存、網等全量軟硬件的一站式健康檢查,實現AI任務全生命周期的精準管控。在集群出現故障時,該平臺能夠迅速定位并恢復,為智算中心的穩定運行提供了堅實的技術支撐。
中國移動智算中心(哈爾濱)的投產顯著增強了移動云國產化算力集群的交付與調優實力。移動云可提供公、私、邊多場景資源池建設服務,覆蓋硬件集成、軟件部署、性能調優及驗收測試等關鍵環節。同時,移動云已完成了包括LLaMA、GPT、GLM在內的數十款主流模型的云端遷移,具備大模型預訓練-遷移-精調微調-推理全流程調優能力,可以為國內企業提供強有力的技術支撐與定制化解決方案,助力AI技術快速應用與產業升級。
未來,移動云將繼續勇擔數字中國建設主力軍,推動數字化基礎設施建設,在數字經濟的浪潮中乘風破浪、勇立潮頭。
【以上內容為推廣信息,所涉及內容不代表本網觀點,不構成投資建議、消費建議。】