首 頁 資訊 產業動態 發明·創新 探索·發現 科學麻辣燙 科技人物 專家講壇 新基建 院士知播

首頁>科技>資訊

破算力焦慮,萬卡集群來幫忙

2025年02月05日 14:44  |  來源:人民政協網 分享到: 

人民政協網2月5日電 百度智能云于近日成功點亮昆侖芯三代萬卡集群,業界認為,這一重大突破標志著百度在人工智能算力領域邁出了堅實一步。花旗銀行發布研報稱,DeepSeek、百度等中國模型展現出的高效和低成本優勢,將有助于加速全球AI應用開發,并在全球引發更多技術創新,推動2025年人工智能應用的拐點。中國工程院院士、清華大學計算機系教授鄭緯民也表示,當下構建國產自主萬卡系統充滿挑戰,但“至關重要”。

過去一年,人工智能行業在努力降低大模型使用成本,但算力緊張一直是導致成本居高不下的重要因素之一。百度通過自研芯片和建設大規模集群,不僅解決了自身算力供應的問題,還為整個行業提供了新的思路和方向。

從算力上看,超大規模并行計算能力可實現訓練效率躍升,萬卡集群可將千億參數模型的訓練周期大幅降低,滿足AI原生應用快速迭代的需求。? 隨著國產大模型的興起,萬卡集群也逐漸從“單任務算力消耗”到“集群效能最大化”過渡,通過模型優化、有效訓練率提升、動態資源分配等手段,智能調度任務,將訓練、微調、推理任務混合部署,從而提升集群綜合利用率,降低單位算力成本。

值得一提的是,在2024年9月完成升級的百度百舸AI異構計算平臺4.0(以下簡稱“百舸平臺”),在萬卡集群的建設中發揮了重要作用:其構建了十萬卡級別的超大規模HPN高性能網絡,針對跨地域通信中的高延遲問題,通過優化的拓撲結構、多路徑負載均衡策略及通信策略,實現了幾十公里的跨地域通信;在通信效率上,百舸通過擁塞控制算法和集合通信算法策略,保障了網絡的穩定性;在多芯混訓方面,百舸能夠將不同地點、不同規模的異構算力進行統一管理,構建起多芯資源池,當業務提交工作負載時,百舸可自動進行芯片選型,依據集群剩余的芯片資源,選擇性價比最高的芯片來運行任務;在集群穩定性方面,百舸提供了全面的故障診斷手段,能夠快速自動偵測到導致訓練任務異常的節點故障。(崔呂萍)

編輯:李律杉

久草日韩精品暖暖的在线视频,精品国产综合色在线,极品少妇粉嫩小泬精品视频,青青热久免费精品视频在线播放
中文字幕在线乱码页 | 亚洲免费a在线观看 | 一区二区国产精品 | 在线国产视频伊人 | 亚洲国产精品综合久久2007 | 亚洲国产天堂久久久久久 |