近日,華為常務董事、華為云計算CEO張平安在華為開發(fā)者大會上表示,盤古大模型5.5正式發(fā)布,自然語言處理(NLP)、計算機視覺(CV)、多模態(tài)、預測、科學計算五大基礎模型全面升級。同時,基于CloudMatrix 384超節(jié)點的新一代昇騰AI云服務全面上線,為大模型應用提供澎湃算力。
在過去的一年中,盤古大模型持續(xù)深耕行業(yè),已在30多個行業(yè)、500多個場景中落地,在政務、金融、制造、醫(yī)療、煤礦、鋼鐵、鐵路、自動駕駛、氣象等領域發(fā)揮巨大價值。本次大會上,華為云重磅發(fā)布盤古大模型5.5,五大基礎模型全面升級,為行業(yè)提供全新價值。
盤古自然語言處理NLP大模型:全新的718B深度思考模型是一個由256個專家組成的MoE大模型,在知識推理、工具調用、數學等領域大幅增強,實現能力領先。盤古大模型5.5在高效長序列、低幻覺、快慢思考融合、Agent等特性上進行升級,提升用戶體驗。例如,盤古提出了自適應快慢思考合一的技術,通過構建難度感知的快慢思考數據和兩階段漸進訓練,實現模型根據問題難易程度自適應地切換快慢思考,簡單問題敏捷回復,復雜問題深度思考,整體模型推理效率提升8倍。
盤古預測大模型:采用業(yè)界首創(chuàng)的triplet transformer統一預訓練架構,將不同行業(yè)的數據,包括工藝參數的表格數據,設備運行日志的時間序列數據,產品檢測的圖片數據進行統一的三元組編碼,并在同一框架內高效處理和預訓練,極大地提升預測大模型的精度,并大幅提升跨行業(yè)、跨場景的泛化性。
盤古科學計算大模型:華為云持續(xù)拓展盤古科學計算大模型與更多科學應用領域的結合。深圳氣象局基于盤古,進一步升級了“智霽”大模型,首次實現AI集合預報,能更直觀地反映天氣系統的演變可能性,減少單一預報模型的誤差。重慶市氣象局針對成渝地區(qū)降水局地性強,且降水強度大的特點,基于盤古打造了“天資·12h“氣象大模型,提升災害天氣的日內預報預警能力。深圳能源采用盤古進行中短期風光水發(fā)電量預測,減少發(fā)電側棄電,提升能源開發(fā)效率。
盤古計算機視覺CV大模型:華為云發(fā)布全新MoE架構的300億參數視覺大模型,這是目前業(yè)界最大的視覺模型,并全面支持圖像、紅外、激光點云、光譜、雷達等多維度、泛視覺的感知、分析與決策。另外,盤古CV大模型通過跨維度生成模型,構建油氣、交通、煤礦等工業(yè)場景稀缺的泛視覺故障樣本庫,極大地提升了業(yè)務場景的可識別種類與精度。
盤古多模態(tài)大模型:全新發(fā)布基于盤古多模態(tài)大模型的世界模型,可以為智能駕駛、具身智能機器人的訓練,構建所需要的數字物理空間,實現持續(xù)優(yōu)化迭代。例如,在智能駕駛領域,輸入首幀的行車場景、行車控制信息和路網數據,盤古世界模型就可以生成每路攝像頭的行車視頻和激光雷達的點云,能夠為智能駕駛生成大量的訓練數據,而無需依賴高成本的路采。
此外,隨著大模型訓練和推理對算力需求的爆炸式增長,傳統計算架構已難以支撐AI技術的代際躍遷。華為云新一代昇騰AI云服務基于CloudMatrix 384超節(jié)點,首創(chuàng)將384顆昇騰NPU和192顆鯤鵬CPU通過全新高速網絡MatrixLink全對等互聯,形成一臺超級“AI服務器”,單卡推理吞吐量躍升到2300 Tokens/s,與非超節(jié)點相比提升近4倍。超節(jié)點架構能更好地支持混合多專家MoE大模型的推理,可以實現“一卡一專家”,一個超節(jié)點可以支持384個專家并行推理,極大提升效率;同時,超節(jié)點還可以支持“一卡一算子任務”,靈活分配資源,提升任務并行處理,減少等待,將算力有效使用率(MFU)提升50%以上。
對于萬億、十萬億參數的大模型訓練任務,在云數據中心,還能將432個超節(jié)點級聯成最高16萬卡的超大集群;同時,超節(jié)點還可以支持訓推算力一體部署,如“日推夜訓”,訓推算力可靈活分配,幫助客戶資源使用最優(yōu)。當前,昇騰AI云服務已經成為AI基礎設施的最優(yōu)選擇,為科大訊飛、新浪、硅基流動、面壁智能、中科院、360等超過1300家客戶提供澎湃的AI算力,加速千行萬業(yè)智能化升級。
(審核編輯: 朝言)
分享