
6月30日,華為宣布開源盤古70億參數(shù)的稠密模型和720億參數(shù)的混合專家模型(盤古Pro MoE 72B)。此外,基于昇騰的模型推理技術(shù)也同步開源。華為表示,此舉是華為踐行昇騰生態(tài)戰(zhàn)略的又一關(guān)鍵舉措,將推動(dòng)大模型技術(shù)的研究與創(chuàng)新發(fā)展,加速推進(jìn)人工智能在千行百業(yè)的應(yīng)用與價(jià)值創(chuàng)造。
據(jù)了解,華為最新開源的Pro MoE 72B大模型,在參數(shù)量僅為720億,激活160億參數(shù)量的情況下,通過動(dòng)態(tài)激活專家網(wǎng)絡(luò)的創(chuàng)新設(shè)計(jì),實(shí)現(xiàn)了以小打大的優(yōu)異性能,甚至可以媲美千億級模型的性能表現(xiàn)。在業(yè)界權(quán)威大模型榜單Super CLUE最新公布的2025年5月排行榜上,位居千億參數(shù)量以內(nèi)大模型排行并列國內(nèi)第一。
最近一段時(shí)間以來,華為公開了一系列基于昇騰的大模型技術(shù),讓國內(nèi)AI開發(fā)者備感期待。
今年6月20日舉辦的華為開發(fā)者大會(huì)2025上,華為重磅發(fā)布了盤古大模型5.5。全新升級的盤古大模型5.5包含了五大基礎(chǔ)模型,分別面向NLP(自然語言處理)、多模態(tài)、預(yù)測、科學(xué)計(jì)算、計(jì)算機(jī)視覺領(lǐng)域,推動(dòng)大模型成為行業(yè)數(shù)智化轉(zhuǎn)型的核心動(dòng)力。會(huì)上,華為還發(fā)布了基于Cloud Matrix384超節(jié)點(diǎn)的新一代昇騰AI云服務(wù),將384顆昇騰NPU和192顆鯤鵬CPU通過高速網(wǎng)絡(luò)Matrix Link全對等互聯(lián),形成一臺(tái)超級“AI服務(wù)器”,單卡推理吞吐量躍升到2300Tokens/s,可為大模型應(yīng)用提供“澎湃算力”。
值得注意的是,今年5月30日,華為還重磅推出參數(shù)規(guī)模高達(dá)7180億的全新模型——盤古Ultra MoE。這是一個(gè)全流程在昇騰AI計(jì)算平臺(tái)上訓(xùn)練的準(zhǔn)萬億MoE模型。同時(shí),華為發(fā)布盤古Ultra MoE模型架構(gòu)和訓(xùn)練方法的技術(shù)報(bào)告,披露眾多技術(shù)細(xì)節(jié),充分體現(xiàn)了昇騰在超大規(guī)模MoE訓(xùn)練性能上的跨越。
這一系列突破,更為關(guān)鍵的意義在于,華為盤古大模型是基于昇騰云的全棧軟硬件訓(xùn)練而成的,這標(biāo)志著基于昇騰架構(gòu)可以打造出世界一流大模型。華為不僅完成了國產(chǎn)算力+國產(chǎn)模型的全流程自主可控的訓(xùn)練實(shí)踐,同時(shí)在集群訓(xùn)練系統(tǒng)的性能上也實(shí)現(xiàn)了業(yè)界領(lǐng)先,這意味著實(shí)現(xiàn)了從硬件到軟件、從訓(xùn)練到優(yōu)化、從基礎(chǔ)研究到工程落地的“全棧國產(chǎn)化”和“全流程自主可控”的閉環(huán),國產(chǎn)AI基礎(chǔ)設(shè)施的自主創(chuàng)新能力得到了進(jìn)一步驗(yàn)證。
此外,與其他大模型廠商相比,華為在大模型戰(zhàn)略上一直獨(dú)樹一幟,強(qiáng)調(diào)“不作詩,只做事”,堅(jiān)持為千行萬業(yè)“解難題,做難事”,加速千行萬業(yè)智能化升級。在盤古大模型5.5發(fā)布的同時(shí),華為五大盤古行業(yè)思考大模型(盤古醫(yī)學(xué)、盤古金融、盤古政務(wù)、盤古工業(yè)、盤古汽車)也同步上線。
華為常務(wù)董事、華為云計(jì)算CEO張平安介紹,在過去的一年中,盤古大模型持續(xù)深耕行業(yè),已在30多個(gè)行業(yè)、500多個(gè)場景中落地,在政務(wù)、金融、制造、醫(yī)療、煤礦、鋼鐵、鐵路、自動(dòng)駕駛、氣象等領(lǐng)域發(fā)揮巨大價(jià)值,重塑千行萬業(yè)。
因此,此次華為宣布開源盤古70億參數(shù)的稠密模型和720億參數(shù)的混合專家模型,一方面有助于更多開發(fā)者基于國產(chǎn)算力平臺(tái)開發(fā)大模型技術(shù),進(jìn)一步擴(kuò)展昇騰生態(tài);另一方面在開源的帶動(dòng)下,有助于吸引更多垂直行業(yè)以盤古大模型為基礎(chǔ)打造智能化解決方案,推動(dòng)大模型更廣泛更深入地賦能千行百業(yè)。