盤古大模型

盤古大模型
開發者	華為
首次發布	3.0, 2023年7月7日，2年前
當前版本	5.0（2024年6月21日，17個月前）
語言	中文、英語、俄語
類型	大型語言模型
許可協議	專有軟體

盤古大模型是華為雲推出的一種人工智慧大模型，該模型在各種領域都有廣泛的應用，已在煤礦、鐵路、氣象、金融、代碼開發、數字內容生成等領域發揮作用。^[1]

大型學習語言模型的名稱「盤古」源自中國神話和民間傳說中的盤古，盤古是與創世有關的原始人物。^[2]

歷史

早期發展

2023年4月，華為發布論文詳細介紹了盤古-Σ的開發。盤古-Σ是一個擁有1.085萬億個參數的龐大語言模型。該模型基於華為MindSpore 5框架開發，在搭載512顆昇騰910 AI加速器晶片的集群系統上訓練超過100天，處理了40多種自然語言和程式語言的3290億個token。^[3]

盤古-Σ 融合了隨機路由專家和變壓器解碼器架構，可輕鬆提取子模型，用於對話、翻譯、代碼生成和自然語言解釋等各種應用。與具有相同超參數的混合專家模型相比，該模型的訓練吞吐量提高了6.3倍。在中文領域，它在零樣本設置下，在6個任務中的表現超越了之前最先進的模型。盤古-Σ 基於40個領域的數據集進行訓練，包括中文、英語、雙語和代碼，在少樣本學習（自然語言處理）、開放領域討論、問答、機器翻譯和代碼編寫方面表現出色。^[4]^[5]

發動

在2023年7月7日舉行的華為開發者大會上，華為推出盤古大模型3.0，利用華為雲解決方案為政府、金融、製造、採礦和氣象等行業量身定製。次月，華為推出具有人工智慧的智慧助手小藝，可根據用戶語音回復和生成文案，並將用於鴻蒙作業系統4.0所支持的設備。^[6]^[7]^[8]

LLM專為尋求在人工智慧行業中占據優勢的企業而設計，它注重任務執行而不是創造性工作，這與聊天機器人、詩歌和視覺內容創作等用於一般用途的傳統模型不同。^[9]

華為的LLM採用與ChatGPT相同的技術，具有分層架構，允許客戶將模型適應各種任務並在自己的數據集上進行訓練，使其適用於各個行業。^[10]

更新

2023年8月5日，華為與歐洲中期天氣預報中心合作，推出了一個全球天氣預報AI模型。該模型採用了華為雲解決方案以及基於MindSpore的盤古天氣模型。該模型可在ECMWF網站上訪問，旨在提供精準的天氣數據。^[11]^[12]

2023年12月19日，華為宣布面向全球市場推出基於盤古AI金融平台的金融服務。這家科技巨頭在2023年華為雲金融科技峰會上推出了這款產品，旨在以高效的功能重塑數字金融行業，助力全球金融科技公司發展。該平台融合了人工智慧、大數據分析和區塊鏈等多種先進技術。^[13]

2024年6月21日，在HDC 2024大會上，華為宣布升級版盤古5.0與鴻蒙星河版一同發布。該版本與鴻蒙集成，鴻蒙配備了更智能的虛擬助手小藝，並專注於對其大型語言模型平台進行生成式AI更新，用於創建新內容，例如文本、代碼或圖像。為了讓廣泛的開發者和企業能夠使用盤古，它提供了可擴展的選項：針對資源有限的用戶，提供計算能力較低的小型模型；針對需要更多處理能力的複雜任務，提供容量更大的大型模型。^[14]

2025年6月30日，華為宣布開源盤古70億參數的稠密模型、盤古Pro MoE 720億參數的混合專家模型。^[15]

技術規格

盤古大模型3.0面向行業應用，採用5+N+X三層架構。^[16]

第一層（L0）：包含盤古的五大基礎模型，為不同的行業場景提供豐富的能力。這些模型包括自然語言處理模型、視覺模型、多模態模型、預測模型和科學計算模型。
第二層（L1）：由N個大型行業特定模型組成。這些模型使用來自政府、金融、製造、採礦和氣象等各行各業的公共數據進行訓練。此外，它還使用來自L0和L1的客戶自有數據，為每個客戶量身定製訓練專有模型。
第三層（L2）：為客戶提供詳細的場景化模型。該層針對具體的應用或業務需求，提供可立即使用的模型服務。

華為雲業務部門更新的華為盤古模型5.0具有三大關鍵特性：適應不同業務場景、多風格建模和高級智能。華為將 AI 模型平台分為四個系列，每個系列具有不同的參數尺度：^[17]

盤古E系列：嵌入式版本支持手機、平板、PC等設備上的智能應用，參數規模達10億級。
盤古P系列：專業版擁有百億參數規模，非常適合低延遲、低成本的推理條件。
盤古U系列：Ultra版本有兩種版本，分別擁有1350億和2300億個參數，能夠處理複雜任務並作為大型模型的基礎。
盤古S系列：超級盤古是其頂級版本，擁有萬億級參數，旨在管理跨域或多任務應用等高級AI技術場景。

盤古氣象大模型

盤古氣象大模型（英語：Pangu-Weather）是盤古大模型的一個重要應用，它是首個精度超過傳統數值預報方法的AI預測模型。該模型突破了AI預報天氣精度不及傳統數值預報的世界性難題，對比傳統方法預測速度提升10000倍，可秒級完成對全球氣象的預測。盤古氣象大模型的水平空間解析度達到0.25°×0.25°，時間解析度為1小時，覆蓋13層垂直高度，可以精準地預測細粒度氣象特徵。^[18]

爭議

Pro MoE 模型指紋相似性爭議（2025 年）

2025年7月4日，一個在 GitHub 上新註冊的 "Honest AGI" 帳號發布技術報告^[19]^[20]^[21]，稱華為開源的 PanGu-Pro-MoE 72B 與阿里雲 Qwen 2.5-14B 模型在多頭注意力參數的標準差指紋上相關係數高達 0.927^[22]，據此推測盤古模型可能並非從零訓練，而是基於 Qwen 權重繼續訓練。該倉庫數小時後被刪除，同日晚間同名帳號重新建立鏡像倉庫並重發報告，引發外界對報告來源與方法的關注。與此同時，一封署名"華為諾亞方舟實驗室員工"的匿名長文《盤古之殤》在 GitHub 流傳^[23]^[24]，文章指稱團隊內部存在"套殼、洗水印"等做法，並描述了研發流程與管理矛盾。

華為官方說明

7月5日，華為諾亞方舟實驗室通過多家媒體發布聲明^[25]^[26]^[27]^[28]^[29]指出：盤古系列模型依託自研昇騰晶片全棧訓練，未在第三方模型權重上進行增量訓練；倉庫中出現的 Qwen 許可證屬於對開原始碼的合規引用^[30]；"標準差指紋"方法缺乏公認的科學驗證，不能據此認定模型同源。

社區與學術討論

多名研究者對 Honest AGI 報告的嚴謹性提出質疑^[31]，指出報告中列出的數篇參考文獻在 arXiv 檢索不到，且算法未經同行評審。亦有開發者復現該"指紋"算法並發現，不同架構或層數的模型之間亦可能出現較高相關性，認為數據不足以直接證明權重複用。截至2025年7月，尚無獨立第三方機構發布正式鑑定結論，事件仍在持續討論中^[32]。

參考資料

^ 华为云发布盘古大模型，全球规模最大、参数最多. 新華網. 2023-7-7 [2023-07-21]. （原始內容存檔於2023-07-21）. 請檢查|date=中的日期值 (幫助)
^ Nair, Arya M. Huawei rolls out latest version of its deep learning AI model, Pangu - GCC Business News. GCC Business News. 2023-07-08 [2024-05-29]. （原始內容存檔於2025-03-07）（美國英語）.
^ Upadhyay, Shyam Nandan. Huawei Researchers Develop LLM With 1.085 Trillion Parameters. AnalyticsIndiaMag. April 3, 2023 [13 February 2024]. （原始內容存檔於2024-02-26）.
^ Huawei Researchers Unveil Pangu-Σ: Trillion-Parameter Language Model with Sparse Architecture. Multiplatform.ai. [13 February 2024]. （原始內容存檔於2025-07-04）.
^ Tickoo, Aneesh. Huawei Researchers Develop Pangu-Σ: A Large Language Model With Sparse Architecture And 1.085 Trillion Parameters. marktechpost.com. [13 February 2024]. （原始內容存檔於2024-11-30）.
^ Li, Deng. Huawei Pangu AI models for Government, finance, manufacturing, mining, meteorology. Huawei Central. 2023-07-23 [2024-05-31]. （原始內容存檔於2024-03-02）（美國英語）.
^ Sarkar, Amy. Huawei launches Voice Assistant with large Pangu AI model. Huawei Central. 2023-08-04 [2024-05-31]. （原始內容存檔於2024-08-30）（美國英語）.
^ 华为鸿蒙 HarmonyOS 4 小艺语音助手升级 AI 大模型，支持自动写文案 - IT之家. www.ithome.com. [2024-05-31]. （原始內容存檔於2024-08-30）.
^ Revolutionizing Global AI Landscape: Huawei's PanGu Megamodel Set to Transform Industries Worldwide. LinkedIn. Grosso Link Sàrl. [13 February 2024]. （原始內容存檔於2025-04-26）.
^ Jarrett, Miranda. Huawei to revolutionise applications of AI with new Pangu model. Dao Insights. July 7, 2023 [13 February 2024]. （原始內容存檔於2025-07-24）.
^ Li, Deng. Huawei Pangu-Weather Model debuts European ECMWF website. HC Newsroom. August 5, 2023 [13 February 2024]. （原始內容存檔於2025-09-05）.
^ Mishra, Yash. Huawei Cloud will build large-scale high-precision regional weather forecast Pangu model. HC Newsroom. October 9, 2023 [13 February 2024]. （原始內容存檔於2025-06-21）.
^ Birch, Scott. Huawei Cloud and Pangu AI model reshaping finance industry. FinTech Magazine. December 19, 2023 [13 February 2024]. （原始內容存檔於2025-07-23）.
^ Staff Writer. Huawei Unveils New Harmony OS And AI Model In Continued Drive For Tech Self-reliance. Elnion. 2024-06-22 [2024-07-07]. （原始內容存檔於2025-08-26）（美國英語）.
^ 华为宣布开源部分盘古模型-新华网. www.news.cn. [2025-07-06]. （原始內容存檔於2025-07-26）.
^ Huawei launches latest AI model, Pangu 3.0. Business Today (Malaysia). July 8, 2023 [13 February 2024]. （原始內容存檔於2025-07-04）.
^ Matsui, Emiko. Huawei Cloud unveils Pangu Large Model 5.0. Huawei Central. 2024-06-21 [2024-07-07]. （原始內容存檔於2025-04-26）（美國英語）.
^ 华为云盘古大模型登Nature：秒级完成气象预测，速度快10000多倍. 澎湃新聞. 2023-7-7 [2023-07-21]. （原始內容存檔於2023-07-21）. 請檢查|date=中的日期值 (幫助)
^ Honest AGI. LLM-Fingerprint. GitHub. 2025-07-04 [2025-07-07]. （原始內容存檔於2025-07-06）（英語）.
^ 华为盘古到底有没有抄袭阿里Qwen？看完这篇技术分析你就知道了. cnBeta. 2025-07-07 [2025-07-07]. （原始內容存檔於2025-07-07）.
^ 如何看待华为盘古开源AI模型抄袭争议？. 新浪財經. 2025-07-07 [2025-07-07]. （原始內容存檔於2025-07-07）.
^ 华为"抄袭"阿里大模型？参数相似度92.7%背后的技术伦理. 網易. 2025-07-07 [2025-07-07]. （原始內容存檔於2025-07-07）.
^ 匿名. 盘古之殇：华为诺亚盘古大模型研发历程的心酸与黑暗. GitHub. 2025-07-06 [2025-07-07]. 原始內容存檔於2025-07-07 （中文）.
^ 华为盘古否认抄袭阿里后，其大模型员工自曝存在套壳、续训、洗水印. 新浪. 2025-07-07 [2025-07-07].
^ Huawei's AI lab denies that one of its Pangu models copied Alibaba's Qwen. Reuters. 2025-07-07 [2025-07-07]. （原始內容存檔於2025-07-07）（英語）.
^ 华为回应盘古Pro MoE抄袭质疑：基于昇腾平台开发，合规引用开源组件. 網易. 2025-07-05 [2025-07-07]. （原始內容存檔於2025-07-07）.
^ 华为团队回应盘古开源AI模型抄袭争议：并非基于其他模型增量训练. 新浪財經. 2025-07-05 [2025-07-07]. （原始內容存檔於2025-07-07）.
^ 华为盘古团队否认AI模型抄袭阿里通义千问. 聯合早報. 2025-07-07 [2025-07-07]. （原始內容存檔於2025-07-07）.
^ 盘古团队最新声明：严格遵循开源要求. 第一財經. 2025-07-05 [2025-07-07]. （原始內容存檔於2025-07-07）.
^ 华为盘古团队回应AI模型抄袭争议：严格遵循开源许可. 騰訊新聞. 2025-07-06 [2025-07-07]. （原始內容存檔於2025-07-07）.
^ 华为盘古到底有没有抄袭阿里Qwen？看完这篇技术分析你就知道了. 鳳凰網. 2025-07-07 [2025-07-07]. （原始內容存檔於2025-07-07）.
^ 盘古大模型陷抄袭风波：站在巨人的肩膀，莫让唯自研论反噬. 網易. 2025-07-07 [2025-07-07]. （原始內容存檔於2025-07-07）.

[xinhua-1] 华为云发布盘古大模型，全球规模最大、参数最多. 新華網. 2023-7-7 [2023-07-21]. （原始內容存檔於2023-07-21）. 請檢查|date=中的日期值 (幫助)

[2] Nair, Arya M. Huawei rolls out latest version of its deep learning AI model, Pangu - GCC Business News. GCC Business News. 2023-07-08 [2024-05-29]. （原始內容存檔於2025-03-07）（美國英語）.

[3] Upadhyay, Shyam Nandan. Huawei Researchers Develop LLM With 1.085 Trillion Parameters. AnalyticsIndiaMag. April 3, 2023 [13 February 2024]. （原始內容存檔於2024-02-26）.

[4] Huawei Researchers Unveil Pangu-Σ: Trillion-Parameter Language Model with Sparse Architecture. Multiplatform.ai. [13 February 2024]. （原始內容存檔於2025-07-04）.

[5] Tickoo, Aneesh. Huawei Researchers Develop Pangu-Σ: A Large Language Model With Sparse Architecture And 1.085 Trillion Parameters. marktechpost.com. [13 February 2024]. （原始內容存檔於2024-11-30）.

[6] Li, Deng. Huawei Pangu AI models for Government, finance, manufacturing, mining, meteorology. Huawei Central. 2023-07-23 [2024-05-31]. （原始內容存檔於2024-03-02）（美國英語）.

[7] Sarkar, Amy. Huawei launches Voice Assistant with large Pangu AI model. Huawei Central. 2023-08-04 [2024-05-31]. （原始內容存檔於2024-08-30）（美國英語）.

[8] 华为鸿蒙 HarmonyOS 4 小艺语音助手升级 AI 大模型，支持自动写文案 - IT之家. www.ithome.com. [2024-05-31]. （原始內容存檔於2024-08-30）.

[9] Revolutionizing Global AI Landscape: Huawei's PanGu Megamodel Set to Transform Industries Worldwide. LinkedIn. Grosso Link Sàrl. [13 February 2024]. （原始內容存檔於2025-04-26）.

[10] Jarrett, Miranda. Huawei to revolutionise applications of AI with new Pangu model. Dao Insights. July 7, 2023 [13 February 2024]. （原始內容存檔於2025-07-24）.

[11] Li, Deng. Huawei Pangu-Weather Model debuts European ECMWF website. HC Newsroom. August 5, 2023 [13 February 2024]. （原始內容存檔於2025-09-05）.

[12] Mishra, Yash. Huawei Cloud will build large-scale high-precision regional weather forecast Pangu model. HC Newsroom. October 9, 2023 [13 February 2024]. （原始內容存檔於2025-06-21）.

[13] Birch, Scott. Huawei Cloud and Pangu AI model reshaping finance industry. FinTech Magazine. December 19, 2023 [13 February 2024]. （原始內容存檔於2025-07-23）.

[14] Staff Writer. Huawei Unveils New Harmony OS And AI Model In Continued Drive For Tech Self-reliance. Elnion. 2024-06-22 [2024-07-07]. （原始內容存檔於2025-08-26）（美國英語）.

[15] 华为宣布开源部分盘古模型-新华网. www.news.cn. [2025-07-06]. （原始內容存檔於2025-07-26）.

[16] Huawei launches latest AI model, Pangu 3.0. Business Today (Malaysia). July 8, 2023 [13 February 2024]. （原始內容存檔於2025-07-04）.

[17] Matsui, Emiko. Huawei Cloud unveils Pangu Large Model 5.0. Huawei Central. 2024-06-21 [2024-07-07]. （原始內容存檔於2025-04-26）（美國英語）.

[thepaper-18] 华为云盘古大模型登Nature：秒级完成气象预测，速度快10000多倍. 澎湃新聞. 2023-7-7 [2023-07-21]. （原始內容存檔於2023-07-21）. 請檢查|date=中的日期值 (幫助)

[19] Honest AGI. LLM-Fingerprint. GitHub. 2025-07-04 [2025-07-07]. （原始內容存檔於2025-07-06）（英語）.

[20] 华为盘古到底有没有抄袭阿里Qwen？看完这篇技术分析你就知道了. cnBeta. 2025-07-07 [2025-07-07]. （原始內容存檔於2025-07-07）.

[21] 如何看待华为盘古开源AI模型抄袭争议？. 新浪財經. 2025-07-07 [2025-07-07]. （原始內容存檔於2025-07-07）.

[22] 华为"抄袭"阿里大模型？参数相似度92.7%背后的技术伦理. 網易. 2025-07-07 [2025-07-07]. （原始內容存檔於2025-07-07）.

[23] 匿名. 盘古之殇：华为诺亚盘古大模型研发历程的心酸与黑暗. GitHub. 2025-07-06 [2025-07-07]. 原始內容存檔於2025-07-07 （中文）.

[24] 华为盘古否认抄袭阿里后，其大模型员工自曝存在套壳、续训、洗水印. 新浪. 2025-07-07 [2025-07-07].

[25] Huawei's AI lab denies that one of its Pangu models copied Alibaba's Qwen. Reuters. 2025-07-07 [2025-07-07]. （原始內容存檔於2025-07-07）（英語）.

[26] 华为回应盘古Pro MoE抄袭质疑：基于昇腾平台开发，合规引用开源组件. 網易. 2025-07-05 [2025-07-07]. （原始內容存檔於2025-07-07）.

[27] 华为团队回应盘古开源AI模型抄袭争议：并非基于其他模型增量训练. 新浪財經. 2025-07-05 [2025-07-07]. （原始內容存檔於2025-07-07）.

[28] 华为盘古团队否认AI模型抄袭阿里通义千问. 聯合早報. 2025-07-07 [2025-07-07]. （原始內容存檔於2025-07-07）.

[29] 盘古团队最新声明：严格遵循开源要求. 第一財經. 2025-07-05 [2025-07-07]. （原始內容存檔於2025-07-07）.

[30] 华为盘古团队回应AI模型抄袭争议：严格遵循开源许可. 騰訊新聞. 2025-07-06 [2025-07-07]. （原始內容存檔於2025-07-07）.

[31] 华为盘古到底有没有抄袭阿里Qwen？看完这篇技术分析你就知道了. 鳳凰網. 2025-07-07 [2025-07-07]. （原始內容存檔於2025-07-07）.

[32] 盘古大模型陷抄袭风波：站在巨人的肩膀，莫让唯自研论反噬. 網易. 2025-07-07 [2025-07-07]. （原始內容存檔於2025-07-07）.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]

[29]

[30]

[31]

[32]