關于抄襲,華為最新回應
關鍵詞: 華為盤古大模型,昇騰生態,AI 抄襲爭議,知識產權保護,模型評估監管
6月30日,華為高調宣布開源其盤古大模型核心組件(Pangu Pro MoE),這一舉措被視為構建昇騰生態的關鍵一步。然而,僅僅四天后,一場突如其來的爭議將華為推上了輿論的風口浪尖。
2025年6月30日,華為高調宣布開源其盤古大模型核心組件(Pangu Pro MoE),包括70億參數稠密模型和720億參數的混合專家模型,這一舉措被視為構建昇騰生態的關鍵一步。然而,僅僅四天后,一場突如其來的爭議將華為推上了輿論的風口浪尖。
爭議爆發:相似度分析引發抄襲質疑
7月4日,一項發布于GitHub的研究引發了業界的廣泛關注。用戶@HonestAGI 通過“LLM 指紋”技術對華為盤古Pro MoE模型與阿里巴巴通義千問Qwen-2.5 14B模型進行了深入分析。結果顯示,兩者的注意力參數分布相似性高達0.927(1.0為完全一致),這一數值遠遠超出了業內0.7以下的正常差異范圍。由于深度學習模型訓練的高度隨機性,如此高的相似度自然引發了人們對盤古大模型是否涉嫌抄襲的質疑。
不僅如此,研究者還在盤古開源的代碼文件中發現了明確指向阿里巴巴的版權聲明——“Copyright 2024 The Qwen team, Alibaba Group”。這一發現進一步加劇了外界對盤古大模型的質疑聲浪,不少人認為這是盤古抄襲通義千問的“鐵證”。
華為回應:強調獨立開發與開源合規
面對洶涌而來的質疑,7月5日下午,華為旗下負責開發盤古大模型的諾亞方舟實驗室迅速發布聲明,堅決否認了抄襲指控。聲明指出,盤古Pro MoE開源模型是基于昇騰硬件平臺獨立開發、訓練的基礎大模型,并非基于其他廠商模型增量訓練而來。華為還特別強調了其在架構設計、技術特性等方面的關鍵創新,例如全球首個面向昇騰硬件平臺設計的分組混合專家模型(MoGE)架構,該架構有效解決了大規模分布式訓練的負載均衡難題,顯著提升了訓練效率。
對于代碼中出現的阿里版權聲明,華為方面解釋稱,盤古Pro MoE開源模型部分基礎組件的代碼實現參考了業界開源實踐,其中涉及其他開源大模型的部分開源代碼。華為表示,他們嚴格遵循開源許可證的要求,在開源代碼文件中清晰標注了開源代碼的版權聲明,這不僅是開源社區的通行做法,也符合業界倡導的開源協作精神。
內部爆料:員工自曝存在套殼、續訓、洗水印現象
然而,就在華為官方發布聲明后的第二天,7月6日凌晨,一位自稱是盤古大模型團隊的員工在網絡上自曝,稱團隊內部確實存在套殼、續訓、洗水印的現象。該員工表示,由于團隊初期算力有限,盡管做出了諸多努力,但效果并不理想,內部質疑聲和領導壓力與日俱增。在這種情況下,小模型實驗室多次套殼競品,而領導層對此采取了默許的態度,以換取短期成果。
網傳華為諾亞方舟實驗室員工爆料長文截圖
自曝內容還稱,經過內部分析,盤古Pro MoE實際上是使用Qwen 1.5 110B進行續訓,并通過加層、擴增ffn維度、添加盤古pi論文的一些機制等方式,湊夠了大約 135B的參數。為了洗掉千問的水印,團隊甚至采取了故意訓練臟數據等手段。此外,該員工還提到團隊曾選擇套殼DeepSeekv3進行續訓,通過凍住DeepSeek加載的參數來進行訓練。最后,該員工表示出于對技術倫理的堅持,決定離職并曝光這些內幕。截至目前,華為尚未對此自曝內容發表聲明。
業內觀點:爭議暴露AI大模型開源的模糊地帶
此次華為盤古大模型的抄襲爭議,引發了業內的廣泛討論。許多業內人士認為,僅憑“模型指紋”的相似度來判定抄襲并不完全科學,因為不同模型在架構設計、訓練數據和優化算法等方面存在諸多差異,單一的相似度指標難以全面反映模型之間的關系。此外,代碼中出現的開源版權聲明,只能說明華為在開發過程中使用了相關的開源代碼,并且遵循了開源協議,不能直接等同于抄襲。
這起爭議也暴露了當前AI大模型開源領域存在的一些問題。目前,行業對于模型權重的開源、借鑒乃至“化用”,缺乏統一、清晰的法律和道德標準。使用開源模型架構進行重新訓練、參考部分實現代碼、直接使用或微調他人訓練好的模型權重,這三者之間的界限并不明確,存在著較大的灰色地帶。此次事件無疑給整個行業敲響了警鐘,如何在開源的同時保護知識產權,如何建立更加科學、規范的模型評估和監管機制,成為了亟待解決的問題。
截至目前,涉事的GitHub庫已被刪除,阿里巴巴方面也尚未對此事發表公開回應。華為盤古大模型是否真的存在抄襲行為,目前尚無確鑿證據。但無論最終結果如何,這起爭議都將對AI大模型行業的發展產生深遠影響,促使企業和研究者更加重視技術創新和知識產權保護,推動行業朝著更加健康、有序的方向發展。
