科技圈又炸鍋了!華為開源盤古大模型剛收獲一波掌聲,就被卷入抄襲風(fēng)波,被質(zhì)疑基于其他廠商模型增量訓(xùn)練,這究竟咋回事?
原來是有研究稱,盤古Pro MoE模型和阿里云通義千問Qwen-2.5 14B模型的注意力參數(shù)分布高度相似,開源代碼文件還標注著其他團隊版權(quán)聲明,這難免讓人浮想聯(lián)翩,難道華為真“抄作業(yè)”了?
面對質(zhì)疑,華為盤古團隊迅速回應(yīng)。聲明表示,盤古Pro MoE是基于昇騰硬件平臺獨立開發(fā)、訓(xùn)練的基礎(chǔ)大模型,架構(gòu)設(shè)計和技術(shù)特性都有創(chuàng)新,還提出分組混合專家模型(MoGE)架構(gòu),解決了大規(guī)模分布式訓(xùn)練的負載均衡難題。
至于代碼中出現(xiàn)其他版權(quán)聲明,團隊解釋是部分基礎(chǔ)組件參考了業(yè)界開源實踐,嚴格按照開源許可證要求,清晰標注了版權(quán)聲明,這是開源社區(qū)常規(guī)操作,也是對知識產(chǎn)權(quán)的尊重。
抄襲質(zhì)疑在開源大模型領(lǐng)域不是頭一回。此前,零一萬物開源大模型、斯坦福大學(xué)的Llama3-V項目都陷入類似爭議。AI大模型開源定義、協(xié)議規(guī)則還不夠清晰,也沒有明確的法律界定,導(dǎo)致亂象叢生。
此次華為盤古團隊回應(yīng),不僅是對質(zhì)疑的有力反駁,也給行業(yè)提了個醒:在開源大模型賽道,創(chuàng)新是根本,合規(guī)是底線。只有堅守這兩點,才能在激烈競爭和復(fù)雜輿論中站穩(wěn)腳跟,推動行業(yè)健康發(fā)展 。