6月4日,兩名斯坦福大學(xué)生Aksh Garg和Siddharth Sharma,承認(rèn)抄襲清華和面壁智能聯(lián)合開(kāi)發(fā)的MiniCPM-Llama3-V2.5(以下簡(jiǎn)稱V2.5)多模態(tài)大模型事件,并在社交平臺(tái)公開(kāi)道歉、刪掉開(kāi)源項(xiàng)目。
該抄襲事件也得到了斯坦福大學(xué)AI實(shí)驗(yàn)室主任Christopher Manning的認(rèn)證,表?yè)P(yáng)了國(guó)內(nèi)大學(xué)、企業(yè)對(duì)開(kāi)源大模型的貢獻(xiàn),并表示對(duì)該事件毫不知情。
V2.5開(kāi)源地址:https://github.com/OpenBMB/MiniCPM-V?tab=readme-ov-file
兩位同學(xué)發(fā)的道歉信一樣
整個(gè)抄襲事件全過(guò)程
其實(shí)昨天這個(gè)事情在國(guó)內(nèi)相當(dāng)炸裂,登上了好幾個(gè)平臺(tái)的熱搜榜首,「AIGC開(kāi)放社區(qū)」就根據(jù)多方已經(jīng)證實(shí)的內(nèi)容,為大家梳理一下抄襲事件的全過(guò)程。
5月29日,斯坦福大學(xué)的AI團(tuán)隊(duì)宣稱,他們開(kāi)源了一款名叫Llama3-V的多模態(tài)模型(https://github.com/mustafaaljadery/llama3v已刪除無(wú)法訪問(wèn)),只需要500美元就能訓(xùn)練出超過(guò)GPT-4V、GeminiUltra、ClaudeOpus等眾多知名模型。
發(fā)布沒(méi)多久,Llama3-V便成為Hugging Face上非常火熱的一款開(kāi)源產(chǎn)品。
6月2日,有開(kāi)發(fā)者質(zhì)疑Llama3-V抄襲國(guó)內(nèi)清華和面壁智能聯(lián)合開(kāi)源的最新項(xiàng)目V2.5,主要抄襲的證據(jù)有以下幾點(diǎn)。
1)特色功能一樣:V2.5的特色功能之一是可以識(shí)別“清華簡(jiǎn)”,這是中國(guó)戰(zhàn)國(guó)時(shí)期寫(xiě)在竹子上的一種非常特殊且罕見(jiàn)的中國(guó)古文字。
而Llama3-V居然也能識(shí)別。但這個(gè)訓(xùn)練數(shù)據(jù)是清華2500多張竹簡(jiǎn)中掃描下來(lái)的,并非是從公開(kāi)訓(xùn)練數(shù)據(jù)中提取的。
2)Llama3-V的模型架構(gòu)、代碼、配置文件、分詞器基本一樣,只是增加了高斯噪聲、變量名稱不一樣而已。
3)重疊度高達(dá)87%:為了驗(yàn)證是否抄襲,用戶將V2.5與其他幾個(gè)基于Llama3的多模態(tài)模型進(jìn)行了比較,例如,Bunny-Llama-3-8B-V、Bunny-Llama-3-8B-V,模型的重疊率為0。但與Llama3-V進(jìn)行比對(duì)時(shí),重疊率居然高達(dá)87%。
此外,兩者還有非常相似的誤差分布。Llama3-V和V2.5分別做出了236個(gè)和194個(gè)錯(cuò)誤預(yù)測(cè),而重疊部分為182個(gè)。如果是原創(chuàng)模型根本不會(huì)有如此高的重疊度
4)犯的錯(cuò)誤一樣:用戶將Llama3-V用于測(cè)試WebAgent時(shí),居然與V2.5犯的錯(cuò)誤一樣。但V2.5使用的是內(nèi)部從未公開(kāi)過(guò)的訓(xùn)練數(shù)據(jù),這也再一次證明Llama3-V的抄襲行為。
網(wǎng)上還羅列出了不少抄襲的證據(jù),但上面4點(diǎn)是最致命的,基本都是同一架構(gòu)、訓(xùn)練數(shù)據(jù)才能犯的錯(cuò)誤Llama3-V居然全中了。
相當(dāng)于兩個(gè)人的臉型、眼睛、鼻子、嘴巴幾乎一模一樣,只是你的頭發(fā)比我多一些,難道就不認(rèn)我這個(gè)禿頭兄弟了嗎~
斯坦福AI實(shí)驗(yàn)室主任證實(shí)
起初這個(gè)抄襲事件并沒(méi)有引起太大關(guān)注,但隨著證據(jù)越來(lái)越多被實(shí)錘,就連斯坦福大學(xué)AI實(shí)驗(yàn)室主任Christopher Manning也下場(chǎng)道歉了,表示,犯了錯(cuò)誤就要勇于承!
同時(shí)表?yè)P(yáng)了清華大學(xué)對(duì)開(kāi)源項(xiàng)目的貢獻(xiàn),而他自己對(duì)該事件毫不知情。但是有人指出,這位教授在6月3日是知道該事件的。
兩位學(xué)生迫于各界壓力,昨天在社交平臺(tái)進(jìn)行了公開(kāi)道歉,但是態(tài)度并不是很誠(chéng)懇。首先,他們居然使用了同樣的道歉信,難道不需要仔細(xì)說(shuō)明一下你在這個(gè)項(xiàng)目的角色、最初想法以及為什么要這么做嗎?
還有一個(gè)就是甩鍋,兩位公開(kāi)道歉的學(xué)生表示,他們只是負(fù)責(zé)該模型的社區(qū)宣傳,實(shí)際寫(xiě)代碼的是一位叫Mustafa Aljadery的。
這就更嚴(yán)重了,既然你們只是負(fù)責(zé)宣傳,那為啥在作者欄那里加上自己的名字呢?在宣發(fā)的時(shí)候難道不驗(yàn)證一下論文和項(xiàng)目嗎?并且表示對(duì)V2.5這個(gè)開(kāi)源項(xiàng)目毫不知情。
都是成年人,既然犯錯(cuò)了,就應(yīng)該像個(gè)爺們一樣勇敢承擔(dān)起來(lái),下次改過(guò)就可以了。如果試圖繼續(xù)掩蓋,只會(huì)越描越黑。
這個(gè)抄襲事件也折射出了我國(guó)在AI芯片制裁的大背景下對(duì)大模型開(kāi)發(fā)、訓(xùn)練的無(wú)奈,沒(méi)有超強(qiáng)GPU集群支撐,只能從算法、腳骨、訓(xùn)練數(shù)據(jù)去打磨。
同時(shí)我們的大模型開(kāi)源生態(tài)也被低估了,通義千問(wèn)、面壁智能、百川智能等一大批優(yōu)秀的開(kāi)源項(xiàng)目已經(jīng)獲得了世界的認(rèn)可并迅速崛起。
本文素材來(lái)源網(wǎng)絡(luò)、斯坦福社交平臺(tái),如有侵權(quán)請(qǐng)聯(lián)系刪除
未經(jīng)允許不得轉(zhuǎn)載:RPA中國(guó) | RPA全球生態(tài) | 數(shù)字化勞動(dòng)力 | RPA新聞 | 推動(dòng)中國(guó)RPA生態(tài)發(fā)展 | 流 > 斯坦福抄襲清華、面壁智能大模型,當(dāng)事人已道歉、刪項(xiàng)目
熱門信息
閱讀 (14950)
1 2023第三屆中國(guó)RPA+AI開(kāi)發(fā)者大賽圓滿收官&獲獎(jiǎng)名單公示閱讀 (14047)
2 《Market Insight:中國(guó)RPA市場(chǎng)發(fā)展洞察(2022)》報(bào)告正式發(fā)布 | RPA中國(guó)閱讀 (13109)
3 「RPA中國(guó)杯 · 第五屆RPA極客挑戰(zhàn)賽」成功舉辦及獲獎(jiǎng)名單公示閱讀 (13031)
4 與科技共贏,與產(chǎn)業(yè)共進(jìn),第四屆ISIG中國(guó)產(chǎn)業(yè)智能大會(huì)成功召開(kāi)閱讀 (11741)
5 《2022年中國(guó)流程挖掘行業(yè)研究報(bào)告》正式發(fā)布 | RPA中國(guó)