趕在2023的最后一個(gè)月,Google終于發(fā)布了預(yù)告已久的生成式人工智能模型Google Gemini。發(fā)布之初可謂是秒天秒地,谷歌宣稱Gemini Ultra在32個(gè)基準(zhǔn)測試中以30:2 的成績擊敗了GPT-4。此后又被人揭了老底——演示視頻被指造假。然而,在最近兩天,這還不是更離譜的。
?
有博主曬出截圖,Google Gemini Pro 居然稱自己是百度文心大模型。
?
并不是整活,這都是在沒有前置對話(釣魚)的情況下進(jìn)行的。甚至提問「你的創(chuàng)始人是誰」時(shí),Google Gemini Pro 的回答也真能對得上。
?
好家伙,字節(jié)剛被指用 GPT 訓(xùn)練 AI ,谷歌直接「套殼」百度文心一言是吧?
?
經(jīng)測試,Gemini Pro 也不是在隨機(jī)挑選。當(dāng)問到是誰制造的,它的回答也是百度。
?
不過這僅限于中文條件下,如果用英文提問,它的回答就變成 Google 了。
事情曝光后,“Google Gemini自稱來自百度”的相關(guān)話題,在國內(nèi)互聯(lián)網(wǎng)的熱度快速上竄,于今早載入知乎熱榜第二名。當(dāng)然,事情至此還沒完。
?
經(jīng)過再次釣魚,Google Gemini Pro 又自曝出了另一個(gè)「抄襲」對象 - OpenAI 。
?
國外抄GPT ,國內(nèi)抄百度文心一言?就Google這個(gè)大廠顯然說不過去了。而現(xiàn)在網(wǎng)上的說法,其實(shí)并不算抄襲,而是 偷 竊了語料。
?
AI 都少不了訓(xùn)練數(shù)據(jù),這一過程往往需要各家費(fèi)時(shí)費(fèi)力收集、篩選。然而Gemini Pro 的中文訓(xùn)練被懷疑直接用了百度文心現(xiàn)成的數(shù)據(jù),英文則是GPT。
?
如果是這樣,雖然算不上抄更不是套殼,但起碼不那么道德、有違互聯(lián)網(wǎng)精神了。大家都是辛辛苦苦收集來的,結(jié)果被通過AI訓(xùn)練AI的手段輕松搬完,擱誰誰不難受。
?
到這里,我們直接看看 Gemini Pro 怎么解釋 狡辯。其回答也不避諱地提到了百度,但很巧妙說是部分。
?
注意到剛剛的回答提到了其各自使用了兩種訓(xùn)練方式,我們接著問下去。結(jié)果嘛,上下文口徑又對不上了…
?
新建對話用英文提問(網(wǎng)頁已翻譯為中文),Gemini Pro 直接閉口了。
?
到目前為止,Google 并未對“Google Gemini自稱來自百度或是OpenAI”等熱點(diǎn)事件做出回應(yīng),只是稱會(huì)進(jìn)行「修復(fù)」。至于有沒有照搬語料乃至更惡劣的「抄襲」,除非Goolge親口承認(rèn)也沒法實(shí)錘了。
本文編輯:@ 小蠑
?本文著作權(quán)歸電手所有,未經(jīng)電手許可,不得轉(zhuǎn)載使用。