就在昨天,OpenAI 在其官網(wǎng)發(fā)布了一份關(guān)于GPT-4o的安全措施及風(fēng)險(xiǎn)評(píng)估的研究文件,即GPT-4o System Card。當(dāng)然,事情本身并算不得上啥新鮮事兒,此前的GPT4乃至DALL-E 3都有相關(guān)的研究文件,值得一提的是其中的內(nèi)容。
GPT-4o發(fā)布也有差不多三個(gè)月的時(shí)間了,不過(guò)早在這之前,隨著GPT的強(qiáng)勢(shì)表現(xiàn),以及團(tuán)隊(duì)內(nèi)成員的公開(kāi)質(zhì)疑,AI威脅論的論調(diào)也在不斷發(fā)酵。而作為一款公開(kāi)發(fā)布的新產(chǎn)品,GPT-4o自然也難免審查。
早在其發(fā)布前夕,OpenAI 動(dòng)用了一組外部紅隊(duì)人員(即試圖找出系統(tǒng)弱點(diǎn)的安全專(zhuān)家)來(lái)查找模型中的關(guān)鍵風(fēng)險(xiǎn)。比如審查GPT-4o是否會(huì)在未經(jīng)授權(quán)的情況下克隆某人的聲音、制作色情和暴力內(nèi)容,或者復(fù)制受版權(quán)保護(hù)的音頻片段。而現(xiàn)在,結(jié)果出爐了。
根據(jù) OpenAI 自己的研究框架,研究人員發(fā)現(xiàn) GPT-4o 具有 "中等 "風(fēng)險(xiǎn)。風(fēng)險(xiǎn)評(píng)估等級(jí)取四個(gè)總體類(lèi)別中的最高風(fēng)險(xiǎn)評(píng)級(jí),即在網(wǎng)絡(luò)安全、生物威脅、說(shuō)服能力和模型自主性四個(gè)風(fēng)險(xiǎn)評(píng)級(jí)中,說(shuō)服能力被評(píng)為了“Medium”(中等)。
他們還發(fā)現(xiàn),GPT-4o 的一些寫(xiě)作樣本比人類(lèi)創(chuàng)作的文本更能左右讀者的觀點(diǎn)。當(dāng)然,引經(jīng)據(jù)典的確是AI的特色,至于這個(gè)數(shù)據(jù)對(duì)不對(duì),名人有沒(méi)有說(shuō)過(guò)的類(lèi)似的話,那就是另一回事了。
在接受?chē)?guó)外媒體The Verge采訪時(shí),OpenAI 發(fā)言人表示這份研究報(bào)告(GPT-4o System Card),由OpenAI內(nèi)部團(tuán)隊(duì)以及模型評(píng)估與威脅研究公司(METR)和阿波羅研究公司(Apollo Research)共同參與完成。
的確,表明上客觀與公正的確是有了,但也正如上面所說(shuō),OpenAI不僅面臨著員工背刺,還承擔(dān)政治上的壓力。畢竟能同時(shí)被自家員工,州參議員組團(tuán)發(fā)聲明質(zhì)疑AI安全性的公司可不多見(jiàn)。
The Verge此前還報(bào)道了參議員伊麗莎白-沃倫(Elizabeth Warren)和眾議員洛里-特拉漢(Lori Trahan)的一封公開(kāi)信,信中要求 OpenAI 回答如何處理舉報(bào)人和安全審查。
此間更不乏“群眾的呼聲”,很多人都在呼吁OpenAI提高透明度,來(lái)要求公開(kāi)訓(xùn)練數(shù)據(jù)的來(lái)源以及開(kāi)發(fā)進(jìn)度。而作為實(shí)干派的部分州議員已經(jīng)在推動(dòng)對(duì)大預(yù)言模型進(jìn)行立法監(jiān)管。莫名有一種天網(wǎng)既視感……
至少明面上看OpenAI還是愿意做風(fēng)險(xiǎn)評(píng)估與控制的,遠(yuǎn)遠(yuǎn)還達(dá)不到一眾AI威脅論中所提及的程度。話說(shuō)回來(lái),既當(dāng)裁判員又當(dāng)運(yùn)動(dòng)員,這份GPT-4o System Card可信度幾何,真的很難說(shuō)。
本文編輯:@ 江城子
?本文著作權(quán)歸電手所有,未經(jīng)電手許可,不得轉(zhuǎn)載使用。