近日,字節(jié)跳動(dòng)起訴前實(shí)習(xí)生田某某篡改代碼攻擊公司內(nèi)部模型訓(xùn)練一案,已獲北京市海淀區(qū)人民法院正式受理。字節(jié)跳動(dòng)請(qǐng)求法院判令田某某賠償公司侵權(quán)損失800萬元及合理支出2萬元,并公開賠禮道歉。
11月28日,字節(jié)跳動(dòng)內(nèi)部知情人士向潮新聞?dòng)浾弑硎?,由于田某某為在讀博士,公司將其辭退后首先交由校方處理。但在事件處理期間,田某某多次對(duì)外否認(rèn),稱攻擊模型訓(xùn)練任務(wù)的不是自己,而是別的實(shí)習(xí)生,甚至報(bào)警稱遭到造謠??紤]到田某某完全沒有意識(shí)到錯(cuò)誤,且涉事行為已觸犯公司之會(huì)紅企公司最終決定向法院起訴,以表明公司嚴(yán)肅態(tài)度、杜絕類似事件再次發(fā)王。
今年10月19日,字節(jié)跳動(dòng)發(fā)布公告回應(yīng)一度登上熱搜榜的“大模型被實(shí)習(xí)生攻擊”的傳聞:經(jīng)公司內(nèi)部核實(shí),確有商業(yè)化技術(shù)團(tuán)隊(duì)實(shí)習(xí)生發(fā)生嚴(yán)重違紀(jì)行為,該實(shí)習(xí)生已被辭退。公告中字節(jié)跳動(dòng)還提到,涉事實(shí)習(xí)生惡意干擾商業(yè)化技術(shù)團(tuán)隊(duì)研究項(xiàng)目的模型訓(xùn)練任務(wù),但并不影響商業(yè)化的正式項(xiàng)目及線上業(yè)務(wù),也不涉及字節(jié)跳動(dòng)大模型等其他業(yè)務(wù),網(wǎng)傳“涉及8000多卡、損失上千萬美元”嚴(yán)重夸大。經(jīng)核實(shí),涉事人一直在商業(yè)化技術(shù)團(tuán)隊(duì)實(shí)習(xí),并沒有AI Lab實(shí)習(xí)經(jīng)歷。其社交媒體個(gè)人簡介及部分媒體報(bào)道有誤,該實(shí)習(xí)生已在8月被公司辭退。公司也將其行為同步給行業(yè)聯(lián)盟和所在學(xué)校,交由校方處理。
被一度傳聞受到攻擊的大模型為字節(jié)跳動(dòng)“豆包”大模型,是一款多模態(tài)預(yù)訓(xùn)練模型,于2024年5月15日發(fā)布。它包含多個(gè)模型,如豆包通用模型Pro、Lite等,支持文本、圖片、視頻等多種數(shù)據(jù)類型處理,具備跨模態(tài)理解和生成能力。豆包大模型廣泛應(yīng)用于內(nèi)容創(chuàng)作、智能客服、教育、醫(yī)療、工業(yè)設(shè)計(jì)、金融、自動(dòng)駕駛等領(lǐng)域。其技術(shù)特點(diǎn)包括高效訓(xùn)練和推理,以及根據(jù)需求自適應(yīng)調(diào)整模型參數(shù)。市場需求強(qiáng)勁,日均Tokens使用量超1.3萬億,展現(xiàn)出卓越的產(chǎn)品能力和市場競爭力,為各行各業(yè)帶來智能化變革。
有行業(yè)專家表示,該事件也反映了字節(jié)跳動(dòng)的安全管理問題,包括權(quán)限隔離、共用代碼的審計(jì)等。
編輯: 陳奉鳳
糾錯(cuò):[email protected]