夜夜揉揉日日人人青青,偷窥精品在线视频,精品妇女一区二区三区,a√天堂98国产在线

<span id="lndpy"></span>
  • <small id="lndpy"><del id="lndpy"><rt id="lndpy"></rt></del></small><dfn id="lndpy"></dfn>
    <bdo id="lndpy"><delect id="lndpy"><legend id="lndpy"></legend></delect></bdo>
  • <address id="lndpy"><ul id="lndpy"><strike id="lndpy"></strike></ul></address>
    狂飆的春天:國產(chǎn)AI大模型扎根涌現(xiàn)的兩個(gè)月,給我們帶來了什么?

    狂飆的春天:國產(chǎn)AI大模型扎根涌現(xiàn)的兩個(gè)月,給我們帶來了什么?

    huangxinzhen 2025-03-27 康復(fù)事項(xiàng) 14 次瀏覽 0個(gè)評論

    ·從2023年2月20日“國內(nèi)第一個(gè)對話式大型語言模型”MOSS發(fā)布,到4月21日該模型正式開源,兩個(gè)月間,多家中國企業(yè)和研究機(jī)構(gòu)以加速度扎堆沖入被ChatGPT轟炸出來的AI大模型賽道。在梳理這些大模型所試圖呈現(xiàn)的特點(diǎn)之后,我們該如何看待這種趨勢?

    ·如何判斷各家大模型的水平?“通常需要使用測試數(shù)據(jù)集來評估大模型性能,也可以根據(jù)模型中的參數(shù)數(shù)量來判斷模型的復(fù)雜度。模型的響應(yīng)時(shí)間也是一個(gè)重要的衡量因素,最主要的還是在線上環(huán)境實(shí)際應(yīng)用時(shí),通過監(jiān)測模型在生產(chǎn)環(huán)境中的表現(xiàn)來判斷其水平?!?/u>

    ChatGPT的發(fā)布就像打開了“潘多拉的盒子”,在中國引發(fā)了一場你追我趕的“狂飆”。

    2023年2月20日深夜,MOSS的官網(wǎng)因服務(wù)器流量過載癱瘓,這是中國人對ChatGPT類產(chǎn)品興趣暴增的最初征兆之一。

    此MOSS不是《流浪地球》系列電影里的機(jī)器人,而是復(fù)旦大學(xué)邱錫鵬教授團(tuán)隊(duì)發(fā)布的“國內(nèi)第一個(gè)對話式大型語言模型”。兩個(gè)月后的4月21日,MOSS正式開源,成為國內(nèi)首個(gè)插件增強(qiáng)的開源對話語言模型。

    狂飆的春天:國產(chǎn)AI大模型扎根涌現(xiàn)的兩個(gè)月,給我們帶來了什么?

    這兩個(gè)月,注定會(huì)成為中國科技與商業(yè)界被銘記的兩個(gè)月。一切都按下了快進(jìn)鍵,時(shí)間仿佛被壓縮,中國企業(yè)和研究機(jī)構(gòu)以加速度扎堆沖入這個(gè)被ChatGPT轟炸出來的新賽道。

    據(jù)澎湃科技(www.thepaper.cn)不完全統(tǒng)計(jì),目前國內(nèi)已發(fā)布的所謂AI大模型已超過20個(gè),除了百度、阿里等大廠,創(chuàng)新工場董事長李開復(fù)、百川智能CEO王小川、出門問問CEO李志飛等紛紛宣示入局。各類大模型名字五花八門,有竭力體現(xiàn)中國文化深厚內(nèi)涵的,也有從國際知名數(shù)學(xué)家的理論中引經(jīng)據(jù)典的。

    回顧這狂飆突進(jìn)的兩個(gè)月,澎湃科技梳理了一些主要國產(chǎn)大模型所試圖呈現(xiàn)的特點(diǎn)。除此之外,兩個(gè)至關(guān)重要的問題也被提出:我們該如何判斷這些大模型?喧囂之下應(yīng)該有怎樣的冷靜思考?

    從MOSS開始:為什么要堅(jiān)持做開源?

    “我們的計(jì)算資源不足以支持如此大的訪問量,并且作為學(xué)術(shù)團(tuán)隊(duì)我們也沒有相關(guān)的工程經(jīng)驗(yàn),給大家造成非常不好的體驗(yàn)和第一印象,在此向大家致以真誠的歉意?!?月21日,在MOSS官網(wǎng)被“擠癱”后,其開發(fā)團(tuán)隊(duì)發(fā)布聲明誠懇致歉,并表示,“中國版ChatGPT的誕生還需要中國全體AI從業(yè)者的努力,也更需要不斷和人交互以提高能力?!?/p>

    這種謙虛、低調(diào)、懷著“繼續(xù)學(xué)習(xí)”態(tài)度的回應(yīng),成為此后多個(gè)國產(chǎn)大模型設(shè)定敘事基調(diào)的先例。

    根據(jù)邱錫鵬團(tuán)隊(duì)的介紹,MOSS可執(zhí)行對話生成、編程、事實(shí)問答等一系列任務(wù),打通了讓生成式語言模型理解人類意圖并具有對話能力的全部技術(shù)路徑。

    這款模型引發(fā)關(guān)注的一個(gè)點(diǎn)是,它的英文回答水平比中文高,開發(fā)團(tuán)隊(duì)解釋稱,“因?yàn)樗哪P突鶎W(xué)習(xí)了3000多億個(gè)英文單詞,中文詞語只學(xué)了約300億個(gè)?!?/p>

    粵港澳大灣區(qū)數(shù)字經(jīng)濟(jì)研究院(IDEA)認(rèn)知計(jì)算與自然語言中心文本生成算法團(tuán)隊(duì)負(fù)責(zé)人王昊對澎湃科技表示,“相較于英文數(shù)據(jù),中文數(shù)據(jù)的開源程度較低,導(dǎo)致中文數(shù)據(jù)集的規(guī)模相對較小。此外,英文作為科研主流語言,在學(xué)術(shù)界和工業(yè)界中得到廣泛應(yīng)用,積累了大量高質(zhì)量的語料數(shù)據(jù),這為英文自然語言處理的研究提供了極大的優(yōu)勢?!?/p>

    MOSS的橫空出世,令復(fù)旦大學(xué)邱錫鵬團(tuán)隊(duì)一舉成名。在多個(gè)公開場合,邱錫鵬對大型語言模型的研究與發(fā)展做出了詳細(xì)闡釋。

    4月1日,邱錫鵬在一個(gè)論壇上介紹,整體而言,MOSS基于公開的中英文數(shù)據(jù)訓(xùn)練,目前已經(jīng)擁有200億參數(shù),具有和人類對話的能力,并可以通過與人類交互實(shí)現(xiàn)迭代優(yōu)化。與此同時(shí),他也坦承,盡管對語言的理解能力和ChatGPT已經(jīng)非常相近,但是目前MOSS的整體完成度并不高,主要原因在于MOSS在部署和訓(xùn)練上投入的資本還非常有限,相較于千億級(jí)的ChatGPT,大概只是其規(guī)模的十分之一,所以MOSS還有很多事實(shí)類知識(shí)記不住,思維鏈能力也相對較差。目前團(tuán)隊(duì)也在積極嘗試引入一些外部工具,來進(jìn)一步擴(kuò)大模型參數(shù)規(guī)模,不斷改進(jìn)與優(yōu)化。

    在上述論壇的圓桌討論中,邱錫鵬談到了為什么MOSS要開源?!癕OSS還是想以開源的形式去做,為什么美國卡我們脖子,一卡一個(gè)準(zhǔn),就是我們的生態(tài)沒有建好。OpenAI做ChatGPT的時(shí)候,它不需要分心做其他東西,只是把模型做好。微軟幫它做算力,還有一家開源公司幫它做部署,也有專門的公司來進(jìn)行數(shù)據(jù)清洗。它是在整個(gè)生態(tài)中去做的,生態(tài)促使它發(fā)展非常快。”他說,“而我們國內(nèi)每家公司都要做,這就會(huì)產(chǎn)生一個(gè)問題,每家都做不大,每個(gè)都做自己的,所有的東西都自己來,又不愿意跟別人分享。每家數(shù)據(jù)、算力有限,也沒有多少錢可以支持研發(fā),又在做一些很基礎(chǔ)、重復(fù)性的事情?!?/p>

    邱錫鵬表示,有了MOSS后就不用做底層的重復(fù)性工作,把整個(gè)生態(tài)建起來?!叭绻覀冇幸粋€(gè)統(tǒng)一的語言、統(tǒng)一的基座,下面對接一下國產(chǎn)的算力,做好一份接口,大家就都可以來用,能夠去促進(jìn)生態(tài)鏈的建設(shè),使得整個(gè)中國的AI往前進(jìn)一步發(fā)展?!?/p>

    4月21日,新版MOSS模型正式上線,不僅更加成熟,而且還增加了“搜索引擎、計(jì)算器、解方程、文生圖”等插件功能,既可在線體驗(yàn),也支持本地部署?!癎PT-4也能接入各種插件,這種能力在大模型落地應(yīng)用過程中會(huì)很有價(jià)值?!鼻皴a鵬說。同時(shí),MOSS大模型相關(guān)代碼、數(shù)據(jù)、模型參數(shù)已在Github和Hugging Face等平臺(tái)開放。

    文心一言:最受矚目,備受爭議

    3月16日,北京,身著白色襯衫和小白鞋的百度CEO李彥宏親自上臺(tái),發(fā)布了備受關(guān)注的大語言模型“文心一言”。百度由此成為國內(nèi)第一家發(fā)布類ChatGPT大模型的企業(yè)。

    李彥宏從文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理推算、中文理解和多模態(tài)生成五個(gè)方面展示了“文心一言”的能力。展示方式并非現(xiàn)場直播演示,而是播放了提前錄制的視頻。發(fā)布會(huì)進(jìn)行到一半,百度的股價(jià)跌幅一度擴(kuò)大至近10%。

    “文心一言”的發(fā)布,可以說是關(guān)注度最高,爭議聲也最大。因此,李彥宏在發(fā)布會(huì)一開始就降低預(yù)期,坦率承認(rèn),“文心一言”在測試時(shí)還是有許多不完美之處,但因?yàn)槭袌鲂枨螅蠹叶枷M缫稽c(diǎn)用上最新最先進(jìn)的大語言模型,所以選擇在此時(shí)推出。

    根據(jù)百度的介紹,“文心一言”的參數(shù)規(guī)模為2600億。在發(fā)布會(huì)現(xiàn)場,當(dāng)澎湃科技詢問李彥宏如何解決類ChatGPT產(chǎn)品都會(huì)出現(xiàn)的“一本正經(jīng)胡說八道”問題時(shí),李彥宏表示,“百度在這個(gè)方面確實(shí)有優(yōu)勢,我們做了知識(shí)增強(qiáng)和檢索增強(qiáng)。”

    百度一直強(qiáng)調(diào),它是全球?yàn)閿?shù)不多在芯片層、框架層、模型層和應(yīng)用層四層進(jìn)行全棧布局的人工智能公司?!皬母叨诵酒鲂?,到飛槳深度學(xué)習(xí)框架,再到文心預(yù)訓(xùn)練大模型,到搜索、智能云、自動(dòng)駕駛、小度等應(yīng)用,各個(gè)層面都有領(lǐng)先業(yè)界的自研技術(shù)?!崩顝┖暾f。

    科技自媒體“AI科技評論”分析稱,百度有近水樓臺(tái)的智能云、充裕且體系健全的算力、運(yùn)行平穩(wěn)的深度學(xué)習(xí)框架、一群具有多年AI開發(fā)經(jīng)驗(yàn)的人才,最重要的,還有一個(gè)日活數(shù)十億搜索引擎來提供中文的本地化數(shù)據(jù)——某種程度上,距離大模型的完成形態(tài),具備了大多數(shù)的硬條件。

    發(fā)布會(huì)后,一些搶先測試“文心一言”的用戶陸續(xù)曬出了測試截圖,其文生圖功能的質(zhì)量尤其引發(fā)熱議,不乏激烈的爭論。而李彥宏的回應(yīng)是:“外界反饋跟我預(yù)期差不多。”“你去看ChatGPT,在剛推出的時(shí)候,外界反饋比‘文心一言’還要糟糕?!?/p>

    “整體而言,這類大語言模型還遠(yuǎn)未到發(fā)展完善的階段,它們有時(shí)候會(huì)有很驚艷的表現(xiàn),但不少場景下,細(xì)究起來還有明顯的bug,進(jìn)步空間很大。未來這段時(shí)間它一定會(huì)飛速發(fā)展,日新月異?!痹诎l(fā)布會(huì)上,李彥宏也提前打了預(yù)防針。

    科技行業(yè)媒體人何帥認(rèn)為,“如果說和ChatGPT的差距,‘文心一言’只差訓(xùn)練量。ChatGPT跑了好幾年,‘文心一言’不可能一下子趕上。百度之前做了很多‘半途而廢’的事,外賣、地圖、電商、元宇宙,都追逐過風(fēng)口,又沒追上,多多少少浪費(fèi)了技術(shù)底蘊(yùn)。但現(xiàn)在做回‘文心一言’,我還是有信心的。百度有技術(shù)能力和知識(shí)圖譜,如果百度做不好,國內(nèi)可能真的沒有哪家企業(yè)能做好了?!?/p>

    “可控大模型生態(tài)鏈”與“消費(fèi)級(jí)顯卡本地部署”

    在“文心一言”正式發(fā)布的同月,還有兩個(gè)相對不太引人關(guān)注的大模型被推出。3月14日,瀾舟科技創(chuàng)始人兼CEO周明在北京創(chuàng)新工場總部舉辦的“AI 1.0到AI 2.0的新機(jī)遇”趨勢分享會(huì)上宣布,瀾舟科技推出孟子對話大模型(MChat)。

    根據(jù)該公司的介紹,周明從微軟亞洲研究院辭職后創(chuàng)辦瀾舟科技,開始孵化孟子通用預(yù)訓(xùn)練模型。MChat具有類ChatGPT的能力,同時(shí)具備原有的孟子多項(xiàng)目功能引擎。“兩者結(jié)合使得其具有ChatGPT的對話能力,又同時(shí)具備工業(yè)級(jí)尤其To B服務(wù)器所需要的翻譯、生成、信息搜索等方面的能力。”

    瀾舟科技提出以MChat構(gòu)筑一個(gè)相對完善的可控大模型生態(tài)鏈。這個(gè)“可控”特色,是指其能力相較于其他同類技術(shù)更為靈活,面向垂直領(lǐng)域、專業(yè)賽道落地會(huì)更加聚焦,可以根據(jù)行業(yè)、地域等需求做出快速調(diào)整。更具體而言,MChat大模型底層是個(gè)“通用底座”,提供了涵蓋語言預(yù)訓(xùn)練模型、多模態(tài)預(yù)訓(xùn)練模型、垂直領(lǐng)域預(yù)訓(xùn)練模型和其他預(yù)訓(xùn)練模型等能力。在通用底座之上,架構(gòu)“能力平臺(tái)”提供知識(shí)圖譜、輔助寫作、機(jī)器翻譯、情感分析、智能檢索、智能客服、文檔解析等多領(lǐng)域的模塊化能力。

    在這個(gè)分享會(huì)上,同為微軟亞洲研究院出身的創(chuàng)新工場董事長兼首席執(zhí)行官李開復(fù)提出了一個(gè)觀點(diǎn):在深度學(xué)習(xí)的重大突破之后,AI已經(jīng)處于從1.0邁入2.0的拐點(diǎn)。AI 2.0將會(huì)帶來平臺(tái)式的變革,改寫用戶的入口和界面,誕生全新平臺(tái),催生新一代AI 2.0應(yīng)用的研發(fā)和商業(yè)化。

    六天后,李開復(fù)在其微信朋友圈宣布:正在親自籌組全球化AI新公司Project AI 2.0,目標(biāo)“不僅僅要做中文版ChatGPT”,目前資金、算力陸續(xù)到位,希望在全球范圍內(nèi)“招賢納士”。當(dāng)被問及具體計(jì)劃時(shí),創(chuàng)新工場方面回復(fù)澎湃科技:剛開始籌辦,有進(jìn)一步對外規(guī)劃時(shí)再回復(fù)。

    同樣在3月14日,清華大學(xué)的自然語言處理研究團(tuán)隊(duì)、知識(shí)工程和數(shù)據(jù)挖掘小組開源了60億參數(shù)的ChatGLM-6B模型,并開始內(nèi)測對話機(jī)器人ChatGLM。

    該團(tuán)隊(duì)在官方博客中介紹,ChatGLM是一個(gè)初具問答和對話功能的千億中英語言模型, 并針對中文進(jìn)行了優(yōu)化。而中英雙語對話GLM模型ChatGLM-6B則結(jié)合了模型量化技術(shù),用戶可以在消費(fèi)級(jí)的顯卡上進(jìn)行本地部署?!?2億參數(shù)的ChatGLM-6B雖然規(guī)模不及千億模型,但大大降低了用戶部署的門檻,并且已經(jīng)能生成相當(dāng)符合人類偏好的回答?!?/p>

    能夠在消費(fèi)級(jí)顯卡上進(jìn)行本地部署,吸引了大量愛好者動(dòng)手嘗試,ChatGLM-6B在知乎等社交媒體的討論圈里引發(fā)了熱烈討論和一些正面反饋。

    視覺技術(shù)起家,商湯強(qiáng)調(diào)“多模態(tài)”和B端

    到了4月,加速又進(jìn)了一步。

    4月10日,商湯科技召開新聞發(fā)布會(huì),發(fā)布“日日新SenseNova”大模型體系。該體系含中文語言大模型應(yīng)用平臺(tái)“商量SenseChat”、圖片生成模型“秒畫SenseMirage”、AI數(shù)字人視頻生成平臺(tái)“如影SenseAvatar”、3D內(nèi)容生成平臺(tái)“瓊宇SenseSpace”和“格物SenseThings”等。一系列名字令人眼花繚亂,而“日日新”則取自《禮記·大學(xué)》,湯之盤銘:茍日新,日日新,又日新。

    商湯介紹稱,作為千億級(jí)參數(shù)的自然語言處理模型,“商量”能夠提供以下功能:編程助手,幫助開發(fā)者編寫和調(diào)試代碼;健康咨詢助手,為用戶提供個(gè)性化的醫(yī)療建議;PDF文件閱讀助手,能輕松從復(fù)雜文檔中提取和概括信息等能力。商湯科技聯(lián)合創(chuàng)始人王曉表示,“商量”未來主要面向B端。

    在發(fā)布會(huì)現(xiàn)場,基于超10億參數(shù)的圖像模型“秒畫”生成的港風(fēng)照片獲得了較為熱烈的反應(yīng)。值得注意的是,商湯以機(jī)器視覺技術(shù)起家,算力儲(chǔ)備較為充裕。2019年,商湯于上海臨港建設(shè)人工智能計(jì)算中心,到目前共有5000P算力,大裝置擁有2.7萬塊GPU芯片卡,可以實(shí)現(xiàn)自供算力訓(xùn)練大模型。

    不過,商湯在發(fā)布會(huì)上展示的PPT里,“秒畫”精選模型中有兩張圖片和AI畫圖模型社區(qū)Civitai中的圖片非常相似,遭到網(wǎng)友質(zhì)疑。在大模型展示后首個(gè)交易日,商湯股價(jià)跳水至跌幅5%,最終當(dāng)日收跌。隨后,商湯回應(yīng)質(zhì)疑稱:“秒畫”包含商湯自研大模型,也提供第三方社區(qū)開源模型,支持導(dǎo)入多個(gè)平臺(tái)的開源模型或上傳用戶本地模型。

    實(shí)際上,作為“AI四小龍”的商湯早已被期待在生成式人工智能賽道打出一記重拳。商湯科技董事長兼CEO徐立在發(fā)布會(huì)前接受澎湃科技專訪時(shí)表示,國內(nèi)科技企業(yè)搶灘大模型開發(fā),目前仍處于追趕階段?!白吆米约旱穆?,就是要有一些差異化。所謂的差異化就是用好行業(yè)自身的稟賦。”他說,在這個(gè)時(shí)間點(diǎn)推出大模型體系,是希望吸引更多下游用戶。自然語言模型能夠把各種垂直類的任務(wù)串聯(lián)起來,用多模態(tài)混合的模式迭代行業(yè)場景?!拔覀兿M覀兊拇竽P腕w系能夠幫助行業(yè)生產(chǎn)出下一代最領(lǐng)先的多模態(tài)模型,并且升級(jí)性能?!彼f。

    “未來的模型趨勢是一個(gè)行業(yè)里面可能1-2個(gè)大模型,剩下的小模型、行業(yè)模型非常多。實(shí)際上自然語言模型也好,多模態(tài)模型也好,未來都是這個(gè)趨勢?!毙炝⒈硎尽?/p>

    “所有產(chǎn)品都值得用大模型重做一次”

    商湯科技在上海舉行發(fā)布會(huì)一天后,2023阿里云峰會(huì)4月11日在北京舉行。這又是一個(gè)“一把手”站臺(tái)的發(fā)布會(huì)。

    阿里巴巴集團(tuán)董事會(huì)主席兼CEO、阿里云智能集團(tuán)CEO張勇在會(huì)上表示,阿里巴巴所有產(chǎn)品未來將接入“通義千問”大模型,進(jìn)行全面改造,包括天貓、釘釘、高德地圖、淘寶、優(yōu)酷、盒馬等。此外,在阿里云構(gòu)建的大模型基礎(chǔ)設(shè)施平臺(tái)上,將不僅有阿里的通義大模型,還能夠接入各種高校、科研院所、企業(yè)機(jī)構(gòu)的大模型,為更多專屬模型的訓(xùn)練和服務(wù)提供保障。

    據(jù)張勇介紹,釘釘、天貓精靈等產(chǎn)品在接入“通義千問”測試后,變得聰明了很多。釘釘可以自動(dòng)生成工作方案,也可以在會(huì)議紀(jì)要后自動(dòng)生成總結(jié)和待辦事項(xiàng)。

    張勇在這場發(fā)布會(huì)所說的一句話此后被頻繁引用:面向AI時(shí)代,所有產(chǎn)品都值得用大模型重做一次。

    在接受澎湃科技等媒體的采訪時(shí),阿里云智能CTO周靖人說,每個(gè)企業(yè)都可以有自己的智能客服、智能導(dǎo)購、智能語音助手、文案助手、AI設(shè)計(jì)師、自動(dòng)駕駛模型等。

    提到市面上的其他產(chǎn)品,周靖人表示,人工智能研究機(jī)構(gòu)OpenAI的GPT大模型在各個(gè)方面都處在領(lǐng)先地位,因此“通義千問”需要取長補(bǔ)短,不斷彌補(bǔ)自己的不足。他也提到,期望下個(gè)階段“通義千問”也能貢獻(xiàn)自己的技術(shù)創(chuàng)新。

    “通義千問”中的“通義”是阿里巴巴達(dá)摩院在2022年9月發(fā)布的大模型系列的名字。2021年,阿里巴巴達(dá)摩院宣布,多模態(tài)大模型M6使用的參數(shù)規(guī)模從萬億躍遷至10萬億,成為當(dāng)時(shí)全球最大的AI預(yù)訓(xùn)練模型。同年,阿里達(dá)摩院發(fā)布了270億參數(shù)、1TB+訓(xùn)練數(shù)據(jù)的中文預(yù)訓(xùn)練語言模型 PLUG。

    張勇在發(fā)布會(huì)上強(qiáng)調(diào),大模型是一場“AI+云計(jì)算”的全方位競爭,超萬億參數(shù)的大模型研發(fā),并不僅僅是算法問題,而是囊括了底層龐大算力、網(wǎng)絡(luò)、大數(shù)據(jù)、機(jī)器學(xué)習(xí)等諸多領(lǐng)域的復(fù)雜系統(tǒng)性工程,需要有超大規(guī)模AI基礎(chǔ)設(shè)施的支撐。

    2022年8月,阿里云推出全棧智能計(jì)算解決方案“飛天智算平臺(tái)”,為“通義千問”打下了一定基礎(chǔ)。2022年,阿里云占中國云市場份額的36%,排名第一。

    排名第二的是華為云。4月8日,華為云人工智能領(lǐng)域首席科學(xué)家田奇在人工智能大模型技術(shù)高峰論壇中分享了華為云盤古大模型的進(jìn)展和應(yīng)用,認(rèn)為“AI for Industry”(AI為工業(yè)賦能)將是人工智能新的爆發(fā)點(diǎn)。

    在此之前,華為云官網(wǎng)上線了盤古系列AI大模型的最新消息,一時(shí)拉高了人們對華為的期待值,但田奇的分享只是“將老的內(nèi)容重新拿出來簡單介紹”。對于自然語言大模型,他僅用一句話帶過其應(yīng)用進(jìn)展,表示盤古自然語言處理大模型目前覆蓋智能文檔檢索、智能ERP、小語種大模型等落地領(lǐng)域,2022年華為剛交付了一個(gè)阿拉伯語的千億參數(shù)大模型。

    實(shí)際上,華為云從未明確表示4月將發(fā)布新的大模型,也從未透露過有關(guān)盤古大模型的產(chǎn)品計(jì)劃。

    而在4月13日,知乎創(chuàng)始人、董事長兼CEO周源正式發(fā)布“知海圖AI”中文大模型,邀請AI加入知乎“討論場”。根據(jù)知乎自己的介紹,知乎和面壁智能合作開發(fā)的“知海圖AI”已經(jīng)運(yùn)用進(jìn)了知乎熱榜,知乎首個(gè)大模型功能“熱榜摘要”上線并開啟內(nèi)測,“利用超強(qiáng)的語言理解能力對知乎熱榜上的問題回答進(jìn)行抓取、整理和聚合,并把回答梗概展現(xiàn)給用戶,給大家直觀清晰的回答?!?/p>

    天氣預(yù)報(bào)大模型與自動(dòng)駕駛大模型

    在大廠消息異常喧鬧之下,一些垂直領(lǐng)域的大模型也在相對低調(diào)地發(fā)布著。

    4月7日,上海人工智能實(shí)驗(yàn)室協(xié)同中國科學(xué)技術(shù)大學(xué)、上海交通大學(xué)、南京信息工程大學(xué)、中國科學(xué)院大氣物理研究所及上海中心氣象臺(tái)發(fā)布了全球中期天氣預(yù)報(bào)大模型“風(fēng)烏”。

    據(jù)介紹,該模型基于多模態(tài)和多任務(wù)深度學(xué)習(xí)方法構(gòu)建,首次實(shí)現(xiàn)在高分辨率上對核心大氣變量進(jìn)行超過10天的有效預(yù)報(bào),并在80%的評估指標(biāo)上超越DeepMind發(fā)布的模型GraphCast。此外,“風(fēng)烏”僅需30秒即可生成未來10天全球高精度預(yù)報(bào)結(jié)果,在效率上大幅優(yōu)于傳統(tǒng)模型。

    上海人工智能實(shí)驗(yàn)室科學(xué)家白磊介紹,“風(fēng)烏”的領(lǐng)先性體現(xiàn)在預(yù)報(bào)精度、預(yù)報(bào)時(shí)效和資源效率三方面:在預(yù)報(bào)精度方面,相比于傳統(tǒng)的物理模型,“風(fēng)烏”誤差降低19.4%;在預(yù)報(bào)時(shí)效方面,“風(fēng)烏”基于再分析數(shù)據(jù)達(dá)到10.75天;在資源效率方面,現(xiàn)有物理模型往往運(yùn)行在超級(jí)計(jì)算機(jī)上,而“風(fēng)烏”AI大模型僅需單GPU便可運(yùn)行,30秒即可生成未來10天全球高精度預(yù)報(bào)結(jié)果。

    4月12日,致力于自動(dòng)駕駛的人工智能技術(shù)公司毫末智行發(fā)布自動(dòng)駕駛生成式大模型DriveGPT“雪湖·海若”。該公司稱,其目標(biāo)是實(shí)現(xiàn)端到端自動(dòng)駕駛,現(xiàn)階段主要用于解決自動(dòng)駕駛的認(rèn)知決策問題,后續(xù)會(huì)將毫末智行多個(gè)大模型的能力整合到自動(dòng)駕駛生成式大模型DriveGPT。

    自動(dòng)駕駛生成式大模型是指,將輸入的自然語言文本串換成智能駕駛感知到的過去場景,輸出則變?yōu)榘ㄗ攒嚊Q策規(guī)控、障礙物預(yù)測以及決策邏輯鏈等條件在內(nèi)的未來場景。

    根據(jù)毫末智行的介紹,“雪湖·海若”的參數(shù)規(guī)模達(dá)到了1200億,初始化模型(Pretrain model)共使用了4000萬量產(chǎn)車駕駛數(shù)據(jù)訓(xùn)練。它能夠?qū)Ω鞣N場景做生成式任務(wù),但這些生成結(jié)果還需要按照人類偏好去調(diào)優(yōu),在安全、高效、舒適等維度上做出取舍。

    毫末智行科技有限公司成立于2019年,總部位于北京,企業(yè)注冊資本約1.4億元人民幣,2022年完成A+輪融資,交易金額數(shù)億人民幣。投資者包括美團(tuán)和高瓴。

    ChatGPT火熱以來,自動(dòng)駕駛大模型已成為業(yè)內(nèi)探討的焦點(diǎn)話題。在今年2月的2023全球人工智能開發(fā)者先鋒大會(huì)上,云驥智行聯(lián)合創(chuàng)始人兼執(zhí)行副總裁曹光植表示,自動(dòng)駕駛終局之戰(zhàn)已開始,它應(yīng)該是端到端的自動(dòng)駕駛大模型架構(gòu),非常類似于GPT大模型,“我們相信終究會(huì)出現(xiàn)一個(gè)針對自動(dòng)駕駛的大模型?!钡牵把┖ずH簟笔欠衲艹蔀檫@個(gè)賽道的有力競爭者,還有待觀察。

    “天工3.5”與“序列猴子”

    進(jìn)入4月中旬,更多國產(chǎn)大模型的消息陸續(xù)傳來。

    4月17日,由昆侖萬維和奇點(diǎn)智源合作自研的的大語言模型“天工3.5”開啟內(nèi)測。昆侖萬維稱,“天工”大模型已經(jīng)非常接近ChatGPT的智能水平,因?yàn)镃hatGPT是基于GPT3.5大模型,所以將大模型命名為“天工3.5”。對于“天工”大模型的表現(xiàn),昆侖萬維CEO方漢稱,“比較符合研發(fā)預(yù)期。滿意的是文本生成和文案撰寫很驚喜,實(shí)用性會(huì)很好?!?/p>

    不過,深交所在4月11日盤后向昆侖萬維科技股份有限公司下發(fā)關(guān)注函,要求其說明“天工3.5”可能面臨的風(fēng)險(xiǎn),包括但不限于商業(yè)化、運(yùn)行、技術(shù)、行業(yè)等方面,并再次提醒不得利用市場熱點(diǎn)題材進(jìn)行“蹭熱點(diǎn)”等違法違規(guī)行為。

    昆侖萬維科技股份有限公司成立于2008年,企業(yè)注冊資本約1.18億元人民幣,最初以網(wǎng)游題材上市,上市之后在海外進(jìn)行了多元化發(fā)展,業(yè)務(wù)包括瀏覽器、社交、娛樂、新聞等板塊。根據(jù)其介紹,2020年昆侖萬維研發(fā)團(tuán)隊(duì)從一億級(jí)模型做起,上升至十億級(jí)模型,再到百億級(jí)模型。項(xiàng)目累計(jì)投入數(shù)億人民幣,組織數(shù)百人研發(fā)團(tuán)隊(duì)。

    北京奇點(diǎn)智源科技有限公司成立于2021年,企業(yè)注冊資本1000萬元人民幣。根據(jù)其官網(wǎng)介紹,該公司致力于實(shí)現(xiàn)通用人工智能,目前聚焦于大規(guī)模預(yù)訓(xùn)練語言模型及開發(fā)者API的研發(fā)工作。

    4月20日,人工智能公司出門問問發(fā)布多模態(tài)大語言模型“序列猴子”,稱其參數(shù)量在幾百億規(guī)模,具備“知識(shí)、對話、數(shù)學(xué)、邏輯、推理、規(guī)劃”能力,支持文字生成、圖片生成、3D內(nèi)容生成、語音生成和語音識(shí)別等任務(wù)?;凇靶蛄泻镒印保摴具€發(fā)布了多項(xiàng)AIGC產(chǎn)品,包括AI寫作平臺(tái)“奇妙文”、AI繪畫平臺(tái)“言之畫”、AI配音平臺(tái)“魔音工坊”、數(shù)字人視頻與直播平臺(tái)“奇妙元”。

    出門問問CEO李志飛對比了“序列猴子”和GPT-4:“如果說GPT-4是100分,我們的模型是50分。”目前“序列猴子”還需解決三大問題:結(jié)合個(gè)性化數(shù)據(jù)回答問題、降低胡說八道的概率和增強(qiáng)上下文的記憶能力。

    李志飛曾在谷歌AI團(tuán)隊(duì)就職,2012年回國創(chuàng)辦出門問問,從事智能語音技術(shù)業(yè)務(wù)。公司誕生之初備受資本追捧,但在近十年的發(fā)展歷程中,最初的光環(huán)逐漸黯淡。今年2月,前美團(tuán)聯(lián)合創(chuàng)始人王慧文發(fā)布著名的“出資5000萬美元打造中國版OpenAI”的“英雄帖”時(shí),李志飛就坐在他的對面。

    與其他喜歡表現(xiàn)漢語言文化底蘊(yùn)的大模型名稱不同,“序列猴子”的命名靈感來源于數(shù)學(xué)家埃米爾·波雷爾在20世紀(jì)初提出的“無限猴子”定理。根據(jù)該定理,如果一群猴子隨機(jī)地敲打一臺(tái)打字機(jī),最終一定會(huì)產(chǎn)生完整的莎士比亞作品。

    何以判斷?

    老虎證券股票分析師Bo Pei近日在接受香港媒體采訪時(shí)表示,圍繞ChatGPT大張旗鼓的動(dòng)作表明了市場是多么渴望新的投資敘事,“經(jīng)過這么多年的發(fā)展,西方和中國互聯(lián)網(wǎng)行業(yè)都已飽和,渴望一個(gè)新的方向?!?/p>

    但是,當(dāng)國產(chǎn)AI大模型的推出速度以周為計(jì)甚至以天為計(jì)時(shí),我們該如何判斷各家大模型的水平?除了像一名普通用戶一樣在互聯(lián)網(wǎng)上同題提問對比回答質(zhì)量,還有沒有更專業(yè)的測試和評價(jià)方式?

    顯然,需要更專業(yè)的評估與測試。上海人工智能研究院研究員王錦對澎湃科技解釋稱,通常需要使用測試數(shù)據(jù)集來評估大模型性能,也可以根據(jù)模型中的參數(shù)數(shù)量來判斷模型的復(fù)雜度。模型的響應(yīng)時(shí)間也是一個(gè)重要的衡量因素,最主要的還是在線上環(huán)境實(shí)際應(yīng)用時(shí),通過監(jiān)測模型在生產(chǎn)環(huán)境中的表現(xiàn)來判斷其水平。

    那么,目前國內(nèi)開發(fā)大模型的思路是否都是在努力復(fù)現(xiàn)ChatGPT的成功路徑?

    王錦解釋道,“ChatGPT的成功對全球AI領(lǐng)域產(chǎn)生了巨大影響,肯定會(huì)有許多公司和研究機(jī)構(gòu)參考GPT系列模型,但以ChatGPT和GPT-4為代表的生成式人工智能模型結(jié)構(gòu)和訓(xùn)練方法都是不公開的,并沒有辦法按照技術(shù)路線進(jìn)行復(fù)現(xiàn)。大模型的基礎(chǔ)架構(gòu)是共同的,但除了主體架構(gòu)外的訓(xùn)練方法和網(wǎng)絡(luò)架構(gòu)方面的技術(shù)創(chuàng)新與融合都需要?jiǎng)?chuàng)新和探索?!?/p>

    同時(shí),在實(shí)現(xiàn)ChatGPT的表現(xiàn)效果方面,仍有一些技術(shù)需要探索。比如建立高質(zhì)量的數(shù)據(jù)集,對千億級(jí)標(biāo)記的編碼技術(shù),卡訓(xùn)練和推理的分布式計(jì)算設(shè)計(jì),生成對話交流的能力,以及倫理安全方面的考慮和設(shè)計(jì)等。“此外,中文語料的訓(xùn)練難度較大,因?yàn)橹形臄?shù)據(jù)的質(zhì)量較差、數(shù)量較少,中文語言訓(xùn)練的難度較高,目前的ChatGPT中文表現(xiàn)也不佳,這些都需要繼續(xù)研究探索。”王錦說。

    對于國內(nèi)外AI公司的技術(shù)差距,清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系長聘副教授、聆心智能創(chuàng)始人黃民烈向澎湃科技坦言,“就底層技術(shù)而言,中國有很多團(tuán)隊(duì)和公司都有,但在最終體現(xiàn)的系統(tǒng)能力上,我們存在著一定的差距?!边@里面有企業(yè)家精神、資本環(huán)境、人才、技術(shù)理念等多方面的因素,非常復(fù)雜。比如大模型研究,是做一個(gè)項(xiàng)目,還是實(shí)現(xiàn)通用人工智能的最終理想?比如資本,是為了短期逐利,還是能夠堅(jiān)持長期投入?

    中國哪個(gè)機(jī)構(gòu)最有機(jī)會(huì)做出類ChatGPT產(chǎn)品?粵港澳大灣區(qū)數(shù)字經(jīng)濟(jì)研究院(IDEA)認(rèn)知計(jì)算與自然語言中心文本生成算法團(tuán)隊(duì)負(fù)責(zé)人王昊對澎湃科技表示,從技術(shù)實(shí)力、數(shù)據(jù)和計(jì)算資源來看,國內(nèi)百度等大型企業(yè)具備開發(fā)類ChatGPT的實(shí)力。但是在新興領(lǐng)域,尤其是人工智能領(lǐng)域,沒有歷史包袱的初創(chuàng)公司也有很大機(jī)會(huì)。在大量投資及核心算法人員支持之下,這些公司通常擁有更加靈活的戰(zhàn)略規(guī)劃??偟膩碚f,最有機(jī)會(huì)的一定是能夠堅(jiān)定不移地執(zhí)行其戰(zhàn)略規(guī)劃,并擁有足夠的技術(shù)實(shí)力和創(chuàng)新能力的團(tuán)隊(duì)。

    黃民烈則表示,國內(nèi)科技公司的難點(diǎn)不在于什么時(shí)候推出中國版ChatGPT,而是在這股AI浪潮中能否有深入的遠(yuǎn)見和創(chuàng)新性的想法,才能迎面趕上甚至超越。

    中國針對大模型最有發(fā)言權(quán)的人之一、奇績創(chuàng)壇創(chuàng)始人兼CEO陸奇則在4月22日的一次演講中指出,中國創(chuàng)業(yè)者應(yīng)認(rèn)清這次歷史性的拐點(diǎn)時(shí)刻,定位今天的時(shí)代坐標(biāo)、找準(zhǔn)自己的位置?!拔覀€(gè)人最反對蹭熱,你要做大模型,想好到底做什么,大模型真正是怎么回事,跟你的創(chuàng)業(yè)方向在哪個(gè)或哪幾個(gè)維度有本質(zhì)關(guān)系?!彼€打了一個(gè)比方:“這個(gè)時(shí)代跟淘金時(shí)代很像,如果你那個(gè)時(shí)候去加州淘金,一大堆人會(huì)死掉。但是賣勺子、賣鏟子的人永遠(yuǎn)可以賺錢?!?/p>

    目前看來,這些國產(chǎn)大模型都還處于非常早期的發(fā)展階段,無論是面向C端還是B端,基本都在內(nèi)測。與此同時(shí),國家互聯(lián)網(wǎng)信息辦公室4月11日發(fā)布《生成式人工智能服務(wù)管理辦法(征求意見稿)》,生成式人工智能的監(jiān)管法規(guī)已處于出臺(tái)在即的狀態(tài)。

    還有一些大模型產(chǎn)品仍在被期待中。4月21日,科大訊飛總裁吳曉如表示,科大訊飛將在5月6日正式對外發(fā)布科大訊飛“星火”大模型。4月9日,京東集團(tuán)副總裁何曉冬在人工智能大模型技術(shù)高峰論壇上表示,京東計(jì)劃在今年發(fā)布新一代產(chǎn)業(yè)大模型“言犀”。騰訊則表示,將在5月發(fā)布“混元”AI大模型,首測將有超過12億的微信用戶同時(shí)訪問。

    過去兩個(gè)月可能只是一個(gè)開始,但已經(jīng)給了我們什么樣的啟示?

    轉(zhuǎn)載請注明來自宜賓民心創(chuàng)傷骨科醫(yī)院有限責(zé)任公司,本文標(biāo)題:《狂飆的春天:國產(chǎn)AI大模型扎根涌現(xiàn)的兩個(gè)月,給我們帶來了什么?》

    百度分享代碼,如果開啟HTTPS請參考李洋個(gè)人博客
    每一天,每一秒,你所做的決定都會(huì)改變你的人生!
    Top
     體育最新版新課標(biāo)  石首房產(chǎn)最新信息公告網(wǎng)  軍用最新信息  nba官網(wǎng)最新實(shí)力榜單  榮耀西安網(wǎng)最新規(guī)劃來了  最新的nba狀元  美國eia最新信息  高爾夫俱樂部最新版  asrabbit最新版4.2  燒餅的相聲最新  遼寧最新高速中標(biāo)信息  保山最新的招聘  江蘇揚(yáng)州 地圖最新版  gb50169最新版  招聘童工最新信息  仙力食品招聘信息最新  南孚的最新視頻  ins最新版2023  佛山護(hù)士網(wǎng)招聘信息最新  太原出去政策查詢網(wǎng)最新  天龍八部最新的游戲  鹿邑房子最新出租信息網(wǎng)  武平最新簽約信息網(wǎng)官網(wǎng)  最新發(fā)型的元素  最新的不用動(dòng)手的特效  美聯(lián)儲(chǔ)btc最新信息  最新的五蓮招工信息  曉鳳網(wǎng)紅近況最新  棗莊58同城最新招聘網(wǎng)  fff幣最新信息