狂飆的春天：國產(chǎn)AI大模型扎根涌現(xiàn)的兩個(gè)月，給我們帶來了什么？

huangxinzhen 2025-03-27 康復(fù)事項(xiàng) 14 次瀏覽 0個(gè)評論

·從2023年2月20日“國內(nèi)第一個(gè)對話式大型語言模型”MOSS發(fā)布，到4月21日該模型正式開源，兩個(gè)月間，多家中國企業(yè)和研究機(jī)構(gòu)以加速度扎堆沖入被ChatGPT轟炸出來的AI大模型賽道。在梳理這些大模型所試圖呈現(xiàn)的特點(diǎn)之后，我們該如何看待這種趨勢？

·如何判斷各家大模型的水平？“通常需要使用測試數(shù)據(jù)集來評估大模型性能，也可以根據(jù)模型中的參數(shù)數(shù)量來判斷模型的復(fù)雜度。模型的響應(yīng)時(shí)間也是一個(gè)重要的衡量因素，最主要的還是在線上環(huán)境實(shí)際應(yīng)用時(shí)，通過監(jiān)測模型在生產(chǎn)環(huán)境中的表現(xiàn)來判斷其水平?！?/u>

ChatGPT的發(fā)布就像打開了“潘多拉的盒子”，在中國引發(fā)了一場你追我趕的“狂飆”。

2023年2月20日深夜，MOSS的官網(wǎng)因服務(wù)器流量過載癱瘓，這是中國人對ChatGPT類產(chǎn)品興趣暴增的最初征兆之一。

此MOSS不是《流浪地球》系列電影里的機(jī)器人，而是復(fù)旦大學(xué)邱錫鵬教授團(tuán)隊(duì)發(fā)布的“國內(nèi)第一個(gè)對話式大型語言模型”。兩個(gè)月后的4月21日，MOSS正式開源，成為國內(nèi)首個(gè)插件增強(qiáng)的開源對話語言模型。

這兩個(gè)月，注定會(huì)成為中國科技與商業(yè)界被銘記的兩個(gè)月。一切都按下了快進(jìn)鍵，時(shí)間仿佛被壓縮，中國企業(yè)和研究機(jī)構(gòu)以加速度扎堆沖入這個(gè)被ChatGPT轟炸出來的新賽道。

據(jù)澎湃科技（www.thepaper.cn）不完全統(tǒng)計(jì)，目前國內(nèi)已發(fā)布的所謂AI大模型已超過20個(gè)，除了百度、阿里等大廠，創(chuàng)新工場董事長李開復(fù)、百川智能CEO王小川、出門問問CEO李志飛等紛紛宣示入局。各類大模型名字五花八門，有竭力體現(xiàn)中國文化深厚內(nèi)涵的，也有從國際知名數(shù)學(xué)家的理論中引經(jīng)據(jù)典的。

回顧這狂飆突進(jìn)的兩個(gè)月，澎湃科技梳理了一些主要國產(chǎn)大模型所試圖呈現(xiàn)的特點(diǎn)。除此之外，兩個(gè)至關(guān)重要的問題也被提出：我們該如何判斷這些大模型？喧囂之下應(yīng)該有怎樣的冷靜思考？

從MOSS開始：為什么要堅(jiān)持做開源？

“我們的計(jì)算資源不足以支持如此大的訪問量，并且作為學(xué)術(shù)團(tuán)隊(duì)我們也沒有相關(guān)的工程經(jīng)驗(yàn)，給大家造成非常不好的體驗(yàn)和第一印象，在此向大家致以真誠的歉意?！?月21日，在MOSS官網(wǎng)被“擠癱”后，其開發(fā)團(tuán)隊(duì)發(fā)布聲明誠懇致歉，并表示，“中國版ChatGPT的誕生還需要中國全體AI從業(yè)者的努力，也更需要不斷和人交互以提高能力?！?/p>

這種謙虛、低調(diào)、懷著“繼續(xù)學(xué)習(xí)”態(tài)度的回應(yīng)，成為此后多個(gè)國產(chǎn)大模型設(shè)定敘事基調(diào)的先例。

根據(jù)邱錫鵬團(tuán)隊(duì)的介紹，MOSS可執(zhí)行對話生成、編程、事實(shí)問答等一系列任務(wù)，打通了讓生成式語言模型理解人類意圖并具有對話能力的全部技術(shù)路徑。

這款模型引發(fā)關(guān)注的一個(gè)點(diǎn)是，它的英文回答水平比中文高，開發(fā)團(tuán)隊(duì)解釋稱，“因?yàn)樗哪Ｐ突鶎W(xué)習(xí)了3000多億個(gè)英文單詞，中文詞語只學(xué)了約300億個(gè)?！?/p>

粵港澳大灣區(qū)數(shù)字經(jīng)濟(jì)研究院（IDEA）認(rèn)知計(jì)算與自然語言中心文本生成算法團(tuán)隊(duì)負(fù)責(zé)人王昊對澎湃科技表示，“相較于英文數(shù)據(jù)，中文數(shù)據(jù)的開源程度較低，導(dǎo)致中文數(shù)據(jù)集的規(guī)模相對較小。此外，英文作為科研主流語言，在學(xué)術(shù)界和工業(yè)界中得到廣泛應(yīng)用，積累了大量高質(zhì)量的語料數(shù)據(jù)，這為英文自然語言處理的研究提供了極大的優(yōu)勢?！?/p>

MOSS的橫空出世，令復(fù)旦大學(xué)邱錫鵬團(tuán)隊(duì)一舉成名。在多個(gè)公開場合，邱錫鵬對大型語言模型的研究與發(fā)展做出了詳細(xì)闡釋。

4月1日，邱錫鵬在一個(gè)論壇上介紹，整體而言，MOSS基于公開的中英文數(shù)據(jù)訓(xùn)練，目前已經(jīng)擁有200億參數(shù)，具有和人類對話的能力，并可以通過與人類交互實(shí)現(xiàn)迭代優(yōu)化。與此同時(shí)，他也坦承，盡管對語言的理解能力和ChatGPT已經(jīng)非常相近，但是目前MOSS的整體完成度并不高，主要原因在于MOSS在部署和訓(xùn)練上投入的資本還非常有限，相較于千億級(jí)的ChatGPT，大概只是其規(guī)模的十分之一，所以MOSS還有很多事實(shí)類知識(shí)記不住，思維鏈能力也相對較差。目前團(tuán)隊(duì)也在積極嘗試引入一些外部工具，來進(jìn)一步擴(kuò)大模型參數(shù)規(guī)模，不斷改進(jìn)與優(yōu)化。

在上述論壇的圓桌討論中，邱錫鵬談到了為什么MOSS要開源?！癕OSS還是想以開源的形式去做，為什么美國卡我們脖子，一卡一個(gè)準(zhǔn)，就是我們的生態(tài)沒有建好。OpenAI做ChatGPT的時(shí)候，它不需要分心做其他東西，只是把模型做好。微軟幫它做算力，還有一家開源公司幫它做部署，也有專門的公司來進(jìn)行數(shù)據(jù)清洗。它是在整個(gè)生態(tài)中去做的，生態(tài)促使它發(fā)展非常快。”他說，“而我們國內(nèi)每家公司都要做，這就會(huì)產(chǎn)生一個(gè)問題，每家都做不大，每個(gè)都做自己的，所有的東西都自己來，又不愿意跟別人分享。每家數(shù)據(jù)、算力有限，也沒有多少錢可以支持研發(fā)，又在做一些很基礎(chǔ)、重復(fù)性的事情?！?/p>

邱錫鵬表示，有了MOSS后就不用做底層的重復(fù)性工作，把整個(gè)生態(tài)建起來?！叭绻覀冇幸粋€(gè)統(tǒng)一的語言、統(tǒng)一的基座，下面對接一下國產(chǎn)的算力，做好一份接口，大家就都可以來用，能夠去促進(jìn)生態(tài)鏈的建設(shè)，使得整個(gè)中國的AI往前進(jìn)一步發(fā)展?！?/p>

4月21日，新版MOSS模型正式上線，不僅更加成熟，而且還增加了“搜索引擎、計(jì)算器、解方程、文生圖”等插件功能，既可在線體驗(yàn)，也支持本地部署?！癎PT-4也能接入各種插件，這種能力在大模型落地應(yīng)用過程中會(huì)很有價(jià)值?！鼻皴a鵬說。同時(shí)，MOSS大模型相關(guān)代碼、數(shù)據(jù)、模型參數(shù)已在Github和Hugging Face等平臺(tái)開放。

文心一言：最受矚目，備受爭議

3月16日，北京，身著白色襯衫和小白鞋的百度CEO李彥宏親自上臺(tái)，發(fā)布了備受關(guān)注的大語言模型“文心一言”。百度由此成為國內(nèi)第一家發(fā)布類ChatGPT大模型的企業(yè)。

李彥宏從文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理推算、中文理解和多模態(tài)生成五個(gè)方面展示了“文心一言”的能力。展示方式并非現(xiàn)場直播演示，而是播放了提前錄制的視頻。發(fā)布會(huì)進(jìn)行到一半，百度的股價(jià)跌幅一度擴(kuò)大至近10%。

“文心一言”的發(fā)布，可以說是關(guān)注度最高，爭議聲也最大。因此，李彥宏在發(fā)布會(huì)一開始就降低預(yù)期，坦率承認(rèn)，“文心一言”在測試時(shí)還是有許多不完美之處，但因?yàn)槭袌鲂枨螅蠹叶枷Ｍ缫稽c(diǎn)用上最新最先進(jìn)的大語言模型，所以選擇在此時(shí)推出。

根據(jù)百度的介紹，“文心一言”的參數(shù)規(guī)模為2600億。在發(fā)布會(huì)現(xiàn)場，當(dāng)澎湃科技詢問李彥宏如何解決類ChatGPT產(chǎn)品都會(huì)出現(xiàn)的“一本正經(jīng)胡說八道”問題時(shí)，李彥宏表示，“百度在這個(gè)方面確實(shí)有優(yōu)勢，我們做了知識(shí)增強(qiáng)和檢索增強(qiáng)。”

百度一直強(qiáng)調(diào)，它是全球?yàn)閿?shù)不多在芯片層、框架層、模型層和應(yīng)用層四層進(jìn)行全棧布局的人工智能公司?！皬母叨诵酒鲂?，到飛槳深度學(xué)習(xí)框架，再到文心預(yù)訓(xùn)練大模型，到搜索、智能云、自動(dòng)駕駛、小度等應(yīng)用，各個(gè)層面都有領(lǐng)先業(yè)界的自研技術(shù)?！崩顝┖暾f。

科技自媒體“AI科技評論”分析稱，百度有近水樓臺(tái)的智能云、充裕且體系健全的算力、運(yùn)行平穩(wěn)的深度學(xué)習(xí)框架、一群具有多年AI開發(fā)經(jīng)驗(yàn)的人才，最重要的，還有一個(gè)日活數(shù)十億搜索引擎來提供中文的本地化數(shù)據(jù)——某種程度上，距離大模型的完成形態(tài)，具備了大多數(shù)的硬條件。

發(fā)布會(huì)后，一些搶先測試“文心一言”的用戶陸續(xù)曬出了測試截圖，其文生圖功能的質(zhì)量尤其引發(fā)熱議，不乏激烈的爭論。而李彥宏的回應(yīng)是：“外界反饋跟我預(yù)期差不多。”“你去看ChatGPT，在剛推出的時(shí)候，外界反饋比‘文心一言’還要糟糕?！?/p>

“整體而言，這類大語言模型還遠(yuǎn)未到發(fā)展完善的階段，它們有時(shí)候會(huì)有很驚艷的表現(xiàn)，但不少場景下，細(xì)究起來還有明顯的bug，進(jìn)步空間很大。未來這段時(shí)間它一定會(huì)飛速發(fā)展，日新月異?！痹诎l(fā)布會(huì)上，李彥宏也提前打了預(yù)防針。

科技行業(yè)媒體人何帥認(rèn)為，“如果說和ChatGPT的差距，‘文心一言’只差訓(xùn)練量。ChatGPT跑了好幾年，‘文心一言’不可能一下子趕上。百度之前做了很多‘半途而廢’的事，外賣、地圖、電商、元宇宙，都追逐過風(fēng)口，又沒追上，多多少少浪費(fèi)了技術(shù)底蘊(yùn)。但現(xiàn)在做回‘文心一言’，我還是有信心的。百度有技術(shù)能力和知識(shí)圖譜，如果百度做不好，國內(nèi)可能真的沒有哪家企業(yè)能做好了?！?/p>

“可控大模型生態(tài)鏈”與“消費(fèi)級(jí)顯卡本地部署”

在“文心一言”正式發(fā)布的同月，還有兩個(gè)相對不太引人關(guān)注的大模型被推出。3月14日，瀾舟科技創(chuàng)始人兼CEO周明在北京創(chuàng)新工場總部舉辦的“AI 1.0到AI 2.0的新機(jī)遇”趨勢分享會(huì)上宣布，瀾舟科技推出孟子對話大模型（MChat）。

根據(jù)該公司的介紹，周明從微軟亞洲研究院辭職后創(chuàng)辦瀾舟科技，開始孵化孟子通用預(yù)訓(xùn)練模型。MChat具有類ChatGPT的能力，同時(shí)具備原有的孟子多項(xiàng)目功能引擎。“兩者結(jié)合使得其具有ChatGPT的對話能力，又同時(shí)具備工業(yè)級(jí)尤其To B服務(wù)器所需要的翻譯、生成、信息搜索等方面的能力。”

瀾舟科技提出以MChat構(gòu)筑一個(gè)相對完善的可控大模型生態(tài)鏈。這個(gè)“可控”特色，是指其能力相較于其他同類技術(shù)更為靈活，面向垂直領(lǐng)域、專業(yè)賽道落地會(huì)更加聚焦，可以根據(jù)行業(yè)、地域等需求做出快速調(diào)整。更具體而言，MChat大模型底層是個(gè)“通用底座”，提供了涵蓋語言預(yù)訓(xùn)練模型、多模態(tài)預(yù)訓(xùn)練模型、垂直領(lǐng)域預(yù)訓(xùn)練模型和其他預(yù)訓(xùn)練模型等能力。在通用底座之上，架構(gòu)“能力平臺(tái)”提供知識(shí)圖譜、輔助寫作、機(jī)器翻譯、情感分析、智能檢索、智能客服、文檔解析等多領(lǐng)域的模塊化能力。

在這個(gè)分享會(huì)上，同為微軟亞洲研究院出身的創(chuàng)新工場董事長兼首席執(zhí)行官李開復(fù)提出了一個(gè)觀點(diǎn)：在深度學(xué)習(xí)的重大突破之后，AI已經(jīng)處于從1.0邁入2.0的拐點(diǎn)。AI 2.0將會(huì)帶來平臺(tái)式的變革，改寫用戶的入口和界面，誕生全新平臺(tái)，催生新一代AI 2.0應(yīng)用的研發(fā)和商業(yè)化。

六天后，李開復(fù)在其微信朋友圈宣布：正在親自籌組全球化AI新公司Project AI 2.0，目標(biāo)“不僅僅要做中文版ChatGPT”，目前資金、算力陸續(xù)到位，希望在全球范圍內(nèi)“招賢納士”。當(dāng)被問及具體計(jì)劃時(shí)，創(chuàng)新工場方面回復(fù)澎湃科技：剛開始籌辦，有進(jìn)一步對外規(guī)劃時(shí)再回復(fù)。

同樣在3月14日，清華大學(xué)的自然語言處理研究團(tuán)隊(duì)、知識(shí)工程和數(shù)據(jù)挖掘小組開源了60億參數(shù)的ChatGLM-6B模型，并開始內(nèi)測對話機(jī)器人ChatGLM。

該團(tuán)隊(duì)在官方博客中介紹，ChatGLM是一個(gè)初具問答和對話功能的千億中英語言模型，并針對中文進(jìn)行了優(yōu)化。而中英雙語對話GLM模型ChatGLM-6B則結(jié)合了模型量化技術(shù)，用戶可以在消費(fèi)級(jí)的顯卡上進(jìn)行本地部署?！?2億參數(shù)的ChatGLM-6B雖然規(guī)模不及千億模型，但大大降低了用戶部署的門檻，并且已經(jīng)能生成相當(dāng)符合人類偏好的回答?！?/p>

能夠在消費(fèi)級(jí)顯卡上進(jìn)行本地部署，吸引了大量愛好者動(dòng)手嘗試，ChatGLM-6B在知乎等社交媒體的討論圈里引發(fā)了熱烈討論和一些正面反饋。

視覺技術(shù)起家，商湯強(qiáng)調(diào)“多模態(tài)”和B端

到了4月，加速又進(jìn)了一步。

4月10日，商湯科技召開新聞發(fā)布會(huì)，發(fā)布“日日新SenseNova”大模型體系。該體系含中文語言大模型應(yīng)用平臺(tái)“商量SenseChat”、圖片生成模型“秒畫SenseMirage”、AI數(shù)字人視頻生成平臺(tái)“如影SenseAvatar”、3D內(nèi)容生成平臺(tái)“瓊宇SenseSpace”和“格物SenseThings”等。一系列名字令人眼花繚亂，而“日日新”則取自《禮記·大學(xué)》，湯之盤銘：茍日新，日日新，又日新。

商湯介紹稱，作為千億級(jí)參數(shù)的自然語言處理模型，“商量”能夠提供以下功能：編程助手，幫助開發(fā)者編寫和調(diào)試代碼；健康咨詢助手，為用戶提供個(gè)性化的醫(yī)療建議；PDF文件閱讀助手，能輕松從復(fù)雜文檔中提取和概括信息等能力。商湯科技聯(lián)合創(chuàng)始人王曉表示，“商量”未來主要面向B端。

在發(fā)布會(huì)現(xiàn)場，基于超10億參數(shù)的圖像模型“秒畫”生成的港風(fēng)照片獲得了較為熱烈的反應(yīng)。值得注意的是，商湯以機(jī)器視覺技術(shù)起家，算力儲(chǔ)備較為充裕。2019年，商湯于上海臨港建設(shè)人工智能計(jì)算中心，到目前共有5000Ｐ算力，大裝置擁有2.7萬塊GPU芯片卡，可以實(shí)現(xiàn)自供算力訓(xùn)練大模型。

不過，商湯在發(fā)布會(huì)上展示的PPT里，“秒畫”精選模型中有兩張圖片和AI畫圖模型社區(qū)Civitai中的圖片非常相似，遭到網(wǎng)友質(zhì)疑。在大模型展示后首個(gè)交易日，商湯股價(jià)跳水至跌幅5%，最終當(dāng)日收跌。隨后，商湯回應(yīng)質(zhì)疑稱：“秒畫”包含商湯自研大模型，也提供第三方社區(qū)開源模型，支持導(dǎo)入多個(gè)平臺(tái)的開源模型或上傳用戶本地模型。

實(shí)際上，作為“AI四小龍”的商湯早已被期待在生成式人工智能賽道打出一記重拳。商湯科技董事長兼CEO徐立在發(fā)布會(huì)前接受澎湃科技專訪時(shí)表示，國內(nèi)科技企業(yè)搶灘大模型開發(fā)，目前仍處于追趕階段?！白吆米约旱穆?，就是要有一些差異化。所謂的差異化就是用好行業(yè)自身的稟賦。”他說，在這個(gè)時(shí)間點(diǎn)推出大模型體系，是希望吸引更多下游用戶。自然語言模型能夠把各種垂直類的任務(wù)串聯(lián)起來，用多模態(tài)混合的模式迭代行業(yè)場景?！拔覀兿Ｍ覀兊拇竽Ｐ腕w系能夠幫助行業(yè)生產(chǎn)出下一代最領(lǐng)先的多模態(tài)模型，并且升級(jí)性能?！彼f。

“未來的模型趨勢是一個(gè)行業(yè)里面可能1-2個(gè)大模型，剩下的小模型、行業(yè)模型非常多。實(shí)際上自然語言模型也好，多模態(tài)模型也好，未來都是這個(gè)趨勢?！毙炝⒈硎尽?/p>

“所有產(chǎn)品都值得用大模型重做一次”

商湯科技在上海舉行發(fā)布會(huì)一天后，2023阿里云峰會(huì)4月11日在北京舉行。這又是一個(gè)“一把手”站臺(tái)的發(fā)布會(huì)。

阿里巴巴集團(tuán)董事會(huì)主席兼CEO、阿里云智能集團(tuán)CEO張勇在會(huì)上表示，阿里巴巴所有產(chǎn)品未來將接入“通義千問”大模型，進(jìn)行全面改造，包括天貓、釘釘、高德地圖、淘寶、優(yōu)酷、盒馬等。此外，在阿里云構(gòu)建的大模型基礎(chǔ)設(shè)施平臺(tái)上，將不僅有阿里的通義大模型，還能夠接入各種高校、科研院所、企業(yè)機(jī)構(gòu)的大模型，為更多專屬模型的訓(xùn)練和服務(wù)提供保障。

據(jù)張勇介紹，釘釘、天貓精靈等產(chǎn)品在接入“通義千問”測試后，變得聰明了很多。釘釘可以自動(dòng)生成工作方案，也可以在會(huì)議紀(jì)要后自動(dòng)生成總結(jié)和待辦事項(xiàng)。

張勇在這場發(fā)布會(huì)所說的一句話此后被頻繁引用：面向AI時(shí)代，所有產(chǎn)品都值得用大模型重做一次。

在接受澎湃科技等媒體的采訪時(shí)，阿里云智能CTO周靖人說，每個(gè)企業(yè)都可以有自己的智能客服、智能導(dǎo)購、智能語音助手、文案助手、AI設(shè)計(jì)師、自動(dòng)駕駛模型等。

提到市面上的其他產(chǎn)品，周靖人表示，人工智能研究機(jī)構(gòu)OpenAI的GPT大模型在各個(gè)方面都處在領(lǐng)先地位，因此“通義千問”需要取長補(bǔ)短，不斷彌補(bǔ)自己的不足。他也提到，期望下個(gè)階段“通義千問”也能貢獻(xiàn)自己的技術(shù)創(chuàng)新。

“通義千問”中的“通義”是阿里巴巴達(dá)摩院在2022年9月發(fā)布的大模型系列的名字。2021年，阿里巴巴達(dá)摩院宣布，多模態(tài)大模型M6使用的參數(shù)規(guī)模從萬億躍遷至10萬億，成為當(dāng)時(shí)全球最大的AI預(yù)訓(xùn)練模型。同年，阿里達(dá)摩院發(fā)布了270億參數(shù)、1TB+訓(xùn)練數(shù)據(jù)的中文預(yù)訓(xùn)練語言模型 PLUG。

張勇在發(fā)布會(huì)上強(qiáng)調(diào)，大模型是一場“AI+云計(jì)算”的全方位競爭，超萬億參數(shù)的大模型研發(fā)，并不僅僅是算法問題，而是囊括了底層龐大算力、網(wǎng)絡(luò)、大數(shù)據(jù)、機(jī)器學(xué)習(xí)等諸多領(lǐng)域的復(fù)雜系統(tǒng)性工程，需要有超大規(guī)模AI基礎(chǔ)設(shè)施的支撐。

2022年8月，阿里云推出全棧智能計(jì)算解決方案“飛天智算平臺(tái)”，為“通義千問”打下了一定基礎(chǔ)。2022年，阿里云占中國云市場份額的36%，排名第一。

排名第二的是華為云。4月8日，華為云人工智能領(lǐng)域首席科學(xué)家田奇在人工智能大模型技術(shù)高峰論壇中分享了華為云盤古大模型的進(jìn)展和應(yīng)用，認(rèn)為“AI for Industry”（AI為工業(yè)賦能）將是人工智能新的爆發(fā)點(diǎn)。

在此之前，華為云官網(wǎng)上線了盤古系列AI大模型的最新消息，一時(shí)拉高了人們對華為的期待值，但田奇的分享只是“將老的內(nèi)容重新拿出來簡單介紹”。對于自然語言大模型，他僅用一句話帶過其應(yīng)用進(jìn)展，表示盤古自然語言處理大模型目前覆蓋智能文檔檢索、智能ERP、小語種大模型等落地領(lǐng)域，2022年華為剛交付了一個(gè)阿拉伯語的千億參數(shù)大模型。

實(shí)際上，華為云從未明確表示4月將發(fā)布新的大模型，也從未透露過有關(guān)盤古大模型的產(chǎn)品計(jì)劃。

而在4月13日，知乎創(chuàng)始人、董事長兼CEO周源正式發(fā)布“知海圖AI”中文大模型，邀請AI加入知乎“討論場”。根據(jù)知乎自己的介紹，知乎和面壁智能合作開發(fā)的“知海圖AI”已經(jīng)運(yùn)用進(jìn)了知乎熱榜，知乎首個(gè)大模型功能“熱榜摘要”上線并開啟內(nèi)測，“利用超強(qiáng)的語言理解能力對知乎熱榜上的問題回答進(jìn)行抓取、整理和聚合，并把回答梗概展現(xiàn)給用戶，給大家直觀清晰的回答?！?/p>

天氣預(yù)報(bào)大模型與自動(dòng)駕駛大模型

在大廠消息異常喧鬧之下，一些垂直領(lǐng)域的大模型也在相對低調(diào)地發(fā)布著。

4月7日，上海人工智能實(shí)驗(yàn)室協(xié)同中國科學(xué)技術(shù)大學(xué)、上海交通大學(xué)、南京信息工程大學(xué)、中國科學(xué)院大氣物理研究所及上海中心氣象臺(tái)發(fā)布了全球中期天氣預(yù)報(bào)大模型“風(fēng)烏”。

據(jù)介紹，該模型基于多模態(tài)和多任務(wù)深度學(xué)習(xí)方法構(gòu)建，首次實(shí)現(xiàn)在高分辨率上對核心大氣變量進(jìn)行超過10天的有效預(yù)報(bào)，并在80%的評估指標(biāo)上超越DeepMind發(fā)布的模型GraphCast。此外，“風(fēng)烏”僅需30秒即可生成未來10天全球高精度預(yù)報(bào)結(jié)果，在效率上大幅優(yōu)于傳統(tǒng)模型。

上海人工智能實(shí)驗(yàn)室科學(xué)家白磊介紹，“風(fēng)烏”的領(lǐng)先性體現(xiàn)在預(yù)報(bào)精度、預(yù)報(bào)時(shí)效和資源效率三方面：在預(yù)報(bào)精度方面，相比于傳統(tǒng)的物理模型，“風(fēng)烏”誤差降低19.4%；在預(yù)報(bào)時(shí)效方面，“風(fēng)烏”基于再分析數(shù)據(jù)達(dá)到10.75天；在資源效率方面，現(xiàn)有物理模型往往運(yùn)行在超級(jí)計(jì)算機(jī)上，而“風(fēng)烏”AI大模型僅需單GPU便可運(yùn)行，30秒即可生成未來10天全球高精度預(yù)報(bào)結(jié)果。

4月12日，致力于自動(dòng)駕駛的人工智能技術(shù)公司毫末智行發(fā)布自動(dòng)駕駛生成式大模型DriveGPT“雪湖·海若”。該公司稱，其目標(biāo)是實(shí)現(xiàn)端到端自動(dòng)駕駛，現(xiàn)階段主要用于解決自動(dòng)駕駛的認(rèn)知決策問題，后續(xù)會(huì)將毫末智行多個(gè)大模型的能力整合到自動(dòng)駕駛生成式大模型DriveGPT。

自動(dòng)駕駛生成式大模型是指，將輸入的自然語言文本串換成智能駕駛感知到的過去場景，輸出則變?yōu)榘ㄗ攒嚊Q策規(guī)控、障礙物預(yù)測以及決策邏輯鏈等條件在內(nèi)的未來場景。

根據(jù)毫末智行的介紹，“雪湖·海若”的參數(shù)規(guī)模達(dá)到了1200億，初始化模型（Pretrain model）共使用了4000萬量產(chǎn)車駕駛數(shù)據(jù)訓(xùn)練。它能夠?qū)Ω鞣N場景做生成式任務(wù)，但這些生成結(jié)果還需要按照人類偏好去調(diào)優(yōu)，在安全、高效、舒適等維度上做出取舍。

毫末智行科技有限公司成立于2019年，總部位于北京，企業(yè)注冊資本約1.4億元人民幣，2022年完成A+輪融資，交易金額數(shù)億人民幣。投資者包括美團(tuán)和高瓴。

ChatGPT火熱以來，自動(dòng)駕駛大模型已成為業(yè)內(nèi)探討的焦點(diǎn)話題。在今年2月的2023全球人工智能開發(fā)者先鋒大會(huì)上，云驥智行聯(lián)合創(chuàng)始人兼執(zhí)行副總裁曹光植表示，自動(dòng)駕駛終局之戰(zhàn)已開始，它應(yīng)該是端到端的自動(dòng)駕駛大模型架構(gòu)，非常類似于GPT大模型，“我們相信終究會(huì)出現(xiàn)一個(gè)針對自動(dòng)駕駛的大模型?！钡牵把┖ずＨ簟笔欠衲艹蔀檫@個(gè)賽道的有力競爭者，還有待觀察。

“天工3.5”與“序列猴子”

進(jìn)入4月中旬，更多國產(chǎn)大模型的消息陸續(xù)傳來。

4月17日，由昆侖萬維和奇點(diǎn)智源合作自研的的大語言模型“天工3.5”開啟內(nèi)測。昆侖萬維稱，“天工”大模型已經(jīng)非常接近ChatGPT的智能水平，因?yàn)镃hatGPT是基于GPT3.5大模型，所以將大模型命名為“天工3.5”。對于“天工”大模型的表現(xiàn)，昆侖萬維CEO方漢稱，“比較符合研發(fā)預(yù)期。滿意的是文本生成和文案撰寫很驚喜，實(shí)用性會(huì)很好?！?/p>

不過，深交所在4月11日盤后向昆侖萬維科技股份有限公司下發(fā)關(guān)注函，要求其說明“天工3.5”可能面臨的風(fēng)險(xiǎn)，包括但不限于商業(yè)化、運(yùn)行、技術(shù)、行業(yè)等方面，并再次提醒不得利用市場熱點(diǎn)題材進(jìn)行“蹭熱點(diǎn)”等違法違規(guī)行為。

昆侖萬維科技股份有限公司成立于2008年，企業(yè)注冊資本約1.18億元人民幣，最初以網(wǎng)游題材上市，上市之后在海外進(jìn)行了多元化發(fā)展，業(yè)務(wù)包括瀏覽器、社交、娛樂、新聞等板塊。根據(jù)其介紹，2020年昆侖萬維研發(fā)團(tuán)隊(duì)從一億級(jí)模型做起，上升至十億級(jí)模型，再到百億級(jí)模型。項(xiàng)目累計(jì)投入數(shù)億人民幣，組織數(shù)百人研發(fā)團(tuán)隊(duì)。

北京奇點(diǎn)智源科技有限公司成立于2021年，企業(yè)注冊資本1000萬元人民幣。根據(jù)其官網(wǎng)介紹，該公司致力于實(shí)現(xiàn)通用人工智能，目前聚焦于大規(guī)模預(yù)訓(xùn)練語言模型及開發(fā)者API的研發(fā)工作。

4月20日，人工智能公司出門問問發(fā)布多模態(tài)大語言模型“序列猴子”，稱其參數(shù)量在幾百億規(guī)模，具備“知識(shí)、對話、數(shù)學(xué)、邏輯、推理、規(guī)劃”能力，支持文字生成、圖片生成、3D內(nèi)容生成、語音生成和語音識(shí)別等任務(wù)?；凇靶蛄泻镒印保摴具€發(fā)布了多項(xiàng)AIGC產(chǎn)品，包括AI寫作平臺(tái)“奇妙文”、AI繪畫平臺(tái)“言之畫”、AI配音平臺(tái)“魔音工坊”、數(shù)字人視頻與直播平臺(tái)“奇妙元”。

出門問問CEO李志飛對比了“序列猴子”和GPT-4：“如果說GPT-4是100分，我們的模型是50分。”目前“序列猴子”還需解決三大問題：結(jié)合個(gè)性化數(shù)據(jù)回答問題、降低胡說八道的概率和增強(qiáng)上下文的記憶能力。

李志飛曾在谷歌AI團(tuán)隊(duì)就職，2012年回國創(chuàng)辦出門問問，從事智能語音技術(shù)業(yè)務(wù)。公司誕生之初備受資本追捧，但在近十年的發(fā)展歷程中，最初的光環(huán)逐漸黯淡。今年2月，前美團(tuán)聯(lián)合創(chuàng)始人王慧文發(fā)布著名的“出資5000萬美元打造中國版OpenAI”的“英雄帖”時(shí)，李志飛就坐在他的對面。

與其他喜歡表現(xiàn)漢語言文化底蘊(yùn)的大模型名稱不同，“序列猴子”的命名靈感來源于數(shù)學(xué)家埃米爾·波雷爾在20世紀(jì)初提出的“無限猴子”定理。根據(jù)該定理，如果一群猴子隨機(jī)地敲打一臺(tái)打字機(jī)，最終一定會(huì)產(chǎn)生完整的莎士比亞作品。

何以判斷？

老虎證券股票分析師Bo Pei近日在接受香港媒體采訪時(shí)表示，圍繞ChatGPT大張旗鼓的動(dòng)作表明了市場是多么渴望新的投資敘事，“經(jīng)過這么多年的發(fā)展，西方和中國互聯(lián)網(wǎng)行業(yè)都已飽和，渴望一個(gè)新的方向?！?/p>

但是，當(dāng)國產(chǎn)AI大模型的推出速度以周為計(jì)甚至以天為計(jì)時(shí)，我們該如何判斷各家大模型的水平？除了像一名普通用戶一樣在互聯(lián)網(wǎng)上同題提問對比回答質(zhì)量，還有沒有更專業(yè)的測試和評價(jià)方式？

顯然，需要更專業(yè)的評估與測試。上海人工智能研究院研究員王錦對澎湃科技解釋稱，通常需要使用測試數(shù)據(jù)集來評估大模型性能，也可以根據(jù)模型中的參數(shù)數(shù)量來判斷模型的復(fù)雜度。模型的響應(yīng)時(shí)間也是一個(gè)重要的衡量因素，最主要的還是在線上環(huán)境實(shí)際應(yīng)用時(shí)，通過監(jiān)測模型在生產(chǎn)環(huán)境中的表現(xiàn)來判斷其水平。

那么，目前國內(nèi)開發(fā)大模型的思路是否都是在努力復(fù)現(xiàn)ChatGPT的成功路徑？

王錦解釋道，“ChatGPT的成功對全球AI領(lǐng)域產(chǎn)生了巨大影響，肯定會(huì)有許多公司和研究機(jī)構(gòu)參考GPT系列模型，但以ChatGPT和GPT-4為代表的生成式人工智能模型結(jié)構(gòu)和訓(xùn)練方法都是不公開的，并沒有辦法按照技術(shù)路線進(jìn)行復(fù)現(xiàn)。大模型的基礎(chǔ)架構(gòu)是共同的，但除了主體架構(gòu)外的訓(xùn)練方法和網(wǎng)絡(luò)架構(gòu)方面的技術(shù)創(chuàng)新與融合都需要?jiǎng)?chuàng)新和探索?！?/p>

同時(shí)，在實(shí)現(xiàn)ChatGPT的表現(xiàn)效果方面，仍有一些技術(shù)需要探索。比如建立高質(zhì)量的數(shù)據(jù)集，對千億級(jí)標(biāo)記的編碼技術(shù)，卡訓(xùn)練和推理的分布式計(jì)算設(shè)計(jì)，生成對話交流的能力，以及倫理安全方面的考慮和設(shè)計(jì)等。“此外，中文語料的訓(xùn)練難度較大，因?yàn)橹形臄?shù)據(jù)的質(zhì)量較差、數(shù)量較少，中文語言訓(xùn)練的難度較高，目前的ChatGPT中文表現(xiàn)也不佳，這些都需要繼續(xù)研究探索。”王錦說。

對于國內(nèi)外AI公司的技術(shù)差距，清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系長聘副教授、聆心智能創(chuàng)始人黃民烈向澎湃科技坦言，“就底層技術(shù)而言，中國有很多團(tuán)隊(duì)和公司都有，但在最終體現(xiàn)的系統(tǒng)能力上，我們存在著一定的差距?！边@里面有企業(yè)家精神、資本環(huán)境、人才、技術(shù)理念等多方面的因素，非常復(fù)雜。比如大模型研究，是做一個(gè)項(xiàng)目，還是實(shí)現(xiàn)通用人工智能的最終理想？比如資本，是為了短期逐利，還是能夠堅(jiān)持長期投入？

中國哪個(gè)機(jī)構(gòu)最有機(jī)會(huì)做出類ChatGPT產(chǎn)品？粵港澳大灣區(qū)數(shù)字經(jīng)濟(jì)研究院（IDEA）認(rèn)知計(jì)算與自然語言中心文本生成算法團(tuán)隊(duì)負(fù)責(zé)人王昊對澎湃科技表示，從技術(shù)實(shí)力、數(shù)據(jù)和計(jì)算資源來看，國內(nèi)百度等大型企業(yè)具備開發(fā)類ChatGPT的實(shí)力。但是在新興領(lǐng)域，尤其是人工智能領(lǐng)域，沒有歷史包袱的初創(chuàng)公司也有很大機(jī)會(huì)。在大量投資及核心算法人員支持之下，這些公司通常擁有更加靈活的戰(zhàn)略規(guī)劃?？偟膩碚f，最有機(jī)會(huì)的一定是能夠堅(jiān)定不移地執(zhí)行其戰(zhàn)略規(guī)劃，并擁有足夠的技術(shù)實(shí)力和創(chuàng)新能力的團(tuán)隊(duì)。

黃民烈則表示，國內(nèi)科技公司的難點(diǎn)不在于什么時(shí)候推出中國版ChatGPT，而是在這股AI浪潮中能否有深入的遠(yuǎn)見和創(chuàng)新性的想法，才能迎面趕上甚至超越。

中國針對大模型最有發(fā)言權(quán)的人之一、奇績創(chuàng)壇創(chuàng)始人兼CEO陸奇則在4月22日的一次演講中指出，中國創(chuàng)業(yè)者應(yīng)認(rèn)清這次歷史性的拐點(diǎn)時(shí)刻，定位今天的時(shí)代坐標(biāo)、找準(zhǔn)自己的位置?！拔覀€(gè)人最反對蹭熱，你要做大模型，想好到底做什么，大模型真正是怎么回事，跟你的創(chuàng)業(yè)方向在哪個(gè)或哪幾個(gè)維度有本質(zhì)關(guān)系?！彼€打了一個(gè)比方：“這個(gè)時(shí)代跟淘金時(shí)代很像，如果你那個(gè)時(shí)候去加州淘金，一大堆人會(huì)死掉。但是賣勺子、賣鏟子的人永遠(yuǎn)可以賺錢?！?/p>

目前看來，這些國產(chǎn)大模型都還處于非常早期的發(fā)展階段，無論是面向C端還是B端，基本都在內(nèi)測。與此同時(shí)，國家互聯(lián)網(wǎng)信息辦公室4月11日發(fā)布《生成式人工智能服務(wù)管理辦法（征求意見稿）》，生成式人工智能的監(jiān)管法規(guī)已處于出臺(tái)在即的狀態(tài)。

還有一些大模型產(chǎn)品仍在被期待中。4月21日，科大訊飛總裁吳曉如表示，科大訊飛將在5月6日正式對外發(fā)布科大訊飛“星火”大模型。4月9日，京東集團(tuán)副總裁何曉冬在人工智能大模型技術(shù)高峰論壇上表示，京東計(jì)劃在今年發(fā)布新一代產(chǎn)業(yè)大模型“言犀”。騰訊則表示，將在5月發(fā)布“混元”AI大模型，首測將有超過12億的微信用戶同時(shí)訪問。

過去兩個(gè)月可能只是一個(gè)開始，但已經(jīng)給了我們什么樣的啟示？

轉(zhuǎn)載請注明來自宜賓民心創(chuàng)傷骨科醫(yī)院有限責(zé)任公司，本文標(biāo)題：《狂飆的春天：國產(chǎn)AI大模型扎根涌現(xiàn)的兩個(gè)月，給我們帶來了什么？》

huangxinzhen 851篇文章站點(diǎn) 微博

每一天，每一秒，你所做的決定都會(huì)改變你的人生！

? 2025年3月 ?
一	二	三	四	五	六	日
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

夜夜揉揉日日人人青青,偷窥精品在线视频,精品妇女一区二区三区,a√天堂98国产在线

admin_qifei管理員

最新文章

網(wǎng)站收藏

狂飆的春天：國產(chǎn)AI大模型扎根涌現(xiàn)的兩個(gè)月，給我們帶來了什么？

最近發(fā)表

友情鏈接

文章目錄

夜夜揉揉日日人人青青,偷窥精品在线视频,精品妇女一区二区三区,a√天堂98国产在线

admin_qifei管理員

最新文章

網(wǎng)站收藏

狂飆的春天：國產(chǎn)AI大模型扎根涌現(xiàn)的兩個(gè)月，給我們帶來了什么？

袁隆平詩詞大全最新版，農(nóng)業(yè)巨擘的詩意人生，袁隆平詩詞集，農(nóng)業(yè)巨擘的詩意篇章

東湖高新封閉最新信息，東湖高新最新封閉動(dòng)態(tài)全解析

超越LLama2 多款國產(chǎn)開源大模型包攬全球權(quán)威預(yù)訓(xùn)練模型榜前三

南漳警方網(wǎng)逃最新通知，南漳警方發(fā)布網(wǎng)逃名單最新通報(bào)

國資委重磅部署央企發(fā)展AI產(chǎn)業(yè)，人工智能“國家隊(duì)”來了！

萊陽發(fā)布最新通告公告網(wǎng)，萊陽最新通告公告網(wǎng)發(fā)布消息

最新招聘信息一網(wǎng)打盡，探索163招聘網(wǎng)站，最新招聘信息一網(wǎng)打盡，探索全方位招聘服務(wù)——163招聘網(wǎng)站

日本一艘漁船起火沉沒 船上載有8人

“2025新澳天天開獎(jiǎng)資料大全”·動(dòng)態(tài)分析_宜賓民心創(chuàng)傷骨科醫(yī)院有限責(zé)任公司

“一碼一肖100%精準(zhǔn)生肖第六”·熱點(diǎn)探尋_宜賓民心創(chuàng)傷骨科醫(yī)院有限責(zé)任公司

“香港特馬資料王中王”·迅速報(bào)道_宜賓民心創(chuàng)傷骨科醫(yī)院有限責(zé)任公司

“新澳天天開獎(jiǎng)資料大全最新100期”·最新研判_宜賓民心創(chuàng)傷骨科醫(yī)院有限責(zé)任公司

“2025新澳門精準(zhǔn)免費(fèi)大全(圣旨)”·精準(zhǔn)記錄_宜賓民心創(chuàng)傷骨科醫(yī)院有限責(zé)任公司

“2025年新澳門天天開好彩”·迅速解析_宜賓民心創(chuàng)傷骨科醫(yī)院有限責(zé)任公司

“2025年澳門今晚開獎(jiǎng)號(hào)碼”·迅猛掌握_宜賓民心創(chuàng)傷骨科醫(yī)院有限責(zé)任公司

“澳門九點(diǎn)半9點(diǎn)半網(wǎng)站”·快速推送_宜賓民心創(chuàng)傷骨科醫(yī)院有限責(zé)任公司

最近發(fā)表

友情鏈接

文章目錄

狂飆的春天：國產(chǎn)AI大模型扎根涌現(xiàn)的兩個(gè)月，給我們帶來了什么？

袁隆平詩詞大全最新版，農(nóng)業(yè)巨擘的詩意人生，袁隆平詩詞集，農(nóng)業(yè)巨擘的詩意篇章

東湖高新封閉最新信息，東湖高新最新封閉動(dòng)態(tài)全解析

南漳警方網(wǎng)逃最新通知，南漳警方發(fā)布網(wǎng)逃名單最新通報(bào)

國資委重磅部署央企發(fā)展AI產(chǎn)業(yè)，人工智能“國家隊(duì)”來了！

萊陽發(fā)布最新通告公告網(wǎng)，萊陽最新通告公告網(wǎng)發(fā)布消息

最新招聘信息一網(wǎng)打盡，探索163招聘網(wǎng)站，最新招聘信息一網(wǎng)打盡，探索全方位招聘服務(wù)——163招聘網(wǎng)站

日本一艘漁船起火沉沒船上載有8人