DeepSeek的爆火,引出了一個(gè)話題:中國的大模型創(chuàng)業(yè)圈會(huì)發(fā)生什么樣的變化?
在技術(shù)層面,“為什么大模型六小虎沒有成為DeepSeek”的質(zhì)疑聲尚未平息,開源生態(tài)帶來的顛覆性效應(yīng)已然顯現(xiàn)。多位業(yè)內(nèi)人士指出,由于開源框架大幅降低技術(shù)門檻,“快則1個(gè)月,慢則3個(gè)月,國內(nèi)大模型應(yīng)該都能具備甚至超越準(zhǔn)DeepSeek-R1的水平。”
水木清華校友種子基金合伙人王學(xué)輝對(duì)《科創(chuàng)板日?qǐng)?bào)》記者表示,DeepSeek實(shí)際上帶來了AI平權(quán),但技術(shù)追平后,更考驗(yàn)大模型企業(yè)的市場(chǎng)化銷售、融資、資本運(yùn)作能力,“比如A股上市的能力,這些也是核心能力。”
DeepSeek引發(fā)的基礎(chǔ)大模型價(jià)值重估,正在深層擴(kuò)散。
開源生態(tài)帶來顛覆效應(yīng)
“因?yàn)殚_源和低門檻,我們預(yù)測(cè)快則1個(gè)月,慢則3個(gè)月,國內(nèi)大模型應(yīng)該都能具備甚至超越準(zhǔn)DeepSeek-R1的水平。“這是《科創(chuàng)板日?qǐng)?bào)》記者和多位投資人、人工智能業(yè)內(nèi)專家交流時(shí),對(duì)方的普遍看法。
英諾天使基金合伙人、北京市前沿國際人工智能研究院理事長王晟告訴《科創(chuàng)板日?qǐng)?bào)》記者,DeepSeek并非技術(shù)遠(yuǎn)超其他模型,其技術(shù)無本質(zhì)創(chuàng)新,而是選擇了降成本、重落地的路線,在技術(shù)上限提升困難時(shí)凸顯優(yōu)勢(shì),引發(fā)行業(yè)思路轉(zhuǎn)變。
他表示,DeepSeek-R1是“一個(gè)很重要的時(shí)代的切換標(biāo)志”。當(dāng)下AI的上升曲線已經(jīng)變緩,預(yù)訓(xùn)練的數(shù)據(jù)差不多用光了,大語言模型能力不容易再上升,只能轉(zhuǎn)換思路轉(zhuǎn)向以O(shè)penAI的 o1和DeepSeek的 R1為代表的推理模型。整個(gè)行業(yè)從“對(duì)標(biāo)OpenAI”的宏大敘事轉(zhuǎn)向場(chǎng)景優(yōu)先的實(shí)用主義。
英諾創(chuàng)新空間創(chuàng)始合伙人、清華校友總會(huì)互聯(lián)網(wǎng)與新媒體專委會(huì)秘書長鄧永強(qiáng)則告訴《科創(chuàng)板日?qǐng)?bào)》記者,DeepSeek降低的是成本,而不是極大提升模型本身的性能,“就像小米的性價(jià)比要比蘋果高,但不代表性能比后者優(yōu)越。事實(shí)上,國內(nèi)外目前就有不少模型要比DeepSeek性能強(qiáng),比如OpenAI o3、阿里的通義千問。”
由此可見,DeepSeek沒有發(fā)明新范式,但其重要意義在于幫助RL(強(qiáng)化學(xué)習(xí))和test-time scaling(模型推理階段規(guī)?;?這一新訓(xùn)練范式真正被大眾熟知。
《科創(chuàng)板日?qǐng)?bào)》記者注意到,對(duì)標(biāo)OpenAI o1,DeepSeek-R1采用的是后訓(xùn)練模型,即test-time scaling(模型推理階段規(guī)?;?,而此類模型的Scaling Law才剛剛開始,還有著很大的上限。國內(nèi)大模型廠商中同為強(qiáng)化學(xué)習(xí)等后訓(xùn)練方式的還有月之暗面kemik1.5、智譜GLM-Zero-Preview等,這些模型都于近期更新,且都注重推理和邏輯思考,擅長處理數(shù)理邏輯、代碼和需要深度推理的復(fù)雜問題。
一位頭部機(jī)構(gòu)投資人告訴《科創(chuàng)板日?qǐng)?bào)》記者,DeepSeek-R1用到的MoE技術(shù),之前早有企業(yè)用到,技術(shù)上并無本質(zhì)創(chuàng)新,后面很大概率有團(tuán)隊(duì)會(huì)做出超越DeepSeek的模型。
“預(yù)計(jì)國內(nèi)某些大模型企業(yè)后續(xù)也會(huì)發(fā)布與DeepSeek技術(shù)路線相似的模型。但從用戶量級(jí)和實(shí)際效果的角度,會(huì)不會(huì)像 DeepSeek如此成果顯著、市場(chǎng)叫好、上線后表現(xiàn)如何,還有待觀察。”
大模型“六小虎”三家留守AGI
DeepSeek的爆火無疑將導(dǎo)致大模型行業(yè)洗牌加速。事實(shí)上,大模型六小虎此前已經(jīng)走向分化。
其中,零一萬物是第一家公開大幅調(diào)整發(fā)展方向的基礎(chǔ)大模型創(chuàng)業(yè)企業(yè)。李開復(fù)此前公開表示,零一萬物已與阿里云成立 “產(chǎn)業(yè)大模型聯(lián)合實(shí)驗(yàn)室”,零一萬物大部分訓(xùn)練和 AI infra 團(tuán)隊(duì)會(huì)加入該實(shí)驗(yàn)室。這之后,零一萬物將不再追求訓(xùn)練超級(jí)大模型。
就在今日,零一萬物產(chǎn)業(yè)大模型傳來最新動(dòng)態(tài):公司與蘇州高新區(qū)聯(lián)合成立的產(chǎn)業(yè)大模型基地正式授牌,基地將聚焦垂直產(chǎn)業(yè),與中細(xì)軟集團(tuán)、創(chuàng)新奇智、倍漾量化等產(chǎn)業(yè)鏈企業(yè),探索大模型技術(shù)的產(chǎn)業(yè)化路徑。這意味著,零一萬物對(duì)產(chǎn)業(yè)化探索的進(jìn)一步深入。
此外,零一萬物近日還宣布,公司研發(fā)的海外 AI 應(yīng)用PopAi接入了DeepSeek-R1模型。
百川智能則在2024年明確了走向醫(yī)療的賽道。近期公司CEO王小川更是下場(chǎng)做起了VC投資人,聚焦AI、具身智能、醫(yī)療等技術(shù)領(lǐng)域。
MiniMax將業(yè)務(wù)重點(diǎn)轉(zhuǎn)向了海外市場(chǎng)。其旗下的明星產(chǎn)品Talkie在2024年上半年成為美國下載量第四的人工智能應(yīng)用。但12月中旬,Talkie被蘋果應(yīng)用商店下架。有知情人士對(duì)《科創(chuàng)板日?qǐng)?bào)》記者表示,目前,海外監(jiān)管正在加強(qiáng)對(duì)社交類APP的審查,“Talkie可能存在違反蘋果公司相關(guān)政策或海外政府的監(jiān)管政策。”
前述投資人對(duì)《科創(chuàng)板日?qǐng)?bào)》記者分析,從業(yè)務(wù)方向上看,上述三家大模型“小虎”已經(jīng)不再將重點(diǎn)放在基礎(chǔ)模型的研發(fā)上,而是追求現(xiàn)有大模型技術(shù)在垂直領(lǐng)域的落地應(yīng)用。“目前專注實(shí)現(xiàn)技術(shù)創(chuàng)新和追求AGI的可以說僅剩下智譜、月之暗面以及階躍星辰。”
對(duì)于將如何應(yīng)對(duì)DeepSeek的沖擊,智譜方面對(duì)《科創(chuàng)板日?qǐng)?bào)》記者表示,“在努力做Agent落地以及多模態(tài)發(fā)展。”
業(yè)務(wù)層面,智譜的To B定位明確,并跑在了行業(yè)領(lǐng)先的位置,同時(shí)也在加大對(duì)to C市場(chǎng)的開拓。1月23日,智譜正式上線GLM-PC。其是基于智譜多模態(tài)大模型CogAgent,為面向公眾使用的電腦智能體。近日,三星宣布最新款旗艦手機(jī)Galaxy S25系列將搭載智譜的Agentic GLM技術(shù)。
上述投資人表示,一定程度上,智譜開源生態(tài)會(huì)受到DeepSeek低成本開源模型的直接沖擊,“但智譜一直在做B端私有化部署,為大型國企定制解決方案,2024年商業(yè)化收入增速150%,B端的護(hù)城河還是較深的,而且B端用戶是最具付費(fèi)能力的。”
而月之暗面方面,《科創(chuàng)板日?qǐng)?bào)》記者從知情人士處了解到,將繼續(xù)攻堅(jiān)先進(jìn)技術(shù),做好Kimi這個(gè)產(chǎn)品本身。
2月12日,OpenAI發(fā)布了關(guān)于推理模型在競(jìng)技編程中應(yīng)用的研究論文報(bào)告,其中提到,DeepSeek-R1和Kimi k1.5通過獨(dú)立研究顯示,利用思維鏈學(xué)習(xí)(COT)方法,可顯著提升模型在數(shù)學(xué)解題與編程挑戰(zhàn)中的綜合表現(xiàn)。
“在技術(shù)領(lǐng)域,實(shí)際上Kimi的閉源模型Kimi1.5受到業(yè)內(nèi)認(rèn)可,但由于閉源模型本身的限制,在輿論上可能被deepseek壓制。”上述投資人進(jìn)一步表示,“目前DeepSeek還只聚焦大語言模型,實(shí)際上并沒有將業(yè)務(wù)拓展到多模態(tài)領(lǐng)域,而且其v3模型主要在數(shù)學(xué)和代碼等能力方面比較突出,其他通用類文本生成、理解等方面效果還有提升空間。”
“六小虎”中最低調(diào)的階躍星辰,則在近期發(fā)布了Step-1o Vision多模態(tài)理解大模型。據(jù)了解,Step-1o系列是階躍星辰研發(fā)的端到端文本、視覺、語音三模態(tài)生成理解一體化模型。
上述投資人對(duì)記者表示,階躍星辰一向低調(diào),技術(shù)上很有潛力。
泥藕資本投資總監(jiān)舒軼夫?qū)Α犊苿?chuàng)板日?qǐng)?bào)》記者總結(jié),DeepSeek對(duì)包括“六小虎”在內(nèi)的其他大模型的沖擊是巨大的,各家都在采取不同的應(yīng)對(duì)策略,主要包括:
一、加強(qiáng)技術(shù)創(chuàng)新,例如OpenAI推出o3-mini;二、開源,OpenAI開源了gpt-3.5,也承認(rèn)了OpenAI的閉源策略可能存在缺陷;三、戰(zhàn)略合作和并購,例如零一萬物和阿里的合作。四、深耕特定領(lǐng)域或垂直方向,例如MiniMax的Talkie,或者如百川智能專注醫(yī)療教育等垂直行業(yè);五、強(qiáng)化用戶體驗(yàn),包括長文本、多模態(tài)、硬件結(jié)合等。
王晟表示,其他大模型廠商可能會(huì)繼續(xù)走向分化,“如果要繼續(xù)卷基礎(chǔ)大模型,還是需要更高的投入。雖然DeepSeek現(xiàn)在是做的比較好,但是如果往GPT5級(jí)別的大模型走,肯定還需要更多的算力。”OpenAI CEO山姆·奧特曼近期宣布,OpenAI將數(shù)月內(nèi)推出GPT-5。
燧原科技高級(jí)總監(jiān)何萬青博士則告訴《科創(chuàng)板日?qǐng)?bào)》記者,“AI大模型產(chǎn)業(yè)是一個(gè)生態(tài)環(huán)境,蓬勃發(fā)展郁郁蔥蔥才是最終目的,陽光、雨露、運(yùn)氣都可能讓一棵大樹如DeepSeek脫穎而出,但是更重要的難道不是整個(gè)森林的生態(tài)繁榮?這個(gè)市場(chǎng)容得下多家大模型企業(yè),各家其實(shí)做的業(yè)務(wù)都有差異化。”
地方國資可能撐起大模型后續(xù)融資
除了技術(shù)路線和業(yè)務(wù)模式上的重構(gòu),大模型創(chuàng)業(yè)企業(yè)的資產(chǎn)價(jià)值也面臨重估。大模型研發(fā)過去耗資巨大,DeepSeek帶來的研發(fā)成本降低,或動(dòng)搖是資本市場(chǎng)對(duì)大模型創(chuàng)業(yè)企業(yè)的估值。
水木創(chuàng)投合伙人張靜告訴《科創(chuàng)板日?qǐng)?bào)》記者,DeepSeek的出現(xiàn)對(duì)大模型企業(yè)的估值會(huì)產(chǎn)生較大影響,由于成本大幅下降,估值可能要下降,對(duì)后入局者會(huì)產(chǎn)生兩種影響,一是競(jìng)爭(zhēng)加劇,讓后入局者更加困難;另一方面也可能促使一些具有獨(dú)特技術(shù)的企業(yè)“輕松”入局,因?yàn)橛?xùn)練成本下降。
王晟對(duì)此則呈較為樂觀的態(tài)度,他認(rèn)為,此前大模型獨(dú)角獸動(dòng)輒數(shù)十億的融資導(dǎo)致“血條較厚”,還可以撐一段時(shí)間。“另外,因?yàn)榇竽P痛碜钕冗M(jìn)的AI能力輸出,也代表新質(zhì)生產(chǎn)力,所以地方政府對(duì)此非??粗?,大模型及背后資金的競(jìng)爭(zhēng),在某種程度上,已經(jīng)上升到了城市發(fā)展戰(zhàn)略及產(chǎn)業(yè)規(guī)劃之爭(zhēng),大模型獨(dú)角獸所在城市和國資很大概率上還會(huì)繼續(xù)支持。畢竟DeepSeek雖然很強(qiáng),但是總部只能落在一個(gè)城市。”
值得一提的是,DeepSeek的現(xiàn)象級(jí)崛起也引發(fā)創(chuàng)投行業(yè)反思:此前投出大模型“六小虎”的創(chuàng)投機(jī)構(gòu)為什么集體錯(cuò)過?
水木資本董事長唐勁草對(duì)《科創(chuàng)板日?qǐng)?bào)》記者分析稱,投資人集體錯(cuò)過DeepSeek的原因是多方面的:一方面,DeepSeek自身的低調(diào)、獨(dú)立性以及資金充足、對(duì)商業(yè)化興趣不大的態(tài)度使其未能吸引到足夠的外部投資;另一方面,中國VC的偏好、市場(chǎng)對(duì)高估值項(xiàng)目的擔(dān)憂以及外部環(huán)境的變化也對(duì)其融資造成了阻礙。這些因素共同導(dǎo)致了DeepSeek在早期階段未能獲得更多的投資支持。
抱持樂觀主義的投資人、創(chuàng)業(yè)者,則已經(jīng)將目光放到了DeepSeek帶來的AI行業(yè)生態(tài)變化可能造就的AI應(yīng)用爆發(fā)。
面壁智能CEO李大海告訴《科創(chuàng)板日?qǐng)?bào)》記者,DeepSeek打破了算力壟斷的神話,高效低成本路線,深耕原始創(chuàng)新釋放巨大的勢(shì)能,“DeepSeek出來后,其實(shí)我們的信心更強(qiáng)了,更篤定了我們的預(yù)判和方向。”據(jù)悉,面壁智能亦一直篤信開源的價(jià)值。
水木清華校友種子基金合伙人王學(xué)輝則表示,未來一定會(huì)產(chǎn)生各種AI應(yīng)用,“但真正的超級(jí)應(yīng)用,一開始一定會(huì)像當(dāng)年的BAT、后來的抖音、拼多多一樣,從看不見到看不起、看不懂最后追不上。”