中信證券：DeepSeek V3發(fā)布加速AI應(yīng)用落地

chenyuanwei 2025-02-27 醫(yī)療服務(wù) 6 次瀏覽 0個(gè)評(píng)論

智通財(cái)經(jīng)APP獲悉，中信證券發(fā)布研報(bào)稱，近日，DeepSeek-V3的正式發(fā)版引起AI業(yè)內(nèi)廣泛高度關(guān)注，其在保證了模型能力的前提下，訓(xùn)練效率和推理速度大幅提升。中信證券認(rèn)為，DeepSeek新一代模型的發(fā)布意味著AI大模型的應(yīng)用將逐步走向普惠，助力AI應(yīng)用廣泛落地；同時(shí)訓(xùn)練效率大幅提升，亦將助力推理算力需求高增。中信證券持續(xù)看好AI產(chǎn)業(yè)鏈的加速落地機(jī)遇，建議重點(diǎn)關(guān)注AI應(yīng)用、AI Infra、AI算力三大主線。

中信證券主要觀點(diǎn)如下：

事項(xiàng)：

12月26日，DeepSeek-V3（深度求索）首個(gè)版本正式發(fā)布并同步開(kāi)源，已在網(wǎng)頁(yè)端和API全面上線。其在訓(xùn)練效率和推理速度上相較歷史模型有了大幅提升，同時(shí)可保證領(lǐng)先的模型能力表現(xiàn)，引起業(yè)內(nèi)高度關(guān)注。

模型：數(shù)學(xué)、代碼等能力優(yōu)異，API性價(jià)比較高。

參考官方論文，DeepSeek v3為6710億參數(shù)MoE架構(gòu)模型，激活37B，在14.8T token上進(jìn)行了預(yù)訓(xùn)練。能力上，模型暫不支持多模態(tài)輸入，但在通識(shí)和專業(yè)知識(shí)測(cè)試集上表現(xiàn)優(yōu)秀，MMLU pro正確率75.9%，GPQA-Diamond正確率59.1%，達(dá)到國(guó)內(nèi)第一梯隊(duì)，接近Claude 3.5 Sonnet的水平；并且在數(shù)學(xué)和代碼領(lǐng)域測(cè)試表現(xiàn)突出，MATH 500正確率90.2%，SWE-bench正確率42.0%，Codeforces得分51.6，超越所有非o系列模型。模型生成速度達(dá)到60TPS，是前代模型的三倍。定價(jià)上，API定價(jià)為輸入每百萬(wàn)tokens 0.5元（緩存命中）/2元（緩存未命中），輸出每百萬(wàn)tokens 8元，與字節(jié)Doubao-pro-256k定價(jià)輸入每百萬(wàn)tokens 5元，輸出每百萬(wàn)tokens 9元的水平相當(dāng)，在國(guó)產(chǎn)模型中性價(jià)比較高。

應(yīng)用：國(guó)產(chǎn)模型能力提升、價(jià)格下降，支撐全領(lǐng)域AI應(yīng)用加速。

豆包pro、DeepSeek v3等國(guó)產(chǎn)模型連續(xù)發(fā)布。模型能力上，國(guó)產(chǎn)模型在文本和知識(shí)能力上接近GPT-4、Claude、Llama等海外前沿模型水平，多模態(tài)能力逐步完備，邏輯和代碼能力在非o1技術(shù)路線下達(dá)到可用水平。價(jià)格上，國(guó)產(chǎn)模型API百萬(wàn)tokens輸出普遍定價(jià)10元以內(nèi)，是GPT-4o的1/3甚至更低。我們預(yù)計(jì)模型性價(jià)比持續(xù)提升下，國(guó)內(nèi)AI應(yīng)用依托豐富生態(tài)和成熟流量加速各領(lǐng)域落地。其中，Agent模式有望以更長(zhǎng)的任務(wù)流程、更好的場(chǎng)景理解、更高的自主能力，成為所有互聯(lián)網(wǎng)用戶的數(shù)字助手，在企業(yè)管理、教育、辦公、金融等領(lǐng)域展現(xiàn)應(yīng)用價(jià)值。

算力：DeepSeek訓(xùn)練效率大幅提升，助力推理算力需求高增。

1）訓(xùn)練效率大幅提升，GPT4的訓(xùn)練成本約為DeepSeek V3的6.2倍。根據(jù)DeepSeek V3的官方技術(shù)文檔，本次DeepSeek的訓(xùn)練僅使用了2048個(gè)H800 GPU，總訓(xùn)練GPU卡時(shí)為2788千小時(shí)（其中預(yù)訓(xùn)練為2664千小時(shí)），平均到每個(gè)GPU上，僅為1361小時(shí)，約合56.7天。與之相對(duì)比，根據(jù)英偉達(dá)CEO黃仁勛在GTC2024上的演講內(nèi)容，GPT-4 MoE使用8000個(gè)H100訓(xùn)練了90天，合計(jì)約為17280千卡時(shí)，相當(dāng)于DeepSeek V3的6.2倍。

2）訓(xùn)練效率提升歸因：我們認(rèn)為DeepSeek V3訓(xùn)練提效的原因主要包括低精度計(jì)算、小參數(shù)量、高質(zhì)量數(shù)據(jù)等方面。精度方面，根據(jù)英偉達(dá)官方文檔，其GPU的8位精度算力通常是16位精度算力的2倍，因此數(shù)據(jù)精度從FP16降低到FP8可以貢獻(xiàn)一倍效率提升。參數(shù)方面，GPT-4 MoE模型總參數(shù)量達(dá)到1800B，而按照DeepSeek V3官方文檔，其總參數(shù)量只有671B，約為GPT-4 MoE的1/3，同時(shí)，DeepSeek的激活參數(shù)大約為37B，而GPT4-MoE每次推理激活的參數(shù)量約為280B，二者約為7.57倍關(guān)系；數(shù)據(jù)方面，GPT-4 MoE使用了13萬(wàn)億（1300B）token，而DeepSeek V3使用的token數(shù)量約為14.8萬(wàn)億（1480B），數(shù)據(jù)量相差不大，但DeepSeek V3技術(shù)文檔提及了使用模型生成訓(xùn)練數(shù)據(jù)等，因此我們認(rèn)為數(shù)據(jù)質(zhì)量或有較大幅度提升。此外，采用負(fù)載均衡、更好的流水線策略亦是其官方提及的提升訓(xùn)練效率的重要原因。

3）從推理側(cè)助推AI普惠，帶動(dòng)推理算力需求倍增，打開(kāi)更廣闊算力市場(chǎng)空間。我們認(rèn)為，DeepSeek模型相比GPT4模型更小的參數(shù)量也意味著更低的推理成本，推理成本的降低，將是AI應(yīng)用普及的前奏，正如4G提速降費(fèi)給我國(guó)移動(dòng)互聯(lián)網(wǎng)產(chǎn)業(yè)提供了助力。當(dāng)前AI應(yīng)用滲透率仍然較低，產(chǎn)業(yè)仍在早期，根據(jù)我們?cè)?024年12月13日外發(fā)的報(bào)告《計(jì)算機(jī)行業(yè)“智能網(wǎng)聯(lián)”系列報(bào)告54—算力需求測(cè)算：Agent+Sora》，隨著Agent成為流量入口，滲透率達(dá)到30%左右，全球Agent的推理token數(shù)量將增長(zhǎng)3個(gè)數(shù)量級(jí)以上，且視頻生成與實(shí)時(shí)視頻理解等形態(tài)的AI同樣有望帶來(lái)巨量需求增長(zhǎng)，并且根據(jù)我們對(duì)視頻生成模型的測(cè)算，視頻推理算力需求將有望達(dá)到訓(xùn)練算力需求的2-3個(gè)數(shù)量級(jí)以上。算力需求的指數(shù)級(jí)提升與模型訓(xùn)練推理成本的下降將構(gòu)成產(chǎn)業(yè)飛輪，帶動(dòng)全產(chǎn)業(yè)鏈擴(kuò)張，隨著AI進(jìn)一步普及到日常生活與產(chǎn)業(yè)當(dāng)中，我們認(rèn)為推理算力需求將仍然驅(qū)動(dòng)AI算力產(chǎn)業(yè)鏈持續(xù)增長(zhǎng)。

風(fēng)險(xiǎn)因素：

AI核心技術(shù)發(fā)展不及預(yù)期，AI被不當(dāng)使用造成嚴(yán)重社會(huì)影響，企業(yè)數(shù)據(jù)安全風(fēng)險(xiǎn)，信息安全風(fēng)險(xiǎn)，行業(yè)競(jìng)爭(zhēng)加劇。

投資策略：建議關(guān)注AI全產(chǎn)業(yè)相關(guān)投資機(jī)會(huì)，綜合梳理以下投資主線：

1）AI 應(yīng)用：伴隨模型能力升級(jí)，Agent等應(yīng)用形式有望加速落地，帶動(dòng)辦公、教育、管理、端側(cè)、具身智能等應(yīng)用領(lǐng)域公司加速兌現(xiàn)業(yè)績(jī)彈性。

2）AI Infra：模型場(chǎng)景化與行業(yè)化發(fā)展催生數(shù)據(jù)服務(wù)和模型平臺(tái)需求，產(chǎn)業(yè)發(fā)展確定性高。

3）AI算力：AI應(yīng)用加速落地帶動(dòng)推理端算力新需求。

轉(zhuǎn)載請(qǐng)注明來(lái)自宜賓民心創(chuàng)傷骨科醫(yī)院有限責(zé)任公司，本文標(biāo)題：《中信證券：DeepSeek V3發(fā)布加速AI應(yīng)用落地》

chenyuanwei 546篇文章站點(diǎn) 微博

每一天，每一秒，你所做的決定都會(huì)改變你的人生！

? 2025年2月 ?
一	二	三	四	五	六	日
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28

夜夜揉揉日日人人青青,偷窥精品在线视频,精品妇女一区二区三区,a√天堂98国产在线

admin_qifei管理員

最新文章

網(wǎng)站收藏

中信證券：DeepSeek V3發(fā)布加速AI應(yīng)用落地

最近發(fā)表

友情鏈接

文章目錄

夜夜揉揉日日人人青青,偷窥精品在线视频,精品妇女一区二区三区,a√天堂98国产在线

admin_qifei管理員

最新文章

網(wǎng)站收藏

中信證券：DeepSeek V3發(fā)布 加速AI應(yīng)用落地

新門內(nèi)部免費(fèi)資料大全-現(xiàn)狀說(shuō)明解析

澳門一肖一碼一特中今晚-實(shí)踐性執(zhí)行計(jì)劃

管家婆2025澳門免費(fèi)資格-快捷解決方案

2025新澳門天天免費(fèi)精準(zhǔn)大全.高速方案解析響應(yīng)-精確洞察

澳門一碼一肖一待一中直播-絕對(duì)經(jīng)典核心關(guān)注

船員招聘網(wǎng)內(nèi)河招聘最新動(dòng)態(tài)，探索航運(yùn)人才的新機(jī)遇，內(nèi)河航運(yùn)人才新機(jī)遇，船員招聘網(wǎng)最新動(dòng)態(tài)探索

2025年新澳門天天開(kāi)獎(jiǎng)免費(fèi)查詢-專業(yè)解析說(shuō)明

2025全年資料免費(fèi)大全-數(shù)據(jù)資料可信落實(shí)

最近發(fā)表

友情鏈接

文章目錄

中信證券：DeepSeek V3發(fā)布加速AI應(yīng)用落地

船員招聘網(wǎng)內(nèi)河招聘最新動(dòng)態(tài)，探索航運(yùn)人才的新機(jī)遇，內(nèi)河航運(yùn)人才新機(jī)遇，船員招聘網(wǎng)最新動(dòng)態(tài)探索