020-123456789

獨(dú)家黑料分類

獨(dú)家黑料

公司動態(tài)

华泰证券：DeepEP开源有望开释推理需求重视使用与算力發(fā)布日期：2025-06-06 瀏覽次數(shù)：339

視頻加載中，請點(diǎn)擊播放

近日，網(wǎng)絡(luò)上曝出一些關(guān)于某知名藝人的新黑料，引發(fā)了廣泛關(guān)注。這些信息涉及其私生活及合作關(guān)系，令人感到驚訝。雖然具體細(xì)節(jié)尚未得到證實(shí)，但許多網(wǎng)友對此表示高度關(guān)注，紛紛展開討論。無論事實(shí)如何，這些爆料再次引發(fā)了公眾對娛樂圈潛規(guī)則的思考。

华泰证券：DeepEP开源有望开释推理需求重视使用与算力

華泰證券：DeepEP開源有望開釋推理需求重視運(yùn)用與算力 2025年03月03日 08:11 來歷：證券時(shí)報(bào) 小中大東方財(cái)富APP。便利，方便。

手機(jī)檢查財(cái)經(jīng)快訊。

專業(yè)，豐厚。

一手把握商場脈息。

手機(jī)上閱讀文章。

提示：

微信掃一掃。

共享到您的。

朋友圈。

　　華泰證券以為，DeepSeek經(jīng)過優(yōu)化推理本錢，有望推進(jìn)LLM商業(yè)化運(yùn)用加快。根據(jù)此，看好推理需求開釋帶動IaaS服務(wù)商稼動率提高，云廠商有望獲益。其次，考慮到R1帶來模型才能提高的一起又可完成低本錢布置，有望帶動AI運(yùn)用加快浸透。最終，雖然現(xiàn)在DeepEP仍需要在Hopper+CUDA+NVLink的框架下完成，但中長期來看，跟著國產(chǎn)卡的適配跟進(jìn)，技能有望向更多國產(chǎn)生態(tài)搬遷，國產(chǎn)AI算力板塊有望迎來生長機(jī)會。

　　全文如下。

　　。

華泰 | 核算機(jī)：DeepSeek - EP降本，重視運(yùn)用與算力。　　2025年3月1日，DeepSeek發(fā)布《One More Thing, DeepSeek-V3/R1 Inference System Overview》，其間說到經(jīng)過大模型跨節(jié)點(diǎn)專家并行，DeepSeek完成了$87,072/天的低本錢推理，有用算力得到明顯提高。咱們以為，跟著國產(chǎn)算力硬件逐漸適配DeepEP體系，DeepSeek模型或經(jīng)過性價(jià)比優(yōu)勢帶動推理需求開釋，國產(chǎn)算力有望加快生長。

　　。

中心觀念。　　中心亮點(diǎn)：推理本錢大幅下降，抱負(fù)狀態(tài)下15%付費(fèi)率即可盈虧平衡。

　　據(jù)DeepSeek，V3和R1推理服務(wù)占用節(jié)點(diǎn)總和，峰值占用為278個(gè)節(jié)點(diǎn)，均勻占用226.75個(gè)節(jié)點(diǎn)，DeepSeek假定GPU租借本錢為2美金/小時(shí)，總本錢為$87,072/天。此外，在2025/02/27 12:00 PM至2025/02/28 12:00 PM，V3和R1模型推理耗費(fèi)Token 776B（輸入608B+輸出168B），均勻每百萬Token處理本錢為0.11美元。DeepSeek假定假如一切Tokens悉數(shù)依照DeepSeekR1的定價(jià)核算，理論上一天的總收入為$562,027，本錢利潤率545%。但考慮到現(xiàn)在DeepSeek僅經(jīng)過API收費(fèi)，故咱們測算若依照R1收費(fèi)定價(jià)，付費(fèi)Token占總Token的15%即可完成推理進(jìn)程的盈虧平衡。

　　中心技能：經(jīng)過EP完成更高的吞吐量和更低的推遲。

　　DeepSeek-V3 / R1 推理體系的優(yōu)化方針是：更大的吞吐，更低的推遲。為了完成這兩個(gè)方針，DeepSeek的計(jì)劃是運(yùn)用大規(guī)模跨節(jié)點(diǎn)專家并行（Expert Parallelism/EP），并開源了DeepEP代碼。詳細(xì)來看，中心才能包含：1）大規(guī)模跨節(jié)點(diǎn)專家并行：采用了預(yù)填充-解碼分化架構(gòu)，不同階段一起進(jìn)行多個(gè)專家并行核算；2）核算/通訊堆疊：將GPU中的SM（流多處理器）劃分為核算、通訊兩部分，各自一起履行相應(yīng)作業(yè)負(fù)載，削減推遲等待時(shí)間；3）負(fù)載平衡：經(jīng)過預(yù)填充負(fù)載平衡、解碼負(fù)載平衡、專家并行負(fù)載平衡，盡可能地為每個(gè) GPU 分配均衡的核算負(fù)載、通訊負(fù)載。

　　中心原因：推理定價(jià)/本錢的差異或?yàn)橥獠克懔?yīng)受限的成果。

　　比照來看，海外模型如OpenAI o3-mini在推理定價(jià)方面較DeepSeek更貴，如每百萬Token輸入的價(jià)格為$0.55（緩存射中），而R1為$0.14。咱們以為，API定價(jià)的差異或有適當(dāng)一部分來自于推理本錢的差異，DeepSeek或憑仗EP等更極致的軟硬件優(yōu)化，完成推理本錢的節(jié)約。咱們以為，這一現(xiàn)象的背面，反映的是國內(nèi)外算力供應(yīng)以及工業(yè)方向的差異。國內(nèi)大模型廠商在算力供應(yīng)受限的布景下，經(jīng)過技能優(yōu)化的方法不斷壓榨硬件功能，在有限的算力下完成最優(yōu)的模型作用。根據(jù)此，咱們以為，國內(nèi)模型有望憑仗性價(jià)比優(yōu)勢，帶動下流商業(yè)化運(yùn)用，完成全球商場的比例提高。

　　中心獲益：DeepEP開源有望開釋推理需求，重視運(yùn)用與算力。

　　咱們以為，DeepSeek經(jīng)過優(yōu)化推理本錢，有望推進(jìn)LLM商業(yè)化運(yùn)用加快。根據(jù)此，咱們看好推理需求開釋帶動IaaS服務(wù)商稼動率提高，云廠商有望獲益。其次，考慮到R1帶來模型才能提高的一起又可完成低本錢布置，有望帶動AI運(yùn)用加快浸透。最終，雖然現(xiàn)在DeepEP仍需要在Hopper+CUDA+NVLink的框架下完成，但中長期來看，跟著國產(chǎn)卡的適配跟進(jìn)，技能有望向更多國產(chǎn)生態(tài)搬遷，國產(chǎn)AI算力板塊有望迎來生長機(jī)會。

　　危險(xiǎn)提示：AI技能迭代不及預(yù)期；AI商業(yè)化不及預(yù)期；本陳述根據(jù)客觀信息收拾，不構(gòu)成出資主張。

（文章來歷：證券時(shí)報(bào)）。