020-123456789

獨(dú)家黑料 分類
华泰证券:DeepEP开源有望开释推理需求 重视使用与算力發(fā)布日期:2025-06-06 瀏覽次數(shù):339
視頻加載中,請點(diǎn)擊播放

近日,網(wǎng)絡(luò)上曝出一些關(guān)于某知名藝人的新黑料,引發(fā)了廣泛關(guān)注。這些信息涉及其私生活及合作關(guān)系,令人感到驚訝。雖然具體細(xì)節(jié)尚未得到證實(shí),但許多網(wǎng)友對此表示高度關(guān)注,紛紛展開討論。無論事實(shí)如何,這些爆料再次引發(fā)了公眾對娛樂圈潛規(guī)則的思考。

华泰证券:DeepEP开源有望开释推理需求 重视使用与算力

華泰證券:DeepEP開源有望開釋推理需求 重視運(yùn)用與算力 2025年03月03日 08:11 來歷:證券時(shí)報(bào) 小 中 大 東方財(cái)富APP。便利,方便。

手機(jī)檢查財(cái)經(jīng)快訊。

專業(yè),豐厚。

一手把握商場脈息。

手機(jī)上閱讀文章。

提示:

微信掃一掃。

共享到您的。

朋友圈。

  華泰證券以為,DeepSeek經(jīng)過優(yōu)化推理本錢,有望推進(jìn)LLM商業(yè)化運(yùn)用加快。根據(jù)此,看好推理需求開釋帶動IaaS服務(wù)商稼動率提高,云廠商有望獲益。其次,考慮到R1帶來模型才能提高的一起又可完成低本錢布置,有望帶動AI運(yùn)用加快浸透。最終,雖然現(xiàn)在DeepEP仍需要在Hopper+CUDA+NVLink的框架下完成,但中長期來看,跟著國產(chǎn)卡的適配跟進(jìn),技能有望向更多國產(chǎn)生態(tài)搬遷,國產(chǎn)AI算力板塊有望迎來生長機(jī)會。

  全文如下。

  。

華泰 | 核算機(jī):DeepSeek - EP降本,重視運(yùn)用與算力。  2025年3月1日,DeepSeek發(fā)布《One More Thing, DeepSeek-V3/R1 Inference System Overview》,其間說到經(jīng)過大模型跨節(jié)點(diǎn)專家并行,DeepSeek完成了$87,072/天的低本錢推理,有用算力得到明顯提高。咱們以為,跟著國產(chǎn)算力硬件逐漸適配DeepEP體系,DeepSeek模型或經(jīng)過性價(jià)比優(yōu)勢帶動推理需求開釋,國產(chǎn)算力有望加快生長。

  。

中心觀念。  中心亮點(diǎn):推理本錢大幅下降,抱負(fù)狀態(tài)下15%付費(fèi)率即可盈虧平衡。

  據(jù)DeepSeek,V3和R1推理服務(wù)占用節(jié)點(diǎn)總和,峰值占用為278個(gè)節(jié)點(diǎn),均勻占用226.75個(gè)節(jié)點(diǎn),DeepSeek假定GPU租借本錢為2美金/小時(shí),總本錢為$87,072/天。此外,在2025/02/27 12:00 PM至2025/02/28 12:00 PM,V3和R1模型推理耗費(fèi)Token 776B(輸入608B+輸出168B),均勻每百萬Token處理本錢為0.11美元。DeepSeek假定假如一切Tokens悉數(shù)依照DeepSeekR1的定價(jià)核算,理論上一天的總收入為$562,027,本錢利潤率545%。但考慮到現(xiàn)在DeepSeek僅經(jīng)過API收費(fèi),故咱們測算若依照R1收費(fèi)定價(jià),付費(fèi)Token占總Token的15%即可完成推理進(jìn)程的盈虧平衡。

  中心技能:經(jīng)過EP完成更高的吞吐量和更低的推遲。

  DeepSeek-V3 / R1 推理體系的優(yōu)化方針是:更大的吞吐,更低的推遲。為了完成這兩個(gè)方針,DeepSeek的計(jì)劃是運(yùn)用大規(guī)模跨節(jié)點(diǎn)專家并行(Expert Parallelism/EP),并開源了DeepEP代碼。詳細(xì)來看,中心才能包含:1)大規(guī)模跨節(jié)點(diǎn)專家并行:采用了預(yù)填充-解碼分化架構(gòu),不同階段一起進(jìn)行多個(gè)專家并行核算;2)核算/通訊堆疊:將GPU中的SM(流多處理器)劃分為核算、通訊兩部分,各自一起履行相應(yīng)作業(yè)負(fù)載,削減推遲等待時(shí)間;3)負(fù)載平衡:經(jīng)過預(yù)填充負(fù)載平衡、解碼負(fù)載平衡、專家并行負(fù)載平衡,盡可能地為每個(gè) GPU 分配均衡的核算負(fù)載、通訊負(fù)載。

  中心原因:推理定價(jià)/本錢的差異或?yàn)橥獠克懔?yīng)受限的成果。

  比照來看,海外模型如OpenAI o3-mini在推理定價(jià)方面較DeepSeek更貴,如每百萬Token輸入的價(jià)格為$0.55(緩存射中),而R1為$0.14。咱們以為,API定價(jià)的差異或有適當(dāng)一部分來自于推理本錢的差異,DeepSeek或憑仗EP等更極致的軟硬件優(yōu)化,完成推理本錢的節(jié)約。咱們以為,這一現(xiàn)象的背面,反映的是國內(nèi)外算力供應(yīng)以及工業(yè)方向的差異。國內(nèi)大模型廠商在算力供應(yīng)受限的布景下,經(jīng)過技能優(yōu)化的方法不斷壓榨硬件功能,在有限的算力下完成最優(yōu)的模型作用。根據(jù)此,咱們以為,國內(nèi)模型有望憑仗性價(jià)比優(yōu)勢,帶動下流商業(yè)化運(yùn)用,完成全球商場的比例提高。

  中心獲益:DeepEP開源有望開釋推理需求,重視運(yùn)用與算力。

  咱們以為,DeepSeek經(jīng)過優(yōu)化推理本錢,有望推進(jìn)LLM商業(yè)化運(yùn)用加快。根據(jù)此,咱們看好推理需求開釋帶動IaaS服務(wù)商稼動率提高,云廠商有望獲益。其次,考慮到R1帶來模型才能提高的一起又可完成低本錢布置,有望帶動AI運(yùn)用加快浸透。最終,雖然現(xiàn)在DeepEP仍需要在Hopper+CUDA+NVLink的框架下完成,但中長期來看,跟著國產(chǎn)卡的適配跟進(jìn),技能有望向更多國產(chǎn)生態(tài)搬遷,國產(chǎn)AI算力板塊有望迎來生長機(jī)會。

  危險(xiǎn)提示:AI技能迭代不及預(yù)期;AI商業(yè)化不及預(yù)期;本陳述根據(jù)客觀信息收拾,不構(gòu)成出資主張。

(文章來歷:證券時(shí)報(bào))。

圖片
圖片
主站蜘蛛池模板: 国语自产精品视频在线区| 美女扒开内裤羞羞网站| 在线观看欧美日韩| 黑色毛衣在线播放| 人人妻人人澡人人爽人人dvd| 精品国产免费观看一区| 九九免费精品视频在这里| 天堂在线观看视频| 翁与小莹浴室欢爱51章| 久久精品国产欧美日韩| 国产精品熟女视频一区二区| 男人扒开双腿女人爽视频免费| 亚洲AV无码AV制服另类专区| 日产2021乱码一区| 久久婷五月综合| 国产精品美女免费视频观看| 精品久久久久久中文字幕一区| 久久夜色精品国产噜噜麻豆| 国产丰满肥熟在线观看| 曰韩无码无遮挡A级毛片| 2019中文字幕在线观看| 亚洲成色www久久网站| 在线观看人成网站深夜免费| 精品久久久久久久中文字幕| 99热国产在线观看| 亚洲色婷婷综合久久| 外国毛片在线观看| 日韩电影免费在线观看网站| 四虎国产永久免费久久| 亚洲专区在线视频| 国产小屁孩cao大人| 日本边添边摸边做边爱的网站| 黄色一级黄色片| 久久亚洲精品中文字幕三区| 国产午夜无码视频在线观看| 日韩一区二区三区免费视频| 里番库全彩本子彩色h琉璃| 久久久久久影视 | 成人综合国产乱在线| 美女被免费喷白浆视频| 18女人腿打开无遮挡软|