DeepSeek官網顯示,2月9日,DeepSeek-V3 API服務的45天優惠價格體驗期已結束,從2月9日開始將調整為新的價格:每百萬輸入tokens 0.5元(緩存命中)/2元(緩存未命中),每百萬輸出tokens 8元。
 
在優惠期,DeepSeek-V3的輸入token費用在緩存命中的情況下是每百萬0.1元,緩存未命中時為每百萬1元;輸出token的費用則是每百萬2元。
而在2月9日價格調整后,輸入token費用統一變為每百萬2元,不管緩存是否命中;緩存未命中時的價格翻倍,漲幅為100%;輸出token費用漲至每百萬8元,漲幅為300%。
據《中國基金報》報道,有分析稱,優惠體驗期是一種常見的市場推廣策略,在優惠期內吸引了大量用戶嘗試和使用DeepSeek-V3的API服務,積累了用戶基礎和市場口碑。現在優惠期滿,API價格如期恢復上調。
專家分析,DeepSeek提價之后,公有云價格競爭壓力減小,同時API性價比下降后利好企業本地化部署。由于DeepSeek-V3優惠期價格相較云廠商具有極高的性價比,價格恢復后云廠商價格競爭壓力顯著下降。此外,由于API價格相較優惠期上調2~4倍不等,部分企業或更傾向于選擇本地化部署,利好企業側算力需求與容災備份需求。
成本降低打開的市場空間
據《21世紀經濟報道》報道,伴隨DeepSeek爆火而來的,是業內對其技術路線的研究和探討,以及由于成本降低打開的巨大市場空間。
Meta首席執行官馬克·扎克伯格(Mark Zuckerberg)指出,開源在一開始并不占據很高優勢,向外界開放可以更大程度推動產業鏈標準化,由此拉動產業鏈共同參與推動降低成本、優化能力。“來自中國的新競爭對手DeepSeek,我認為他們顯示出,即將有一個全球化的開源標準——這是我們正在談論的事情之一。”
亞馬遜首席執行官Andy Jassy指出,“我們秉持一種信念,即幾乎所有大型生成式人工智能應用都會使用多種模型類型,而且不同客戶會針對不同類型的工作負載使用不同模型,那么你就要盡可能多地提供前沿模型讓客戶選擇。我們正通過Amazon Bedrock這類服務來實現。這就是為什么我們迅速行動,確保DeepSeek模型能在Bedrock和SageMaker平臺上使用。”
Arm首席執行官Rene Haas指出,DeepSeek無論是V3還是R1模型,都是基于行業前沿模型的基礎上,進行了大量創意性工作來搭建,由此讓推理更為高效。“實話說我認為很棒。”他續稱,因為這將推動行業發展走向更為高效,降低成本從而可以更好擴大整體計算需求。
谷歌首席執行官Sundar Pichai也認為,DeepSeek是一個了不起的團隊,“回顧過去三年來的發展,會發現用于AI推理的支出比例相比AI訓練一直在增加。這是件好事,因為推理顯然可以支持企業獲得良好的投資回報率(即加速推動應用落地)。”
他指出,推理使用成本將不斷下降,使更多用例變得可行,“機會空間要多大就有多大(as big as it comes),這就是為什么我們在持續投資以期迎接這一時刻。”
AI投資的走向
AI在推理側的需求在快速發展早已是事實,只是DeepSeek用更低成本實現。乍一看來,與財報季前后美股科技巨頭動輒提出數百億美元的AI投入顯得差異巨大。
在業績會期間,關于AI投資的走向就備受關注。綜合來看,巨頭們仍然堅持對AI基礎設施的投資,也強調了對推理側投資力度的價值——即面向應用領域探索的投資重要性不容忽視。
亞馬遜首席執行官Andy Jassy仔細分析道,過去幾周里,人們會做出一種假設:如果能夠降低AI投資中任何一種技術組件的成本——主要指推理成本——就可以減少在技術方面的總體支出。
“但實際情況并非如此,我們在云計算領域經歷過類似情形。”他指出,在2006年推出亞馬遜云服務(AWS)時,提供的S3存儲服務價格是每千兆字節15美分、計算服務每小時10美分,當然現在價格已經低得多。
“隨著技術發展,人們曾認為企業在基礎設施技術上的支出會大幅減少。但實際情況是,企業在每單位基礎設施上的花費確實會大幅降低,但隨后,他們會對之前因成本過高而從未嘗試的新項目產生興趣,想著還能搭建些什么,最終往往總體支出會大幅增加。”他也指出,整體看,推理成本將顯著降低,這對客戶和公司業務都將是積極影響。
Meta首席財務官Susan Li也表示,公司仍然致力于針對AI訓練和推理進行基礎設施相關投資。“因為目前還不十分明晰我們到底需要什么,例如不知道我們的推理用途到底有多廣泛——這是我們競爭優勢的真正來源。所以,我們也很興奮,因為仍有空間在推進更有效地運行這些工作負載。”
她重申,當前正處于AI資本支出的早期階段,還無法完全確定未來整體格局將如何演變。有資格談論的是,GenAI將有許多全新、更簡單的方法,來豐富生態系統,這顯然對應用程序家族(the Family of Apps)的體驗有很大幫助。
“我仍然認為,隨著時間的推移,從服務質量和服務規模角度看,大力投資資本支出和基礎設施將是一個戰略優勢。”Susan Li說道。
根據Meta拆解,2025年針對AI基礎設施的投入主要涵蓋三方面:其中大部分將用于GPU部署,此外對構建更高容量的網絡能力、光傳輸能力等也將持續。
“我認為現在確定長期資本密度還為時過早。因為要考慮的因素很多,包括底層模型的進步速度、效率;Gen AI產品的用例方向;一代硬件創新帶來了哪些性能和效率提升等。”Susan Li表示。
可以從一個案例對此進行解讀。關于AI/MR眼鏡品類,多家硅谷大廠其實已經投入多年。即便根據Meta最新財報,其Reality Labs(虛擬現實實驗室)仍然巨虧50億美元,但近兩年來在該領域風靡全球,甚至帶火AI終端發展新一輪周期的產品,Quest系列和Ray-Ban Meta也都出自其手。由此不能忽視在AI應用探索過程中需要投入的前期成本。
從一個行業的正常發展邏輯來說,先行者往往會需要投入更多進行摸索,導致后來者在成本方面會有一些優勢。只是DeepSeek的出現讓這種差異對比明顯,但并不能由此就認為巨頭們對AI的投資就完全屬于“浪費”,只是可能會存在一些可及性和有效性的問題。
|