[新聞] 研究稱DeepSeek的AI 訓練成本也很貴 至少430億台幣

看板Stock作者 (飛56)時間2月前 (2025/02/03 03:37), 編輯推噓44(581472)
留言144則, 100人參與, 2月前最新討論串1/1
原文標題:研究稱DeepSeek的AI 訓練成本也很貴 至少430億台幣 原文連結:https://reurl.cc/Q5odeM 發布時間:21:49 2025/02/01 記者署名:中時新聞網 江飛宇 原文內容:https://i.imgur.com/hN2WEH9.jpeg
半導體行業分析公司指出,DeepSeek的基礎成本、伺服器搭建成本至少要13億美元。(圖 /shutterstock/達志) 最近上線的中國大陸AI軟體DeepSeek引發業界震撼,大陸聲稱建構DeepSeek的基礎成本很 低,僅是OpenAI的零頭,最廣為流傳的說法之一,是DeepSeek V3 的訓練成本約為 600萬 美元(1.9億新台幣)。不過這個說法被半導業行業研究公司 SemiAnalysis質疑,他們認為 DeepSeek的成本應該至少有13億美元(約430億新台幣)。 有趣的工程(Interesting Engineering)報導,SemiAnalysis 指出,它未能解釋幾個關鍵 因素。600 萬美元的估算,只考慮了 GPU 預訓練費用,忽略了公司在研發、基礎設施和 其他必要成本方面的大量投資。報告強調,DeepSeek 的總伺服器資本支出,就高達13億 美元。 根據報導,DeepSeek使用了大約 5萬張Hopper GPU(微架構的),這導致業界產生了一些誤 解。以為這就等於5萬張輝達H100 GPU(Nvidia Hopper H100 GPU)。 SemiAnalysis 澄清說,輝達的GPU 有多種型號,包括 H800、H100 以及 NVIDIA 為應對 美國出口限製而生產的 H20。也是中國大陸可以獲得的類型。 該報告稱,與一些較大的人工智慧實驗室不同,DeepSeek資料中心採用精簡模型,來提高 其靈活性和效率。這算是一種不錯的適應能力,分析顯示 DeepSeek 的 R1模型,表現出 與 OpenAI 的 o1 相當的推理能力。 然而,這不意味著DeepSeek在所有指標都性能領先。 雖然 DeepSeek 的定價策略引起了關注和讚譽,但有一個重要的警告:功能相似的 Google Gemini Flash 2.0 ,在API 服務存取時更加經濟。這使得 DeepSeek 處於一個十 字路口,平衡效能和成本是其未來成功的關鍵。 但是,DeepSeek的多頭潛在注意力(Multi-Head Latent Attention,MLA),是個頗具突 破性的創新,這種方法透過減少鍵值 (KV) 快取的使用,顯著降低了 93.3% 的推理成本 。不過, DeepSeek 帶來的創新,也很可能會被渴望保持競爭力的西方人工智慧實驗室迅 速採用。 報告推測,DeepSeek可能產生不錯的競爭環境,令其他同行也必須具有更快的適應能力。 總之,SemiAnalysis 描繪了 DeepSeek 在 AI 領域的當前地位。它的成本結構、GPU 利 用率,和創新能力,確實成為一名強大的AI參與者。 心得/評論: 上週由於Deepseek的橫空出世,宣稱能夠降低98%成本 殺得許多美股科技大頭血流成河,今天台股開盤也被連累 若到頭來低成本只是"號稱",又只能產出審查閹割後的不實內容 牛皮吹破被看破手腳的後果..... -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 218.164.83.160 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1738553847.A.69B.html

02/03 11:38, 2月前 , 1F
繼續壯膽XD
02/03 11:38, 1F

02/03 11:38, 2月前 , 2F
這兩天有用一下網頁版的看看,他有把思考過程寫出
02/03 11:38, 2F

02/03 11:38, 2月前 , 3F
來比open 的好很多
02/03 11:38, 3F

02/03 11:39, 2月前 , 4F
講實話會讓鹿港仔不開心
02/03 11:39, 4F

02/03 11:39, 2月前 , 5F
OpenAI一堆大老出走 想也知道有問題
02/03 11:39, 5F

02/03 11:39, 2月前 , 6F
500萬鎂本來就只有一次的訓練成本 啥硬體人事都沒
02/03 11:39, 6F

02/03 11:39, 2月前 , 7F
納進去
02/03 11:39, 7F

02/03 11:39, 2月前 , 8F
Open一樣有思考過程啊 第一天用嗎?☺
02/03 11:39, 8F

02/03 11:39, 2月前 , 9F
訓練成本就是訓練成本 全世界算法一樣
02/03 11:39, 9F

02/03 11:40, 2月前 , 10F
ㄟ 連公司基礎設施都要算進去?
02/03 11:40, 10F

02/03 11:40, 2月前 , 11F
好了啦……
02/03 11:40, 11F

02/03 11:40, 2月前 , 12F
拿其他成本是要混搖什麼視聽
02/03 11:40, 12F

02/03 11:40, 2月前 , 13F
open ai 最近的一個版本不是也有邏輯推導
02/03 11:40, 13F

02/03 11:41, 2月前 , 14F
原來如此,難怪中國人現在過這麼慘
02/03 11:41, 14F

02/03 11:41, 2月前 , 15F
連員工成長過程的成本都沒算到吧
02/03 11:41, 15F

02/03 11:41, 2月前 , 16F
笑死 那麼下一次發新模型要說0成本嗎
02/03 11:41, 16F

02/03 11:41, 2月前 , 17F
喔喔 那他API定價怎麼這麼低
02/03 11:41, 17F

02/03 11:41, 2月前 , 18F
是套了多少 真的可悲
02/03 11:41, 18F

02/03 11:41, 2月前 , 19F
浮木又來了0.0
02/03 11:41, 19F

02/03 11:44, 2月前 , 20F
把openai的那些成本一起拿進來比阿==
02/03 11:44, 20F

02/03 11:44, 2月前 , 21F
好了喇
02/03 11:44, 21F

02/03 11:45, 2月前 , 22F
顯著降低了 93.3% 的推理成本
02/03 11:45, 22F

02/03 11:45, 2月前 , 23F
青鳥浮木 笑死
02/03 11:45, 23F

02/03 11:45, 2月前 , 24F
要這樣算 openai只會更貴
02/03 11:45, 24F

02/03 11:47, 2月前 , 25F
華爾街懂玩
02/03 11:47, 25F

02/03 11:48, 2月前 , 26F
XDDDDDDDDDDDDDDD
02/03 11:48, 26F

02/03 11:48, 2月前 , 27F
中時造反??
02/03 11:48, 27F

02/03 11:48, 2月前 , 28F
才430億?麵線的系統造價便宜
02/03 11:48, 28F

02/03 11:48, 2月前 , 29F
該不會下一步就要說是解放軍出資吧?
02/03 11:48, 29F

02/03 11:48, 2月前 , 30F
ds思考過程超長的
02/03 11:48, 30F

02/03 11:49, 2月前 , 31F
百分百正確
02/03 11:49, 31F

02/03 11:49, 2月前 , 32F
那很便宜欸?
02/03 11:49, 32F

02/03 11:49, 2月前 , 33F
現在就估值破口….容易懷疑資本支出..
02/03 11:49, 33F

02/03 11:50, 2月前 , 34F
這樣第一個模型就超貴 後面模型就可以大幅降低成本
02/03 11:50, 34F

02/03 11:50, 2月前 , 35F
超聰明的
02/03 11:50, 35F

02/03 11:50, 2月前 , 36F
照同樣標準計算,CloseAI只會更貴XDD
02/03 11:50, 36F

02/03 11:51, 2月前 , 37F
CloseAI之前就在內鬥
02/03 11:51, 37F

02/03 11:52, 2月前 , 38F
對 DS超爛 還不快彎腰撿鑽石
02/03 11:52, 38F

02/03 11:52, 2月前 , 39F
訓練成本和建置成本好像不同
02/03 11:52, 39F
還有 65 則推文
02/03 12:50, 2月前 , 105F
嗎 應該還滿專業的吧
02/03 12:50, 105F

02/03 12:51, 2月前 , 106F
繼續吹下去可能說是5萬萬張 H100
02/03 12:51, 106F

02/03 12:51, 2月前 , 107F
會員費600台幣變60塊就屌打了
02/03 12:51, 107F

02/03 12:52, 2月前 , 108F
難怪a股向下噴出 用腳投票
02/03 12:52, 108F

02/03 12:53, 2月前 , 109F
吹一堆多猛結果沒人買中國
02/03 12:53, 109F

02/03 12:56, 2月前 , 110F
現在實測所需資源就是少很多
02/03 12:56, 110F

02/03 12:58, 2月前 , 111F
500萬是ㄧ次 但還是低於同業
02/03 12:58, 111F

02/03 12:59, 2月前 , 112F
就算13億美...也是很便宜阿...
02/03 12:59, 112F

02/03 13:01, 2月前 , 113F
員工從小到大吃的奶粉錢算了沒?
02/03 13:01, 113F

02/03 13:01, 2月前 , 114F
吹哨壯膽
02/03 13:01, 114F

02/03 13:01, 2月前 , 115F
Deepseek的算力是租的。只算租金。有點像半導體代工
02/03 13:01, 115F

02/03 13:01, 2月前 , 116F
分散成本
02/03 13:01, 116F

02/03 13:05, 2月前 , 117F
不過即使真的算機台設備。還是成本比較低
02/03 13:05, 117F

02/03 13:11, 2月前 , 118F
嗯 nvdia 和微軟都沒你懂
02/03 13:11, 118F

02/03 13:12, 2月前 , 119F
DS的算力來源目前不可得 租的是指他們的算法結合
02/03 13:12, 119F

02/03 13:12, 2月前 , 120F
租金得出來的成本接近它們聲稱的成本
02/03 13:12, 120F

02/03 13:16, 2月前 , 121F
430億台幣比起OpenAI…?
02/03 13:16, 121F

02/03 13:20, 2月前 , 122F
才兩倍點麵線系統
02/03 13:20, 122F

02/03 13:26, 2月前 , 123F
這個就在講幹話而已
02/03 13:26, 123F

02/03 13:27, 2月前 , 124F
OpenAI零頭都不只
02/03 13:27, 124F

02/03 13:30, 2月前 , 125F
果然 , 430億成本吹成500萬 歐印NVDA @v@
02/03 13:30, 125F

02/03 13:35, 2月前 , 126F
哈哈,算模型把硬體成本也算入唷?
02/03 13:35, 126F

02/03 13:36, 2月前 , 127F
全世界就是只算訓練成本啦
02/03 13:36, 127F

02/03 13:39, 2月前 , 128F
好多五毛~ 沒有open ai 根本就不會有 deepseek
02/03 13:39, 128F

02/03 13:41, 2月前 , 129F
一直笑人中吹的趕快買硬體啦
02/03 13:41, 129F

02/03 14:18, 2月前 , 130F
好了啦 現實就是真的開殺了啊 是不是想騙我接刀
02/03 14:18, 130F

02/03 14:36, 2月前 , 131F
有跌就是買
02/03 14:36, 131F

02/03 15:00, 2月前 , 132F
人工費用美國比中國貴多少?
02/03 15:00, 132F

02/03 15:25, 2月前 , 133F
還在那邊審查內容...人家程式碼都開源了 不是很
02/03 15:25, 133F

02/03 15:25, 2月前 , 134F
想戰,但可以請你先google一下開源的意思嗎?deepse
02/03 15:25, 134F

02/03 15:25, 2月前 , 135F
ek屌的不是他成本低,而是他號稱成本低的同時把程式
02/03 15:25, 135F

02/03 15:25, 2月前 , 136F
碼丟出來,擺明了大家要抄來抄。這就是為啥各大廠都
02/03 15:25, 136F

02/03 15:25, 2月前 , 137F
把他的模型導入,因為導入之後就能驗證是不是說大話
02/03 15:25, 137F

02/03 15:25, 2月前 , 138F
02/03 15:25, 138F

02/03 15:53, 2月前 , 139F
中國人最愛的中時呢
02/03 15:53, 139F

02/03 16:10, 2月前 , 140F
壯膽^^
02/03 16:10, 140F

02/03 17:56, 2月前 , 141F
這個分析很外行 忘記把員工出生時的醫療費用算進去
02/03 17:56, 141F

02/03 17:56, 2月前 , 142F
了 難道員工沒出生有辦法幫公司工作嗎?
02/03 17:56, 142F

02/04 00:54, 2月前 , 143F
不管怎麼算,都比Open ai便宜很多
02/04 00:54, 143F

02/04 01:11, 2月前 , 144F
問題是根本沒辦法證實他們真正花在算力上的成本啊
02/04 01:11, 144F
文章代碼(AID): #1de3dtQR (Stock)