五月天亚洲综合情_国产伦理久久久_国产 高清 精品 在线 a_国产精品国产精品国产专区不卡_天堂精品视频_亚洲一区二区在_国产尤物99_五码日韩精品一区二区三区视频_97超级碰碰_亚洲欧洲国产日韩精品

新聞中心
News
聯系我們
 

電 話:86-755-82910368

傳 真:86-755-82910673

郵 箱:sail-group@sail-group.com.cn

郵 編:518001

外媒拆解DeepSeek制勝秘籍!OpenAI CEO終于認錯:我們站在了歷史錯誤的一邊

時間:25-02-05 來源:摘自-智東西

外媒拆解DeepSeek制勝秘籍!OpenAI CEO終于認錯:我們站在了歷史錯誤的一邊

大年初四,當之無愧的春節頂流DeepSeek仍在持續刷屏霸榜,熱度不減。

前腳,DeepSeek面臨的巨頭企業官宣加入vs多國政府下場質疑的冰火兩重天局勢尚未平靜(DeepSeek在美兩重天:五大巨頭接入,政府誠惶誠恐);后腳,OpenAI被逼急,凌晨亮出全新推理模型o3-mini,并在ChatGPT首次向所有用戶免費提供推理模型,不過o3-miniAPI定價還是高于DeepSeek模型(重磅!OpenAIo3-mini新模型,被DeepSeek逼急?定價仍打不過)。

o3-mini發布后,OpenAI CEO薩姆·阿爾特曼(Sam Altman)在Reddit上提到,要學習DeepSeek將推理模型的思考過程公開;OpenAI的閉源策略使他們站到了歷史錯誤的一邊,將重新思考OpenAI的開源策略;并坦言他們的領先優勢已經不如之前大了。

繼美國兩大云巨頭后,華為云今日宣布與硅基流動聯合推出并上線基于華為云昇騰云服務的DeepSeek R1/V3推理服務。

         

o3-mini的發布并沒有分散DeepSeek的討論度。昨天,半導體研究和咨詢公司SemiAnalysis的一項新報告揭秘了DeepSeek成功的關鍵因素及推測:

DeepSeek擁有至少大約5萬塊Hopper架構的GPU,且GPU投資已超過5億美元;

600萬美元成本只包含其預訓練運行的GPU成本,不包括硬件本身的研發和總體擁有成本(TCO)等重要部分;

為了吸納人才給有前途的候選人提供超過130萬美元(折合約942萬人民幣)的年薪;

關鍵創新多頭潛注意力(MLA)將每個查詢KV量減少93.3%,顯著降低了推理價格。

DeepSeek的成功在硅谷掀起波瀾,今日上午,英偉達創始人兼CEO黃仁勛被緊急召進美國白宮,與美國總統Donald Trump(唐納德·特朗普)討論了DeepSeek以及收緊AI芯片出口。

知情人士透露,特朗普認為這家中國公司的出現意味著“美國公司不必花費大量資金來構建低成本AI替代品”。此外,其會議上還提到,美國政府將在今年春天進一步限制AI芯片出口,以確保美國及其盟友繼續擁有先進的計算能力。

昨晚,國內AI產品分析平臺AI產品榜發布的數據顯示,上線18天的DeepSeek日活已經達到1500萬,ChatGPT1500萬花了244天,DeepSeek增速是ChatGPT13倍。

    

截止當前DeepSeek依然霸榜,位列蘋果應用商店157個國家/地區的第一名。

這場關于DeepSeek的爭吵仍然沒有停下。Meta首席科學家楊立昆發文銳評,他認為硅谷圈子中的“常見病”是:錯位的優越感。病癥的高級階段是,認為自己的小圈子已經壟斷了好的想法,病癥末期是,假設來自其他地方的創新都是通過作弊獲得的。

          

01.

OpenAI回應定價、針對開源策略認錯

劇透GPT-5、坦言領先優勢變小

阿爾特曼和OpenAI首席研究官Mark ChenOpenAI首席產品官Kevin Weil等現身Reddit,在回復用戶問題時多次提到DeepSeek,并且劇透了OpenAI的新研究進展。

OpenAI首次回應了o3-mini價格沒有競爭力,OpenAI API研究主管Michelle Pokrass稱,o3-mini相比于美國托管版本的DeepSeek具有競爭力。

   

阿爾特曼還稱贊DeepSeek是一個非常好的模型,并且稱“我們將保持比往年更少的領先優勢”。

     

看到開源的DeepSeek發布,阿爾特曼對OpenAI的閉源策略進行了反思。他透露,OpenAI正在討論(發布一些模型權重等)。他說:“我個人認為我們在這里站在了歷史錯誤的一邊,需要找出不同的開源策略,但并非OpenAI的每個人都同意這種觀點,這也不是我們目前的首要任務。”

    

DeepSeekR1模型可以向用戶顯示模型中間的思考過程,阿爾特曼稱OpenAI將效仿DeepSeek的做法:“是的,我們很快會展示一個更有用、更詳細的版本。感謝R1讓我們有所更新。”OpenAI可能更多地揭示其推理模型(如o3-mini)的“思考過程”。

    

OpenAI首席產品官Kevin Weil還劇透了OpenAI的新進展。

4o的圖像生成功能可能要幾個月后推出。

    

高級語音更新即將推出,GPT-5的發布還沒有時間表。

    

OpenAI計劃將文件附加功能添加到推理模型中。

    

完整的o3模型將在幾周、不到幾個月的時間內完整亮相。

    

02.

DeepSeek的制勝秘籍:

手握6萬塊GPU,千萬年薪招人

半導體研究和咨詢公司SemiAnalysis的一項新報告揭秘了DeepSeek成功的關鍵因素及推測。

其研究顯示,DeepSeek不是外界所傳的“副業”,其GPU投資已經超過5億美元。

DeepSeek擁有至少大約5萬塊Hopper架構的GPU,其中可能大約有1萬塊H8001萬塊H1003萬塊H201萬塊A100。這些GPU在幻方量化和DeepSeek之間共享,用于交易、推理、訓練和研究。

    

報告分析表明,DeepSeek的總服務器資本支出約為16億美元(折合約116億人民幣),運營此類集群的成本高達9.44億美元(折合約68億人民幣)。

DeepSeek的價格和效率在本周引起了業界的狂熱討論:DeepSeek用不到600萬美元的成本,干翻了硅谷巨頭們花費數十億美金訓練的AI模型。

SemiAnalysis的報告提到,這個說法存在錯誤,這類似于將產品物料清單的特定部分并將其歸因為全部成本,預訓練成本在總成本中只占很小的一部分。

600萬美元只包含其預訓練運行的GPU成本,只是模型總成本的一部分,不包括硬件本身的研發和總體擁有成本(TCO)等重要部分。

作為參考,Claude 3.5 Sonnet的訓練成本為數千萬美元,但這并不是Anthropic所需的總成本,他們還需要資金進行實驗、提出新架構、收集和清理數據、支付員工工資等。

其報告還提到,DeepSeek在尋找人才方面也投入了大量資金。

目前,該公司的員工人數在150人左右,且公司崗位并沒有被預先定義,會根據招聘人員靈活定義。

DeepSeek選擇在國內尋找人才,并且不考慮其此前的資歷,非常注重能力和好奇心。這家公司會定期在北京大學和浙江大學等頂尖大學舉辦招聘活動,其許多員工都畢業于浙江大學。

報告提到,該公司此前還為有前途的候選人提供超過130萬美元(折合約942萬人民幣)的年薪,這一薪資水平遠高于國內大型科技公司以及大模型創企。

在第三方招聘軟件BOSS直聘中,DeepSeek公開的在招職位有37個,核心系統研發工程師、深度學習研究員薪資水平最高為50-80K60-90K,除實習生其他崗位均為14薪。

大多數情況下,DeepSeek不依賴外部方或提供商,運行自己的數據中心,不依賴外部方或提供商。這為實驗開辟了更多領域,使他們能夠跨堆棧進行創新。

03.

推理成本下降,

token預測、多頭潛注意力兩大創新

推理成本驟降是AI進步的一個顯著特征。

一個明顯的例子就是,筆記本電腦上運行的小模型目前已經與GPT-3性能相當,而后者需要一臺超級計算機進行訓練和多個GPU進行推理。換句話說,算法改進允許使用較少的計算量來訓練和推理具有相同能力的模型,而且這種模式正一遍又一遍上演。

    

到目前為止,在這種模式下AI實驗室的策略是花費更多錢來獲得更多智能。據估計,算法的進步是每年提升4倍,這意味著每過一年實現相同能力所需的計算量就會減少到1/4Anthropic的首席執行官達里奧·阿莫迪(Dario Amodei)認為,算法的進步甚至更快,可以產生10倍的改進。就GPT-3質量的推理定價而言,成本下降到1/1200

該報告還調查了GPT-4的成本,在曲線早期也有類似的成本下降趨勢。雖然隨著時間的推移成本差異減少,但在這種情況下,我們看到算法改進和優化使成本降低到1/10,能力提高了。

    

需要明確的是,DeepSeek率先達到了這個級別的成本和能力,并且其獨特之處還在于發布了開放權重,SemiAnalysis認為其成本甚至會繼續降低到1/5

DeepSeek是如何如此迅速地趕上來的?

答案是,推理具有更快的迭代速度和更低成本唾手可得的成果,且與以前的范式相比,計算量更小。但以前的范式依賴于預訓練,因價格昂貴難以實現穩健的收益。

新范式側重于通過合成數據生成和現有模型后訓練中的強化學習進行推理能力,從而以更低的價格獲得更快的收益。較低的進入門檻與簡單的優化相結合,意味著DeepSeek能夠比平時更快地復制o1方法。

未來,隨著研發人員弄清楚如何在這一新模式中實現更大規模的發展/應用等,預計不同模型之間能力匹配的時間差距將會拉大。

DeepSeek的爆火在于其破解了架構創新的密碼并解鎖了領先實驗室尚未能夠實現的創新,其中包括Training (Pre and Post)  模型預訓練和后訓練以及多頭潛在注意力(MLA)。

1TrainingPre and Post)模型預訓練和后訓練

DeepSeek V3以前所未有的規模利用了多標記預測(MTP),其添加的注意力模塊可以預測接下來的幾個Token,而不是單個Token。這提高了模型在訓練期間的性能,并且可以在推理期間丟棄。這一方法以較低的計算能力提高了性能。還有一些額外的考慮因素,例如在訓練中采用FP8精度。

此外,該模型也是混合專家模型,由許多其他專注于不同事物的較小專家模型組成。MoE模型面臨的一個難題是如何確定哪個Token屬于哪個子模型。

DeepSeek基于門控網絡(Gating Network),以不降低模型性能的平衡方式將Token路由到正確的子模型,這提升了訓練效率并降低了推理成本。

盡管業界有人擔心混合專家模型使得效率提高可能會減少該領域的相關投資,但Dario指出,功能更強大的模型經濟效益非常可觀,以至于任何節省的成本都會迅速重新投資于構建更大的模型。MoE的效率提高不會減少整體投資,而是會加速AI擴展工作。

R1的強大能力得益于基礎模型V3,強化學習提供了兩大能力,一是Formatting(確保它提供連貫輸出)二是有用性和無害性(確保模型有用)。推理能力是在合成數據集上對模型進行微調期間出現的。

不過R1論文中沒有提到計算,這是因為提到使用了多少計算會表明他們的GPU比他們的敘述所暗示的要多。這種規模的強化學習需要大量的計算,尤其是生成合成數據。

R1論文中還提到,能使用推理模型的輸出對其進行微調,將非推理的較小模型轉換為推理模型。數據集管理總共包含800k個樣本,現在任何人都可以使用R1的思維鏈輸出來制作自己的數據集,并在這些輸出的幫助下制作推理模型。未來,我們可能會看到更多較小的模型展示推理能力,從而使得小型模型的性能提高。

2Multi-head Latent AttentionMLA)多頭潛在注意力

另外一項關鍵創新是MLA,負責顯著降低DeepSeek的推理價格。

其原因是MLA將每個查詢所需的KV Cache(鍵-值緩存)數量減少了約93.3%KV CacheTransformer中的一種內存機制,它存儲代表對話上下文的數據,從而減少不必要的計算。

KV Cache會隨著對話上下文的增長而增長,并產生相當大的內存限制,大幅減少每個查詢所需的 KV Cache 數量會減少每個查詢所需的硬件數量,從而降低成本。報告認為,DeepSeek是在以成本價提供推理服務來獲取市場份額,實際上并沒有盈利。

04.

結語:DeepSeek發布

中美AI競爭格局大洗牌

DeepSeek的發布對整個行業產生了全方位、深層次的影響。從OpenAI新發布的o3-mini也可以看出,中美之間的AI競爭格局正在改變,中國企業在開源領域的積極作為,讓美國不得不重新審視其限制開源的策略。

從產業競爭格局來看,DeepSeek的橫空出世重塑了全球AI產業的競爭版圖,這或許也將促使各國重新審視AI發展戰略,加強在AI領域的投入和合作,共同推動AI技術的進步。

春節期間DeepSeek掀起的這場AI風暴仍在中美乃至全球科技、政金界產生持續影響,并不斷發酵,已經成為改變AI科技產業趨勢的風向標事件,智東西將持續跟進相關進展和報道,敬請關注。

摘自-智東西

   
上一篇 下一篇
投資的最高境界:等戴維斯來敲門沒有上一篇
五月天亚洲综合情_国产伦理久久久_国产 高清 精品 在线 a_国产精品国产精品国产专区不卡_天堂精品视频_亚洲一区二区在_国产尤物99_五码日韩精品一区二区三区视频_97超级碰碰_亚洲欧洲国产日韩精品
国产麻豆日韩| 亚洲精品中文在线影院| 欧洲精品一区色| 国产一区二区免费在线观看| 国产高清一区视频| 国产一区二区三区免费不卡| 国产精品免费在线播放| 蜜桃精品久久久久久久免费影院| 欧美日韩一区二区三区免费| 一区二区三区免费观看| 亚洲精品成人在线| 日韩高清不卡在线| 国产精品自产自拍| 不卡的av网站| 久久国产一区| 欧美性一区二区| 亚洲精品一区在线观看| 亚洲国产精品99久久久久久久久| 亚洲欧美一区二区三区久本道91| 亚洲成人福利片| 国产精品影视在线| 国产精品国产三级国产专区53| 热re99久久精品国产99热| 欧美性受极品xxxx喷水| 欧美精品一区二区久久婷婷| 1区2区3区国产精品| 人妖欧美一区二区| 99免费精品在线| 欧美午夜精品久久久久免费视 | 国产精品美女久久久久av爽李琼| 亚洲黄色av一区| 国产精品性做久久久久久| 国产精品日本一区二区| 色哟哟一区二区| 国产午夜精品一区二区三区嫩草| 日韩一区日韩二区| 国产综合成人久久大片91| 国产精品制服诱惑| 欧美三级在线视频| 欧美激情在线看| 美腿丝袜亚洲色图| 精品不卡在线| 91精品欧美一区二区三区综合在 | 青青草原成人| 精品国产露脸精彩对白| 舔着乳尖日韩一区| αv一区二区三区| 欧美性受xxxx| 亚洲日本va午夜在线电影| 国产精品18久久久| 午夜视频久久久| 国产日产亚洲精品系列| 国内久久精品视频| 神马欧美一区二区| 中文字幕国产精品一区二区| 九九精品视频在线看| 六十路精品视频| 精品国产亚洲一区二区三区在线观看| 亚洲444eee在线观看| 99r国产精品视频| 91精品国产91综合久久蜜臀| 亚洲成人自拍网| 国内一区二区在线视频观看 | 日韩电影在线看| 久久婷婷人人澡人人喊人人爽| 精品久久久久久久久久久久久久久| 午夜精品久久久久影视| 精品国产乱码一区二区三区四区| 日韩欧美在线123| 全部av―极品视觉盛宴亚洲| 蜜桃视频日韩| 国产精品色哟哟| 99久久精品情趣| 欧美一区永久视频免费观看| 日本中文一区二区三区| 婷婷精品国产一区二区三区日韩| 中文字幕中文字幕一区| 91超碰rencao97精品| 欧美不卡激情三级在线观看| 久久精品国产免费看久久精品| 性刺激综合网| 亚洲激情av在线| 久久久亚洲综合网站| 国产精品人妖ts系列视频 | 色婷婷av一区二区三区软件| 亚洲在线视频一区| 免费影院在线观看一区| 亚洲天天做日日做天天谢日日欢| 97人人香蕉| 久久久久久久免费视频了| 不卡免费追剧大全电视剧网站| 日韩欧美一区在线| www.亚洲激情.com| 国产亚洲污的网站| 福利视频一区二区三区| 国产欧美一区二区精品秋霞影院| 91嫩草在线| 国产精品麻豆一区二区| 国产欧美亚洲日本| 亚洲欧美一区二区视频| 欧美亚洲一级二级| 亚洲成av人影院| 亚洲欧美电影在线观看| 视频一区二区三区在线| 色狠狠色噜噜噜综合网| 精品中文字幕一区二区| 欧美日韩免费观看一区三区| 国内精品视频一区二区三区八戒| 欧美高清激情brazzers| 国产v综合v亚洲欧| 国产视频一区在线播放| 国产精品亚洲一区| 亚洲精品国产第一综合99久久| 日韩不卡av| 蓝色福利精品导航| 欧美一区二区三区在| 99精品一区二区| 中文字幕日韩精品一区| 婷婷五月色综合| 麻豆精品蜜桃视频网站| 日韩欧美你懂的| 成人自拍爱视频| 亚洲成av人片一区二区三区| 色综合久久久久| 成人国产精品免费观看动漫| 国产免费成人在线视频| 亚洲国产日韩欧美| 国产精品综合在线视频| 国产农村妇女毛片精品久久麻豆 | 久久综合久久综合这里只有精品| 亚洲高清免费观看 | 在线亚洲精品福利网址导航| 国产精品资源站在线| 国产欧美综合在线| 亚洲精品中字| 国产69精品久久久久777| 国产精品国产自产拍高清av| 亚洲国产精品久久久久婷婷老年 | 国产精品大尺度| 一本久久精品一区二区| 国产69精品久久久久777| 亚洲视频一区二区在线观看| 一本一道久久a久久精品 | ...xxx性欧美| 91豆麻精品91久久久久久| 国产一区久久久| 久久久精品综合| 一区二区三区我不卡| av中文字幕在线不卡| 亚洲午夜精品在线| 2014亚洲片线观看视频免费| 日本免费高清一区二区| 国产乱人伦精品一区二区在线观看| 中文一区二区在线观看| 欧美色网站导航| 黄色国产精品一区二区三区| 久久精品国产亚洲5555| 国产精品久久免费看| 欧美系列一区二区| 国产在线播放一区二区| 国产传媒欧美日韩成人| 亚洲免费伊人电影| 欧美成人一区二区| 一本一道波多野结衣一区二区| 91丝袜脚交足在线播放| 久久国产精品免费| 亚洲欧美日韩国产手机在线| 91精品久久久久久久99蜜桃 | 久久草.com| 国产成人鲁色资源国产91色综| 亚洲黄一区二区三区| 欧美精品一区二区三区在线播放| 亚洲欧美国产精品桃花| 豆国产97在线| 国产 日韩 欧美大片| 日韩国产精品久久久久久亚洲| 国产欧美一区二区三区网站 | 一卡二卡3卡四卡高清精品视频| av资源网一区| 国产精一区二区三区| 日韩中文字幕区一区有砖一区 | 日本美女视频一区二区| 综合av第一页| 精品国产a毛片| 欧美高清一级片在线| 色综合网站在线| 欧美久久久久久| 国产欧美日韩在线播放| 99re这里只有精品首页| 国产一区二区在线影院| 日韩不卡一二三区| 午夜伊人狠狠久久| 亚洲黄色小视频| 亚洲欧洲另类国产综合| 国产欧美日韩视频一区二区| 欧美精品一区男女天堂| 日韩欧美在线影院| 日韩一区二区三区观看| 91精品国产色综合久久不卡电影| 欧美午夜在线观看|