編輯《證券時報》 阮潤生
憑借卓越的性價比,國內開源大模型DeepSeeek已成為世界上增長最快的人工智能應用,引發了全球科技界的熱烈討論和計算能力信仰沖擊,進一步增強了建設開放人工智能生態的信心。目前,不僅是英偉達,AMD、英特爾等國際芯片巨頭宣布集成DeepSeek模型并提供計算支持。國內GPU制造商、云計算制造商和應用程序制造商等人工智能產業鏈合作伙伴也迅速支持調用DeepSeek來升級他們的產品和技術。
造成巨大的計算能震
DeepSeeek作為幻方量化旗下的AI公司深度搜索開發的國產開源大模型,最近連續發布了DeepSeek V3、DeepSeek-R1等人工智能模型顯示出驚人的效果和低培訓成本。移動應用分析機構Sensortower的數據顯示,其應用軟件在18天內下載了1600萬次。截至2025年2月4日,Depsek日活用戶數已超過2000萬,成為世界上增長最快的人工智能應用。
人工智能業內人士告訴《證券時報》,DeepSeeek證明,大型模型可以在沒有堆疊計算能力的情況下完成。
總的來說,DeepSeeek提供了一種高效的模型蒸餾技術,可以通過Multi將大規模模型的能力轉移到更小更高效的版本-Head Latent Attention(MLA)和DeepSeek MoE兩大核心技術顯著降低了顯存占用,優化了模型性能。
Trendforce集邦咨詢研究指出,Deepseek采用蒸餾模型(Model Distillation)技術,壓縮大型模型,提高推理速度,減少硬件需求,充分發揮英偉達hopper降級芯片的效益,最大限度地利用計算資源。其成本優勢來自于高效的硬件選擇、新的蒸餾技術和API開源策略,這不僅優化了技術和商業應用之間的平衡,而且顯示了人工智能產業向高效發展的趨勢。
DeepSeeek已經成為一個非凡的人工智能應用程序,這也引起了對計算能力信仰的質疑。全球計算能力巨頭英偉達股價1月27日下跌近17%,逐步穩定;1月27日,A股光通信模塊領頭羊中際徐創下跌約10%,2月5日進一步成交量下跌,工業富聯下跌6.76%,寒武紀-U下跌12.46%。
在這方面,英偉達此前曾發表聲明,稱DeepSeek的進展顯示了其芯片在中國市場的實用價值,未來將需要更多的英偉達芯片來滿足DepSeek的服務。
Trendforce集邦咨詢最新指出,雖然Deepseek模型降低了人工智能培訓的成本,但人工智能模型的低成本預計將擴大應用場景,從而增加全球數據中心的建設量。作為數據中心連接的關鍵組件,光收發模塊將受益于高速數據傳輸的需求。預計2023年全球出貨量超過400Gbps的光收發模塊將達到640萬,2024年出貨量約為2040萬,預計到2025年將超過3190萬,年增長率將達到56.5%。
積極適應AI芯片
對DeepSeek的認可不僅體現在排名和用戶下載上,也體現在國際AI芯片巨頭的兼容性和當地廠商的積極適應上。
1月31日,英偉達發布了Deepsek-R1 “英偉達NIM微服務”預覽版671b顯著提高了人工智能模型的運行效率,簡化了企業部署流程,降低了人工智能落地的技術門檻。
此外,AMD還將新的DeepSek-V3模型集成到Instincttin MI300X GPU上;英特爾還表示,其開發的AI芯片/GPU芯片可以支持DeepSeek,打算與中國芯片合作,打破英偉達創造的生態壟斷。
根據行業分析,Deepseek使用了英偉達的PTXX(Parallel Thread Execution)語言可以在接近匯編語言的層次上實現,通過優化細粒度,可以更底層、更準確地控制GPU硬件。
業內人士告訴編輯,使用PTX證明DepSeek有能力實現更底層的技術本質上對國內GPU也有好處。一些分析人士指出,通過精通PTX語言的使用,預計將有助于國內GPU進行有針對性的算子優化,提高國內GPU模型的運行效率。
除國際巨頭外,海光信息作為國內人工智能芯片企業,于2月4日晚宣布成功完成DeepSeekV3和R1模型與海光人工智能加速卡DCU的適應,并正式推出,預計將推動人工智能技術在更多行業的實施和普及。2月5日,該公司股價上漲11.19%。
此外,陸晨科技與華為盛騰聯合發布了基于盛騰計算能力的DeepSeek-R1系列推理API和云鏡像服務,實現了盛騰計算能力與DeepSeek-R1系列模型的推理適應性優化,其性能與高端GPU的使用相同。此外,DepSeek系列模型正式在盛騰社區推出,支持一鍵獲取DepSeek系列模型,支持盛騰硬件平臺開箱即用,推理快速部署。
國內GPU制造商穆西宣布與Deepseek合作,摩爾線程宣布部署Depseek蒸餾模型推理服務,提高計算效率和資源利用率;天數智能芯宣布適應Depsek-R1千問蒸餾模型,提供更高效、更穩定的推理服務,滿足不同規模和需求的應用場景。
2月5日,壁倫科技宣布,自主研發的壁銳TM系列產品完成了對DeepSeek-R1全系列蒸餾模型的支持,涵蓋了從1.5B到70B的各級參數版本,包括LLAMA蒸餾模型和千問蒸餾模型,為開發者提供高性能、低成本的大型模型部署和開發解決方案。
接入云制造商和應用程序端
除了人工智能硬件制造商外,許多云計算巨頭還入圍了“朋友圈”,華為云、騰訊云、阿里巴巴云、百度云等已宣布支持DepSeek模型的部署。此外,聯通云宣布實現國內和主流計算能力適應多規格DepSeek-R1模型,考慮私有化和公共場景,提供全面的運營服務保障,為客戶帶來開箱體驗;實現多產品場景調用,可預部署270多個骨干云池,全面訪問聯通云桌面、編程助理等多產品場景;提供全方位的安全服務保障,實時提供抗DDOS等三種安全服務,并有大型元景安全模型支持。
除云制造商外,應用端制造商還在積極探索和部署DeepSeek模型。
2月4日,萬興科技表示,已完成深度搜索(DeepSeek)最新推理大模型DeepSeek-R1的深度適應,其視頻創意、繪圖創意、文檔創意軟件業務產品,如萬興喵影、億圖圖示、億圖腦圖MindMaster等、萬興PDF已經整合了DeepSeek-R1大模型的相關能力,用戶可以獲得新的體驗。接入DeepSeek-R1后,用戶使用產品的門檻降低,大型模型應用的成本進一步降低。
此外,北信源微信官方賬號顯示,其自主研發的“密信AI能力平臺”首次完成了與DeepSeek的技術對接,將為信源密信和第三方應用提供DeepSeek大模型AI能力;奇安信宣布已完成與DeepSeek的全面深入接入,自主研發的QAX-GPT安全模型經過DepSeek-R1優化蒸餾后,運營成本大幅降低,威脅研判等場景性能明顯提升,安全專業問答整體性能分數提升約16%。
當虹科技官微顯示,公司Blackeye多模態視聽大模型正式集成DeepSeek-R1和DeepSeekek Janus Pro,并完成視聽媒體、工業衛星、車載智能駕駛艙等行業垂直場景的數據優化培訓,為視聽媒體、工業衛星、車載智能駕駛艙等行業客戶提供更低成本的大型模型部署和新的大型模型體驗。
易點天下宣布,其KreadoAI、許多核心產品,如數眼智能和zMaticooADX,將整合DeepSeek-R1大型模型的相關能力,提升用戶的智能營銷體驗。
2月5日,盛天網絡在互動平臺上回復了“公司人工智能產品是否與DeepSeek模型合作或使用”等問題。該公司已經進行了相關的合作,并正在使用DeepSeek模型進行對接。公司通過在線API接口和私有化部署開源模型進行了工作,已部署并進入測試階段。公司預計,DeepSeek模型可應用于公司的社交產品帶和小麥,探索更好的產品和服務,進一步提高公司的業務生產力,結合公司的彈性計算池,有效降低計算能力成本。目前,該公司的一款與DepSeek對接的社交游戲已經完成了一輪內部測試。
根據中文在線消息,基于DeepSeekek V3和R1提出的技術路線,中文在線專注于研發和培訓升級版的“中文逍遙”,以進一步提高大模型的創作能力。
2月5日,閱文集團宣布其作家輔助創作產品——作家助手集成了獨立部署的大型Deepseek-R1模型。閱文邀請全行業網絡作家參與,用戶可以下載作家助手到最新版本進行試用并參與內部測試。
此外,2月5日,華為終端BG首席執行官何剛在微博上透露,華為小藝助手已接入DepSeek,小藝App智能體廣場已推出DepSeek-R1Beta版,升級為原生鴻蒙系統體驗。
編輯:金杜