跳至內容

DeepSeek-R1

維基百科,自由的百科全書
DeepSeek R1
開發者深度求索
首次發布2025年1月20日,​10個月前​(2025-01-20
當前版本
  • 1.0.0(2025年4月9日;穩定版本)[1]
編輯維基數據鏈接
原始碼庫 編輯維基數據鏈接
前任DeepSeek-R1-Lite
繼任DeepSeek-V3.1
類型
許可協議MIT
網站www.deepseek.com

DeepSeek-R1深度求索(DeepSeek)於2025年1月20日發布的人工智慧大型語言模型,專門適用於數學、編碼和邏輯等任務,性能對標OpenAI o1[2]

訓練

[編輯]

DeepSeek-R1-Lite是Deepseek R1的預覽版,於2024年11月20日發布。[3]後於2025年1月20日正式發布發布DeepSeek R1[4]

DeepSeek-R1與DeepSeek-R1-Zero[5]基於DeepSeek-V3-Base,與其共享了相同的架構。而DeepSeek-R1-Distill系列模型則由其他預訓練的開放權重模型(包括LLaMAQwen)初始化,然後基於R1生成的合成數據進行微調。[6]

DeepSeek-R1-Zero的訓練模板
A conversation between User and Assistant. The User asks a question and the Assistant solves it. The Assistant first thinks about the reasoning process in the mind and then provides the User with the answer. The reasoning process and answer are enclosed within <think>...</think> and <answer>...</answer> tags, respectively, that is, <think> reasoning process here </think><answer> answer here </answer>. User: prompt[註 1]. Assistant:

DeepSeek-R1-Zero僅使用GRPO強化學習進行訓練,未使用SFT。與之前的版本不同,它沒有使用基於模型的獎勵。所有獎勵函數均基於規則。主主要分為兩種類型(其他類型未具體說明):準確率獎勵和格式獎勵。準確率獎勵用於檢查方框內的答案是否正確(針對數學問題)或代碼是否通過測試(針對編程問題)。格式獎勵用於檢查模型是否將其思維軌跡置於<think>...</think>標籤內。[6]

DeepSeek-R1的論文中沒有公布其訓練成本等細節。[8]

不過此前的論文中,深度求索透露其訓練使用的是英偉達因為美國出口管制而針對中國市場特供的低配版GPU H800,訓練成本為557.6萬美元,遠低於類似西方公司的閉源模型。[2][9][10]

外界預估R1的訓練成本DeepSeek-V3略高,或在600萬美元上下。[11]

特點

[編輯]

DeepSeek稱該模型用了強化學習訓練,並為用戶展現了 o1 沒有公開的完整思考過程。

Deepseek R1 Lite在回答問題前會花更多時間思考,因此準確度會增強。Deepseek的測試結果表明,在數學競賽上的得分與測驗所允許思考的長度緊密相關,而模型思維鍊長度增加展現了更高的效率。[3]

DeepSeek-R1關鍵特點就是便宜,與OpenAI o1的價格相差極大。DeepSeek-R1上線時提供的API服務定價為每百萬輸入tokens 1元人民幣(緩存命中)/4元(緩存未命中),每百萬輸出tokens 16元,輸出API價格僅僅只有OpenAI o1的3%。[12]

測試成績

[編輯]

Deepseek-R1-Lite在數學、代碼和複雜邏輯推理上,獲得媲美 o1-preview 的推理效果。

美國數學邀請賽中,DeepSeek 稱,該模型在美國邀請數學考試和 MATH 等既定基準上的表現超過了 OpenAI o1 Preview的水平,在國際數學奧林匹克正確率達到83%,

它還在Codeforces編程競賽中優於89%的參賽者,但在GPQA Diamond,LiveCodeBench和自然語言解謎中較為遜色。[13]

應用情況

[編輯]

DeepSeek-R1使用MIT協議開源,意味著任何人都可以自由使用該模型,包括商業用途。

用戶可以在DeepSeek官方網站和App使用官方提供的服務。

公共服務

[編輯]

中國

[編輯]

2025年2月起,中國多地政府部門相繼將DeepSeek接入政務服務系統,用於公文寫作、政策解讀等方面[14]

2025年2月8日,廣東省深圳市龍崗區政務服務和數據管理局就已經在政務外網部署了DeepSeek-R1模型。

2025年2月16日,深圳市正式為全市各區及各部門提供DeepSeek模型應用服務[15];其中,福田區基於DeepSeek開發了首批70名AI「數智員工」[16][17][18]

2025年2月17日,佛山市「江義村智慧鄉村平台」於正式接入DeepSeek[19]

2025年2月18日,北京市豐臺區在政務雲本地部署DeepSeek大模型[14]

香港

[編輯]

香港生成式人工智慧研發中心在DeepSeek的基礎上,開發HKGAI V1人工智慧大語言開源基礎模型[20]

HKGAI V1支援粵語、普通話及英語,將DeepSeek本地化、使用香港本地數據[21],全參數微調,並持續訓練。

HKGAI V1涵蓋「港話通」、「港文通」、「港會通」、「港法通」、「港環通」等系統[22][23],當中的「港文通」為生成式人工智慧文書輔助應用程式,在超過70個香港政府部門開始試用[24][25]

創新科技及工業局局長孫東表示,期望「港話通」手機版應用程序在2025年內推出[26],並以此提供更有個性化的服務[27]

2025年5月8日,廉政公署向公衆展出「深博士」(英語:Dr. Deep),廉署在DeepSeek的基礎上開發的人工智慧模型[28],可提供廉署資訊及防貪建議[29],未來有機會在廉署的分區辦事處、網上或手機使用[30]

其他

[編輯]

瀋陽飛機設計研究所在研發新戰機的過程中,引入了DeepSeek[31]

多家汽車製造商,包括BMW[32]東風汽車比亞迪廣汽零跑[33]本田[34]日產[35],宣佈與DeepSeek合作,將其AI系統和中國版汽車結合。

2025年緬甸地震的救援行動中,中國國家緊急語言服務團與北京語言大學團隊基於DeepSeek的大模型,研發中緬英互譯系統,支援中國國際救援隊進行救災工作[36][37][38],並在未來開源與其他地區使用。

外界反應

[編輯]

1月27日,DeepSeek超越ChatGPT,登頂蘋果App Store美國區免費APP下載排行榜。[39]

DeepSeek-R1爆火,引發全球投資者大量拋售人工智慧相關股票。1月27日,英偉達美股股價下跌近17%,單日市值蒸發5890億美元,為美國股市歷史上最大。[40][41]

DeepSeek-R1發布後不久,Meta執行長馬克·扎克伯格就宣布,Meta計劃在2025年投入超600億美元,加大對人工智慧的投入。[11]據媒體1月27日報道,Meta成立了四個研究小組,專門研究DeepSeek的模型。[42]其中兩個小組研究其開發者如何降低訓練和運行DeepSeek的成本,第三個小組研究訓練模型可能使用了哪些數據,第四個小組研究基於DeepSeek模型屬性重構其LLaMA模型的新技術。[43]

OpenAI表示,其有證據表明DeepSeek使用OpenAI的專有模型來訓練自己的開源模型,這違反了OpenAI的服務條款。[44]在R1的Nature論文釋出的同行評議文件中,DeepSeek-R1的研究人員稱,R1 並沒有使用OpenAI專有模型生成的樣本但同時承認與大多數的生成模型一樣,在訓練過程中不可避免地使用了網際網路上的由其他AI生成樣本[45]

現狀與替代方案

[編輯]

由於用戶量激增,DeepSeek R1曾面臨伺服器頻繁繁忙問題,主要歸因可能有多種,包括算力需求、帶寬限制及網絡攻擊。用戶可通過本地部署(如Ollama工具)、調用API或使用第三方平台。

參見

[編輯]

注釋

[編輯]
  1. ^ prompt在訓練過程中會被具體的推理問題所替換。

參考資料

[編輯]
  1. ^ Release 1.0.0. 2025年4月9日 [2025年6月27日]. 
  2. ^ 2.0 2.1 DeepSeek横空出世,美中AI竞争会迎来根本性改变吗?. 美國之音. 2025-01-28 [2025-01-28]. (原始內容存檔於2025-01-28) (中文). 
  3. ^ 3.0 3.1 DeepSeek推理模型预览版上线,解密o1推理过程 | DeepSeek API Docs. api-docs.deepseek.com. [2025-01-29]. (原始內容存檔於2025-01-26) (中文(中國大陸)). 
  4. ^ DeepSeek-R1 发布,性能对标 OpenAI o1 正式版. DeepSeek API Docs. 2025-08-21 [2025-09-19] (中文). 
  5. ^ Release DeepSeek-R1 · deepseek-ai/DeepSeek-R1@23807ce. GitHub. [21 January 2025]. (原始內容存檔於21 January 2025) (英語). 
  6. ^ 6.0 6.1 DeepSeek-AI; Guo, Daya; Yang, Dejian; Zhang, Haowei; Song, Junxiao; Zhang, Ruoyu; Xu, Runxin; Zhu, Qihao; Ma, Shirong, DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning, 22 January 2025, arXiv:2501.12948可免費查閱 
  7. ^ Guo, Daya; Yang, Dejian; Zhang, Haowei; Song, Junxiao; Wang, Peiyi. DeepSeek-R1 incentivizes reasoning in LLMs through reinforcement learning. Nature (Springer Science and Business Media LLC). 2025-09-17, 645 (8081): 633–638. ISSN 0028-0836. doi:10.1038/s41586-025-09422-z可免費查閱. 
  8. ^ DeepSeek-R1/DeepSeek_R1.pdf at main · deepseek-ai/DeepSeek-R1 (PDF). [2025-02-01]. (原始內容存檔 (PDF)於2025-01-29). 
  9. ^ DeepSeek-V3/DeepSeek_V3.pdf at main · deepseek-ai/DeepSeek-V3 (PDF). [2025-02-01]. (原始內容存檔 (PDF)於2025-02-01). 
  10. ^ 孫銘蔚. 量化巨头幻方创始人梁文锋参加总理座谈会并发言,他还创办了“AI界拼多多”. 澎湃新聞. 2025-01-22 [2025-01-28]. (原始內容存檔於2025-01-26) (中文(中國大陸)). 
  11. ^ 11.0 11.1 吳遇利. DeepSeek“恐惧感”支配硅谷!Meta被曝组建4个小组专门研究. 澎湃新聞. 2025-01-27 [2025-01-29]. (原始內容存檔於2025-01-30) (中文(中國大陸)). 
  12. ^ 鄭遠方. “价格屠夫”DeepSeek的理想主义:开源、降本与AI普惠. 財聯社. 2025-01-28 [2025-01-28] (中文(中國大陸)). 
  13. ^ Franzen, Carl. DeepSeek’s first reasoning model R1-Lite-Preview turns heads, beating OpenAI o1 performance. VentureBeat. 2024-11-20 [2025-01-29]. (原始內容存檔於2024-11-22) (美國英語). 
  14. ^ 14.0 14.1 多地政务系统接入DeepSeek意味着什么?. 新華網. [2025-02-20]. (原始內容存檔於2025-02-18). 
  15. ^ 广州、深圳政务系统接入DeepSeek. 新浪新聞. [2025-02-20]. (原始內容存檔於2025-02-25). 
  16. ^ 深圳70名“AI公务员”上岗,公文处理、招商引资等场景均有覆盖. 澎湃新聞. 
  17. ^ 首批“AI公务员”上岗!人类“饭碗”不保?. 新浪財經. [2025-02-20]. (原始內容存檔於2025-02-21). 
  18. ^ Oscar. 深圳福田引入 70 個 AI 公務員 基於 DeepSeek R1、錯誤率5% 內. 香港 unwire.hk 玩生活.樂科技. 2025-02-17 [2025-05-15]. (原始內容存檔於2025-03-20) (中文(香港)). 
  19. ^ 中國新聞網. 佛山“江义村智慧乡村平台”接入DeepSeek. 騰訊網. [2025-02-20]. (原始內容存檔於2025-02-22). 
  20. ^ 科大率先試用首個港產AI大模型HKGAI V1 推動教育創新 | The Hong Kong University of Science and Technology. hkust.edu.hk. [2025-05-15]. (原始內容存檔於2025-05-16). 
  21. ^ (有片)香港首個AI模型HKGAI V1誕生 實現DeepSeek系統本地化. 香港文匯網. [2025-05-15]. (原始內容存檔於2025-03-23) (zh-Hans-HK). 
  22. ^ DeepSeek本地化 香港首個AI大模型HKGAI V1 誕生 冀年內開放使用 | 智慧生活 | 中國科技. 當代中國. [2025-05-15]. 
  23. ^ 香港生成式人工智能研發中心 於香港國際創科展2025展示多項人工智能科研新成果 | The Hong Kong University of Science and Technology. hkust.edu.hk. [2025-05-15]. 
  24. ^ 創新科技及工業局局長出席香港生成式人工智能研發中心HKGAI V1大模型全球首發發布會致辭全文(只有中文)(附圖). www.info.gov.hk. [2025-05-15]. (原始內容存檔於2025-03-18). 
  25. ^ 立法會七題:香港研發的大語言模型. www.info.gov.hk. [2025-05-15]. (原始內容存檔於2025-05-16). 
  26. ^ 文維廣. 孫東:手機版「港話通」盡快推出 財赤下更有針對性投資創科. 香港01. 2025-03-10 [2025-05-15] (中文(香港)). 
  27. ^ 「港話通」:助力智慧城市建設與社會進步 文:劉建誠. 堅料網. 2019-05-28 [2025-05-15] (中文(香港)). 
  28. ^ 香港特別行政區廉政公署 - 新聞公佈 - 廉署展覽廳全新亮相 沉浸體驗肅貪經典 智能展現倡廉新知. www.icac.org.hk. [2025-05-15]. (原始內容存檔於2025-07-23) (中文(香港)). 
  29. ^ 廉署展覽廳今開放 DeepSeek互動講故事 反貪AI「深博士」登場 葛柏數簿任睇. 大公文匯網. [2025-05-15] (zh-Hans-HK). 
  30. ^ 任葆穎. 廉署胡英明專訪|基於DeepSeek設AI系統 可供市民問有否貪污問題. 香港01. 2025-03-28 [2025-05-15]. (原始內容存檔於2025-03-29) (中文(香港)). 
  31. ^ Lawton. 中國引入 DeepSeek 開發新戰機 AI 協助決策系統革新. 香港 unwire.hk 玩生活.樂科技. 2025-05-06 [2025-05-15]. (原始內容存檔於2025-06-13) (中文(香港)). 
  32. ^ Lawton. BMW 在中國車款接入 DeepSeek 推動車輛智能化升級. 香港 unwire.hk 玩生活.樂科技. 2025-04-24 [2025-05-15]. (原始內容存檔於2025-05-15) (中文(香港)). 
  33. ^ Oscar. DeepSeek 席捲中國汽車市場 東風、比亞迪、上汽紛紛加入 AI. 香港 unwire.hk 玩生活.樂科技. 2025-03-24 [2025-05-15]. (原始內容存檔於2025-04-22) (中文(香港)). 
  34. ^ Lawton. Honda 中國車款接入 DeepSeek 並與 Momenta、寧德時代等中國廠商合作. 香港 unwire.hk 玩生活.樂科技. 2025-04-24 [2025-05-15]. (原始內容存檔於2025-07-22) (中文(香港)). 
  35. ^ arthur. 日產 N7 搭載 DeepSeek AI 技術 反攻中國市場. 香港 unwire.hk 玩生活.樂科技. 2025-02-13 [2025-05-15]. (原始內容存檔於2025-03-20) (中文(香港)). 
  36. ^ Oscar. DeepSeek 應用緬甸地震救災 7 小時開發中英緬互譯系統. 香港 unwire.hk 玩生活.樂科技. 2025-04-02 [2025-05-15]. (原始內容存檔於2025-04-23) (中文(香港)). 
  37. ^ DeepSeek、衛星+AI、半機械昆蟲 人工智能助力緬甸地震救災. 香港文匯網. [2025-05-15]. (原始內容存檔於2025-07-25) (zh-Hans-HK). 
  38. ^ 緬甸地震︱DeepSeek協助救災 7小時開發中緬英互譯系統. 星島頭條. 2025-04-02 [2025-05-15]. (原始內容存檔於2025-04-04) (中文(香港)). 
  39. ^ 李瀟瀟, 胡含嫣. DeepSeek超越ChatGPT,登顶苹果美国区免费APP下载排行榜. 澎湃新聞. 2025-01-27 [2025-01-29]. (原始內容存檔於2025-01-27). 
  40. ^ 日本放送協會. ナスダック大幅下落 中国企業ディープシーク 生成AI開発受け. NHKニュース. 2025-01-28 [2025-01-28]. (原始內容存檔於2025-01-30) (日語). 
  41. ^ 何浩. 英伟达市值蒸发近6000亿美元,规模创美股史上最大,市值跌至全球第三. 華爾街見聞. 2025-01-28 [2025-01-28]. (原始內容存檔於2025-01-28) (中文(中國大陸)). 
  42. ^ Meta Scrambles After Chinese AI Equals Its Own, Upending Silicon Valley. The Information. 2024-01-27 [2025-01-29]. (原始內容存檔於2025-01-30) (英語). 
  43. ^ DeepSeek震撼硅谷 Meta组建四个研究小组专门破解. 財聯社. 2025-01-27 [2025-01-29]. 
  44. ^ OpenAI称有证据表明DeepSeek利用其模型训练竞争对手. RFI - 法國國際廣播電台. 2025-01-29 [2025-01-29] (中文(簡體)). 
  45. ^ Gibney, Elizabeth. Secrets of DeepSeek AI model revealed in landmark paper. Nature. 2025-09-17 [2025-09-18]. ISSN 1476-4687. doi:10.1038/d41586-025-03015-6 (英語). 

外部連結

[編輯]

官方網頁

[編輯]

媒體專題

[編輯]