DeepSeek 核心技術衝擊與爭議,團隊背景與創辦人梁文峰故事

DeepSeek,一家中國的人工智慧(AI)初創公司,在 2025 年初 發布的大型語言模型(LLM)DeepSeek R1 震撼了全球市場。該模型以其低成本 557.6 萬美元,對 AI 大模型的發展範式、GPU 算力市場及 AI 初創企業生態帶來潛在的顛覆性影響。

DeepSeek 的創新點在於其 混合專家結構(MoE)多頭潛在注意力機制(MLA),使其能夠在降低訓練和推理成本的同時,保持與 OpenAI GPT-4 相當的推理能力。此外,DeepSeek 採取開源策略,將模型權重公開,降低了 AI 技術應用的門檻,為更多企業和開發者提供了進入市場的機會。

然而,DeepSeek 的成功也伴隨著爭議,如 模型蒸餾訓練成本透明度數據安全漏洞 等問題,引發了業界的廣泛討論。這些挑戰不僅影響了其市場形象,也引發了對 AI 技術發展方向的深層次思考。

幻方量化:量化交易的基石

幻方量化是一家以人工智慧(AI)技術為核心驅動的量化投資基金。在量化交易這個領域中,AI 模型的應用越來越重要,這也促使幻方量化不斷加大在 AI 演算法和軟硬體方面的投入。有業內人士評論說,幻方更像是一家做機器學習、AI 的公司,只是副業用量化交易賺了錢。

「杭州深度求索人工智慧基礎技術研究有限公司」(簡稱深度求索)是幻方量化旗下的子公司。深度求索並不是一家全新的公司,而是在 2023 年 5 月,從幻方量化獨立出來的一個團隊,專注於 AI 大模型的研發。這個舉措賦予了 DeepSeek 更大的自主性和靈活性,使其能夠專注於 AI 模型的研發和創新,而無需受到量化交易業務的直接干預。DeepSeek 的公司名稱也表明其核心業務是人工智慧基礎技術研究。這包括模型架構的創新,演算法的優化,以及算力的提升。

DeepSeek 的定位不只是個參與者,也是開源生態的貢獻者。DeepSeek 積極參與開源社群,將其研究成果以開源的形式分享給業界,促進 AI 技術的普及和發展。DeepSeek 也在積極探索 AI 技術的商業應用,例如將其技術應用於金融、醫療、教育等領域。

幻方量化和深度求索之間的關係,是一種相輔相成的生態關係。幻方量化作為母公司,為深度求索提供資金、算力和技術支持,使其能夠專注於 AI 基礎研究。深度求索在 AI 技術上的突破,可以提升幻方量化在量化交易領域的競爭力,為其帶來更高的投資回報。

梁文峰是幻方量化和 DeepSeek 這兩家公司的創辦人。他於 1985 年出生,從小就展現出數學天賦。

梁文峰在 2002 年考入浙江大學電子信息工程專業,2007 年繼續攻讀研究生,專注於機器視覺的研究。2008 年全球金融危機爆發,當時還在讀碩士的梁文峰看到了量化交易的機會,開始嘗試用系統化、程序化的方式來研究市場、進行交易。

梁文峰畢業後並沒有像周圍人一樣去互聯網公司做工程師,而是躲在成都的廉價出租屋裡,不停地編寫 AI 演算法來選股,並在不同的市場場景中去嘗試。2015 年,梁文峰成立了幻方量化這個品牌。在 2015 年 A 股市場的巨大波動中,幻方反而取得了超額回報。

幻方量化有別於其他量化基金最大的不同,就是梁文峰對 AI 的執念2。2018 年,梁文峰明確了公司以 AI 為核心的發展方向,並且把整個產品線和資金管理都嫁接到以 AI 為核心策略的開發體系上了。當他在 2021 年就開始囤積數千張輝達 GPU 的時候,行業中沒人知道他想幹什麼。一位他的商業合作夥伴用「一個髮型糟糕的書呆子」來描述第一次見到梁文峰的感受。梁文峰更願意被當作工程師,而不是交易員。他幾乎每天都親自參與寫程式碼、跑程式碼。

DeepSeek 的低成本和高性能模型,打破了 OpenAI 等閉源模型在市場上的壟斷溢價。根據 Sensor Tower 的數據,DeepSeek 在美國免費應用榜單上名列前茅,並在全球範圍內持續火爆。這表明 DeepSeek 在 降低 AI 應用門檻推動 AI 技術普及 方面具有重要作用。

1. 核心技術創新

(1) 🔗 混合專家結構(MoE) MoE 就像餐廳裡的多位頂級廚師,根據需求分配任務,提高計算效率,降低計算資源浪費。DeepSeek V3 擁有 6700 億參數,但僅需激活 370 億參數,這意味著大幅降低了計算成本,同時保證了推理能力。

(2) 🎯 多頭潛在注意力機制(MLA) DeepSeek 通過 🔄 多 token 預測(MTP) 提高了模型的記憶能力,使其能夠一次預測多個 token,提升語言模型的運行效率。

(3) 🏆 群體相對策略優化(GRPO) DeepSeek R1 的訓練採用 GRPO 強化學習算法,讓模型基於已有知識進行優化,而非單純依賴標註數據,從而極大提升了訓練效率,降低了成本。

2. DeepSeek 模型版本

📌 DeepSeek V3:擁有 6700 億參數的大語言基礎模型。
📌 DeepSeek-R1-Zero:利用無監督數據與強化學習方式微調,提高數學與程式碼領域的推理能力。
📌 DeepSeek-R1:在 R1-Zero 基礎上增加監督數據,提升模型整體能力。

市場對 DeepSeek 存在一些爭議,例如:

模型蒸餾:DeepSeek 被指控使用 OpenAI 的數據來訓練模型,但要證明這一點需要確鑿的證據
成本:DeepSeek 聲稱 V3 模型訓練只用了 557.6 萬美元,但有分析認為,DeepSeek 的預訓練數字遠不及模型實際花費的金額◦
繞過 CUDA:DeepSeek 並未完全繞過 CUDA 生態系統,而是在 CUDA 的基礎上進行了優化

對閉源模型的衝擊
DeepSeek 表明 AI 領域並不存在真正的護城河,這對 OpenAI 和 Anthropic 來說無疑是當頭一棒。DeepSeek 對閉源模型直接的衝擊就是價格,因為如果有更便宜但性能差不多的大模型,開發者和公司們會毫不猶豫地選擇。

對開源模型和社群的影響
DeepSeek 給行業領頭羊們帶來了非常大的壓力,例如 Meta 為了應對 DeepSeek R1 的發布,成立了四個「War Rooms」作戰室,以確保即將發布的 Llama4 不落後於 DeepSeek。

對 AI 算力的衝擊
DeepSeek 帶來了模型訓練和推理的新範式,降低了算力成本,刺激了整個生態對模型的使用和應用…。

  1. DeepSeek 是否會改變全球 AI 競爭格局?
    • DeepSeek 讓開源 AI 變得可行,使企業能以更低成本部署 AI,這可能促使市場走向更多元的技術競爭模式。
  2. 開源 AI 是否真的能保持可持續發展?
    • 雖然開源降低了成本,但也可能導致低質量 AI 產品充斥市場,影響技術生態的健康發展。
  3. 數據隱私與安全問題如何影響 DeepSeek 的全球化?
    • DeepSeek 曾出現數據安全漏洞,這可能限制其進入對數據合規要求嚴格的市場(如歐盟與美國)。

AI 技術確實可能被用於非法活動,例如詐騙、毒品交易、賭博或軍事應用,但是否會導致社會大亂,取決於各國政府、科技企業與公眾的監管與應對措施。

可能的影響:
網路詐騙激增:由於 AI 能夠生成擬真文本、語音甚至影像,它可能被不法分子用於詐騙、假新聞、深偽技術等,進一步加劇社會混亂。
假新聞與輿論操控:透過 AI 自動生成大量假新聞,可能影響選舉、金融市場,甚至引發社會不安。
軍事應用爭議:AI 的推理與決策能力可能被用於戰爭決策、無人機控制、自動化攻擊等,這引發了對未來科技戰爭的擔憂。
助長非法團體犯罪模擬與教學:一旦開源,AI 技術可能被非法團體或地下組織修改與利用,或者全球各地個人到小團體,從AI裡學習犯罪方式,導致更多大量民眾受害,政府難以追蹤與有效監管。

🔗 混合專家結構(MoE):就像一個餐廳裡有許多專業廚師,當顧客點餐時,系統會選擇最擅長該菜餚的廚師來製作,確保最高效率與品質。

🎯 多頭潛在注意力機制(MLA):類似於一個人同時關注多個話題,讓 AI 能夠一次思考多個可能的答案,而不是逐步猜測。

🏆 群體相對策略優化(GRPO):像是一場多人合作遊戲,每個玩家學習最佳策略來提升整體表現,而不是僅靠個別指令行動。

🛠 開源模型:如同共享程式碼的工具箱,讓更多開發者能共同改進與應用技術,而非封閉的專屬產品。

💻 AI 計算資源市場:類似於電力市場,隨著 AI 模型變得更高效,所需的算力減少,整體使用成本下降。

🚀 大模型普及化:如同智慧型手機的普及,讓 AI 變得不再是少數企業的專利,而是更多企業與開發者能夠負擔並使用的技術。

Latest

AI工具Search GPT vs. Google │功能有何不同?如何在職場上運用?

隨著人工智慧的快速發展,越來越多的工具應運而生,其中「Search GPT」這個即將推出的搜尋工具,即將與傳統搜尋引擎(如Google)正式PK。 Google已為大眾所熟知,但Search GPT則可能對許多人來說較為陌生。兩者在搜尋資訊的功能上有相似之處,但實際上它們的運作原理和應用場景大相徑庭。今天我們將簡要快速介紹Search GPT,並探討未來如何在職場中有效運用這兩種工具。 一、什麼是 Search GPT? Search GPT 是基於大型語言模型(如OpenAI的GPT系列)的人工智慧工具。GPT意指「生成式預訓練變換模型」,這些模型能從大量的文字資料中學習,並根據使用者輸入的問題或提示,生成自然的對話和回答。這讓Search GPT有別於傳統搜尋引擎,因為它不是單純地搜尋和索引網頁,而是提供基於語言理解的智慧回答。目前根據openAI的官方網站(7/25),尚未有實際推出的預計日程,只有開放測試白名單,網址:https://openai.com/index/searchgpt-prototype/ 「人工智慧搜尋將成為人們瀏覽網路的關鍵方式之一,在早期,至關重要的是,該技術的建構方式必須重視、尊重和保護新聞業和出版商。我們期待在此過程中與 OpenAI 合作,為讀者創造一種發現大西洋月刊的新方式。尼可拉斯湯普森,《大西洋月刊》執行長 SearchGPT 主要想特別在搜尋中,突出地引用和連結到出版商來幫助用戶與出版商建立聯繫。回應具有清晰、內聯、命名的屬性和鏈接,因此用戶知道資訊來自哪裡,並可以在帶有來源鏈接的側邊欄中快速獲取更多結果。 Sam 和 OpenAI 真正才華橫溢的團隊天生就明白,人工智慧驅動的搜尋要想有效,就必須建立在可信賴來源提供的最高品質、最可靠的資訊之上。為了讓天空保持平衡,技術和內容之間的關係必須是共生的,並且來源必須受到保護。 羅伯特湯姆森,新聞集團首席執行官 二、Search GPT 與 Google 的運作方式差異 🔶資料來源與即時性 Search GPT:想像你是一名行銷人員,正在撰寫有關數位行銷的專業文章。如果你想了解「如何提升SEO排名」,使用Search GPT,AI會提供一個有條理的解答,綜合了網路上的最佳實踐,告訴你從關鍵字研究、內容創作到技術優化的具體步驟。這對於需要快速理解概念和策略的人來說非常有幫助。然而,Search GPT的資料可能不是最新的,因為它的資料庫通常不即時更新。 Google:同樣地,當你使用Google搜尋「如何提升SEO排名」時,畢竟SEO就是針對google 搜尋優化,Google能立即提供官方解答,給你最正確的答案,但可能在實際舉例上就沒辦法直覺告訴你,你需要繼續看其他SEO專家的廣告或範例,或是透過線上學習,才能找到答案。 🔶搜尋結果形式 Search GPT:假設你是業務分析師,正在準備一個有關「市場分析工具」的報告。你可以直接向Search...

OpenAI 領投,Nvidia 助攻!機器人室友NEO Gamma 將走入千家萬戶,徹底改變你的生活!

2025/2/22 NEO Gamma 機器人公開發佈 你是否曾幻想過擁有一個貼心的機器人室友,幫你煮咖啡、打掃房間,甚至在你忙碌時陪你聊聊天?隨著人工智慧(AI)和機器人技術的飛速進步,這樣的場景正逐漸從科幻走向現實。今年,來自 1X Technologies 公司的新一代人形機器人 NEO Gamma 機器人亮相,引發了業界與消費者的熱議。這款被稱作「居家助手」的機器人有什麼獨到之處?機器人產業的最新趨勢如何?消費者又對此抱持怎樣的期待和疑慮呢?讓我們以輕鬆對話的方式,一起深入探討 NEO Gamma 的技術創新與市場發展走向。 https://twitter.com/1x_tech/status/1893012909082714299 科技趨勢:AI 加持下的人形機器人浪潮 說到近期機器人產業的發展,大勢所趨就是 人工智慧與人形機器人的結合。過去幾年,機器人從工廠車間走入更廣泛的場景:我們已經習慣了掃地機器人、送餐機器人等專用機器人,如今業界開始瞄準更具通用性的雙足人形機器人。特別是 2023-2024 年,被視為人形機器人的「突破元年」——多家科技巨頭和新創公司投入研發,使得技術與資金在此匯聚​ Omdia 的最新報告指出,受益於關鍵零部件(伺服馬達、減速器、感測器等)的進步和生成式 AI 熱潮帶動,人形機器人正迎來大幅成長,2024-2030 年的年複合增長率預計高達 83%​,簡單說,市場對這類機器人的興趣和需求正在爆發。 在這股浪潮中,各種 AI 技術...

TOP100生成式AI應用平台與APP全球排行榜-深度解讀AI 工具的狂飆與日常落地

榜單全貌:AI Web 工具 vs 手機 App 各霸 50 席 美國創投公司 a16z 最新發布的《Top 100 Gen AI Consumer Apps》榜單,引發業界熱議。這份「生成式 AI 百大應用」榜單將前 100 名一分為二:50 個 AI Web 工具(以每月網站獨立訪問數排序)以及50...

AI開發神器實作營超過百名工程師參與,GitHub Copilot 60秒寫出遊戲程式碼│微軟AI技術年會-DevDaysAsia2024

利用 AI github copilot 的協作,使用中文promt指令就能在60秒內輕易完成一個猜拳遊戲,進階更複雜的也是5分鐘內就火速完成

聖誕節新年AI賀卡引分享風潮,免費註冊,不用輸入提示詞,CoredreamHub一鍵生成賀卡,上傳照片還可以變專屬團隊祝福

當節日來臨,你想到的是有一張標上自己名字的賀卡可以去傳LINE群組或上傳instagram、Facebook,但不太會輸入提示詞怎麼辦,為了更減少忙碌的菁英們的煩惱,可以在coredream hub 平台一鍵生成專屬賀卡! 限時免費,一個人可以生成4張,例如:https://hub.coredream.ai/tools/feltcard 這次分享的是羊毛氈風格,先來看看各家生成的作品集: Coredream hub 賀卡生成教學 最快速的模式:只要填入自己的名字,並選擇AI幫你生成的提示詞,按下生成,一分鐘內馬上生成專屬賀卡 客製化加上照片模式:除了上述的名字與AI預設場景,你也可以加入自己的想法,直接在輸入框中填好即可,若想生成指定照片與人物,則可以準備你的LOGO與人物照片,單人或合照皆可。 最後一樣按下生成就可以囉!超快速方便, 除了賀卡還有更多AI工具可以使用,https://hub.coredream.ai Coredream Hub團隊介紹 Coredream Hub平台,由胡雅玲與柯智薰共同創辦,起源於團隊在進行 AI 教學與實務培訓時,長期觀察到學生與使用者在實作過程中,必須頻繁切換不同網站、工具與介面,反而增加學習與操作負擔,讓 AI 變得不直覺、也不親民。 為了解決這個問題,團隊開始思考:能不能把 AI 先準備好,讓使用者只要照著做,就能完成事情? 隨著 vibe coding 與 AI 應用快速發展,Coredream Hub 逐步擴展為一個專注於「解決重複性任務」的 AI 應用平台,將原本需要專業設定、提示詞撰寫與工具整合的流程,轉化為一般人也能直覺操作的一鍵式任務工具,讓 AI 能更深入應用在教育現場與實際產業工作中。 團隊的核心目標很單純——讓更多人不用花時間學怎麼寫提示詞、不必理解技術細節,也能真正把...