不只是新名詞：深入探討 DeepSearch 與 DeepResearch 的真正定義

前言

讀前知識，此文參考於JINA團隊撰寫的實作 DeepSearch/DeepResearch 的實用指南。

2025 年才剛拉開序幕，科技圈，尤其是 AI 搜尋領域，就被「DeepSearch」和「DeepResearch」這兩個詞彙刷屏了。從 Google、OpenAI 到我們 Jina AI，再到 Perplexity 和 X AI，各大廠牌似乎都在同一時間點推出了掛著類似名號的產品或功能。這股熱潮甚至迅速蔓延，連百度和騰訊微信搜索也整合了 Deepseek-r1 這個被視為推動此趨勢的關鍵技術。

熱鬧歸熱鬧，但一個根本問題隨之浮現：這些「深度」概念，到底「深」在哪裡？DeepSearch 和 DeepResearch 僅僅是 RAG (檢索增強生成) 或 Multi-hop QA (多跳問答) 的新包裝，還是代表了更本質的轉變？我們該如何精確地定義它們？

這篇文章的目的，正是要撥開術語的迷霧，深入探討這兩個概念的內涵，並嘗試給出更清晰的定義，釐清它們之間的界線。

定義 DeepSearch：迭代式探究的核心引擎

首先，讓我們聚焦 DeepSearch。如果我們要為它下一個定義，最核心的特徵無疑是其「迭代式的探究循環」。

傳統搜尋或基礎的 RAG 通常是一次性的「檢索-生成」過程：找到相關資料，然後生成答案。但 DeepSearch 的本質不同，它是一個持續的「搜尋-閱讀-推理」閉環。這意味著：

搜尋 (Search): 不只搜尋一次，而是根據需要反覆進行，可能探索不同的關鍵字或策略。
閱讀 (Read): 不只看摘要，而是深入分析選定網頁的完整內容，提取深層資訊。
推理 (Reason): 這一步是關鍵。系統會評估當前已有的資訊，判斷是否足夠回答問題？是否需要進一步搜尋？是否需要將問題拆解成更小的「知識缺口問題」(Gap Questions) 來逐一擊破？

因此，我們可以將 DeepSearch 定義為：一個以 LLM 為核心的代理 (Agent)，利用搜尋和閱讀工具，在一個狀態機中進行迭代式的循環探究，其目標是在給定的資源限制（如 token 預算、嘗試次數）內，找到最準確、最完整的答案。

這個定義強調了幾個關鍵點：

迭代性 (Iterative): 這不是單通道處理，而是不斷循環、自我修正的過程。
代理性 (Agentic): LLM 不只是生成器，更是決策者，主導著整個探究流程。
目標導向 (Goal-Oriented): 其核心目標是答案的品質（準確性、完整性），而非速度。這也解釋了為何用戶願意接受更長的等待時間，因為系統展現的 <思考> 過程暗示著對品質的追求。
過程記憶 (Process Memory): 它需要長上下文能力，主要不是為了輸出長文本，而是為了記住「過程」——之前的搜尋嘗試、閱讀過的內容、失敗的經驗，以便做出更明智的下一步決策。

從這個定義來看，DeepSearch 本質上是一種深度資訊獲取方法論，它改變了傳統搜尋「一問一答」的模式，轉變為一種更接近人類研究者解決複雜問題時的思考與探索過程。

定義 DeepResearch：將知識編排成長篇敘事

那麼，DeepResearch 又該如何定義呢？簡單地說，如果 DeepSearch 是尋找答案的引擎，那麼 DeepResearch 就是利用這個引擎來建造結構化知識大廈的藍圖與框架。

DeepResearch 的定義不能脫離它的最終產出目標：生成高品質、結構清晰、內容連貫、可讀性強的長篇研究報告。 它顯然建立在 DeepSearch 的能力之上，但其關注點和複雜性遠超 DeepSearch 本身。

我們可以這樣定義 DeepResearch：一個利用 DeepSearch 作為核心資訊獲取模塊，並額外增加了結構規劃、內容編排、連貫性保證和最終呈現優化層次的框架，旨在自動生成符合研究報告規範的長篇文檔。

這個定義突顯了 DeepResearch 相較於 DeepSearch 的額外維度：

結構化框架 (Structured Framework): 它始於報告結構的規劃（如生成目錄），這本身就超出了單純回答問題的範疇。
內容編排 (Content Orchestration): 它需要將一個大的研究主題拆分成多個子問題，並系統性地為每個子問題（章節）調用 DeepSearch 來獲取內容。
敘事連貫性 (Narrative Coherence): 這是 DeepResearch 的核心挑戰之一。它不僅要確保每個章節內容的準確性（DeepSearch 的範疇），更要確保章節之間的邏輯流暢、術語一致、避免冗餘，並有自然的過渡。這需要全局視角和內容整合能力。
呈現優化 (Presentation Optimization): 高品質報告往往需要圖表、表格等視覺化元素，以及良好的排版。這也是 DeepResearch 需要考慮的額外因素。

正如 Jina AI 未發布的 “Re-search” 專案所揭示的挑戰——報告品質平庸、幻覺嚴重、內容冗餘、可讀性差——這些問題很大程度上暴露了 DeepResearch 的獨特難點，它們更多地關乎知識的組織、合成與表達，而不僅僅是知識的發現。

劃清界線：為何區分定義至關重要？

將 DeepSearch 和 DeepResearch 明確區分開來，不僅僅是學術上的咬文嚼字，它具有重要的現實意義：

問題域不同： DeepSearch 旨在解決「單點問題」的深度和準確性；DeepResearch 旨在解決「知識體系構建與呈現」的複雜性。前者追求答案的最佳化，後者追求報告的整體品質。
技術挑戰不同： 做好 DeepSearch 需要強大的搜尋/閱讀工具、高效的狀態管理和推理循環、精準的答案評估機制。而做好 DeepResearch，除了上述所有，還需要額外的能力來處理宏觀結構、保證全局連貫性、甚至整合視覺化工具。
應用場景不同： DeepSearch 可以內嵌在聊天機器人、問答系統中，提供更精準的即時回答。DeepResearch 則更適用於需要自動生成市場分析、競品研究、文獻綜述等長篇報告的場景。

之所以兩者容易被混淆，是因為 DeepResearch 必然包含並依賴 DeepSearch。但我們必須認識到，DeepResearch 的核心價值和難點在於 DeepSearch 之外的那些層次。用一個比喻：DeepSearch 好比是能精準找到並切割完美鑽石的工匠；而 DeepResearch 則是設計和製作整頂鑲滿鑽石的皇冠的設計師與工藝大師——他需要工匠的技藝，但更需要宏觀的設計、審美和整合能力。

結語：清晰定義引領未來方向

DeepSearch 和 DeepResearch 代表了 AI 與海量資訊互動方式的重大進步。前者透過迭代循環深化了我們獲取準確答案的能力，後者則試圖在此基礎上自動化複雜知識的合成與呈現。

釐清它們的定義，有助於我們更準確地理解各自的潛力與局限，更有針對性地開發相關工具和技術，並為它們找到最合適的應用場景。在 AI 技術飛速發展的今天，清晰的定義不僅能避免概念混淆，更能為未來的創新指明方向。這場關於「深度」的探索，才剛剛開始。

常見問題解答 (FAQ) 整合：

Q: 到底什麼是 DeepSearch？
- A: DeepSearch 是一種 AI 搜尋方法，它不像傳統搜尋或簡單 RAG 那樣只搜尋一次，而是透過一個「搜尋 (Search) -> 閱讀 (Read) -> 推理 (Reason)」的循環過程，不斷地尋找、分析網頁內容並思考，直到找到問題的最佳答案或達到預設的資源限制（如 token 預算）。你可以把它想像成一個非常執著的偵探，會不斷尋找線索、研究證據、思考案情，直到破案為止。
Q: DeepResearch 和 DeepSearch 有什麼不同？
- A: DeepSearch 是核心的搜尋「引擎」，專注於透過迭代找到最準確、最完整的答案。而 DeepResearch 是建立在 DeepSearch 之上的「應用框架」，它的目標是利用 DeepSearch 的能力來生成結構完整、內容連貫、可讀性高的長篇研究報告。你可以把 DeepSearch 看作是蓋房子的「工人」，而 DeepResearch 則是整個「建築專案」，需要工人（DeepSearch）來建造每個房間（報告章節），還需要設計師來規劃藍圖（目錄）和確保整體風格一致（連貫性）。
Q: DeepSearch 如何處理「知識缺口問題」(Gap Questions)？
- A: 當 DeepSearch 的推理模塊意識到要回答原始問題還缺少某些背景知識時，它會生成一些「知識缺口問題」（子問題）。在 node-deepresearch 的實作中，這些新產生的缺口問題會被優先放入一個待處理的佇列中（類似 FIFO 先進先出，但有特殊輪換機制）。系統會先處理這些缺口問題，獲取必要的知識，然後再回過頭來處理原始問題或其他缺口問題。這樣可以確保在回答最終問題時，已經具備了更全面的背景知識。
Q: 什麼是「預算強制」(Budget-Forcing)？
- A: 預算強制是一種策略，用來確保 AI 系統（特別是像 DeepSearch 這樣需要多步驟推理的系統）不會過早地「放棄」或給出不成熟的答案，而是盡可能地利用分配給它的資源（如計算時間或 token 數量）來進行更深入的思考和探索。在 node-deepresearch 中，這透過幾種方式實現：1) 在回答前強制進行反思並識別知識缺口；2) 在回答失敗後暫時禁止回答動作，強迫進行搜尋或反思；3) 設定失敗嘗試次數上限，並在接近預算極限時啟動「野獸模式」，強制系統根據當前所有資訊給出一個最終答案，而不是直接失敗。目標是用更長的思考換取更高品質的結果。