Databricks 連接器為 Claude 提供了通過 Unity Catalog 訪問您組織內部數據的能力,支持分析您的數據庫、運行自定義業務邏輯以及訪問非結構化文檔。Databricks 提供三個獨立的連接器:一個用於函數、一個用於向量搜索,一個用於 Genie,每個都訪問您 Databricks 工作區內的不同功能。
Databricks 組件提醒
在探索 Claude 可以使用 Databricks 做什麼之前,重要的是要了解您 Databricks 工作區內存在的三個核心組件:
Unity Catalog 函數:您的組織為特定計算、數據轉換或 API 集成而創建的自定義 Python 或 SQL 函數。這些可能包括專有評分算法、標準化財務計算或特定於業務的數據處理邏輯。
向量搜索:在您組織的文檔和數據集上構建的語義搜索索引。這些允許搜索概念上相似的內容,即使精確關鍵字不匹配。
Genie:一個自然語言界面,將純英文問題轉換為針對您數據的 SQL 查詢。Genie 使用有關您的表和列的元數據來理解業務術語並生成適當的查詢。
此連接器提供的功能
集成功能
通過 Databricks 集成,Claude 可以訪問您工作區中的資源:
執行自定義函數:Claude 可以運行由您的組織定義的 Unity Catalog 函數。這包括執行複雜的業務邏輯、應用計算或通過您的團隊創建的函數調用外部 API。例如,如果您的組織構建了自定義客戶健康評分函數,Claude 可以在分析中一致地應用它。
語義搜索:使用向量搜索索引,Claude 可以根據含義而不僅僅是關鍵字查找相關文檔和內容。這對於搜索合同、研究報告、客戶反饋或技術文檔特別有用,其中相似的概念可能以不同的方式表達。
自然語言查詢:通過 Genie,Claude 可以將純英文問題轉換為 SQL 查詢。您無需編寫複雜的 SQL,可以提出"我們上個季度的收入增長是多少?"之類的問題,Claude 將使用 Genie 生成並執行適當的查詢。
受管訪問:通過連接器的所有數據訪問都遵守您組織的 Unity Catalog 權限和策略。Claude 只能訪問您的用戶帳戶有權使用的數據和執行函數。
Claude 如何使用 Databricks 數據
Claude 以多種方式應用 Databricks 功能來支持全面的數據分析:
多源分析:Claude 結合來自數據庫查詢、向量搜索和自定義函數的結果,以提供全面的見解。例如,在驗證投資論點時,Claude 可能會從您的投資組合數據庫查詢歷史財務績效、搜索過去的盡職調查報告以了解類似的行業投資,並應用您的專有 IRR 計算函數來模擬預期回報。
迭代探索:Claude 可以查詢數據、分析初始結果並根據發現完善搜索。這允許進行分析,其中一個查詢的見解為下一個查詢提供信息。
自定義邏輯應用:通過執行 Unity Catalog 函數,Claude 應用您組織的特定規則和計算。這確保專有指標、調整後的計算和公司特定的邏輯在所有分析中統一應用。
上下文查詢構建:當您用純英文提出問題時,Claude 使用 Genie 將其轉換為適當的 SQL 查詢。此轉換考慮您的表結構、列名稱和關係,以生成與您的數據庫結構匹配的準確查詢。
模式識別:通過向量搜索,Claude 可以在文檔和數據中查找模式和相似性。這有助於查找相關問題、類似交易或可能不通過傳統關鍵字搜索明顯的可比情況。
設置 Databricks 連接器
Databricks 集成由三個獨立的連接器組成,每個都需要單獨設置:
函數服務器:訪問 Unity Catalog 函數以進行計算、業務邏輯和數據轉換。
向量搜索服務器:支持跨索引文檔和數據集的語義搜索。
Genie 服務器:提供自然語言到 SQL 查詢轉換功能。
Databricks 連接器的技術詳情可在 Databricks 的 MCP 服務器文檔中找到。Databricks 連接器的身份驗證通過 OAuth(用於 Claude.ai 和 Claude Desktop)或通過 Databricks 個人訪問令牌(僅適用於 Claude Desktop)進行處理。
作為組織所有者添加連接器
導航到 管理設置 > 連接器。
向下滾動並點擊列表底部的"添加自定義連接器"。
輸入 您的 Databricks 工作區的集成 URL
命名集成。請記住有三個獨立的 Databricks 服務器,因此請考慮為每個服務器唯一命名(例如"Databricks UC"、"Databricks Genie"、"Databricks Search")
點擊"添加"
