跳转到主要内容

使用 Databricks 进行数据分析

更新于今天

Databricks 连接器为 Claude 提供了通过 Unity Catalog 访问您组织内部数据的能力,支持分析您的数据库、运行自定义业务逻辑以及访问非结构化文档。Databricks 提供三个独立的连接器:一个用于函数,一个用于向量搜索,一个用于 Genie,每个都访问您 Databricks 工作区内的不同功能。

Databricks 组件提醒

在探索 Claude 可以使用 Databricks 做什么之前,重要的是要理解您 Databricks 工作区内存在的三个核心组件:

  1. Unity Catalog 函数:您的组织为特定计算、数据转换或 API 集成创建的自定义 Python 或 SQL 函数。这些可能包括专有评分算法、规范化的财务计算或特定于业务的数据处理逻辑。

  2. 向量搜索:在您组织的文档和数据集上构建的语义搜索索引。这些允许搜索概念上相似的内容,即使精确关键字不匹配。

  3. Genie:一个自然语言界面,将纯英文问题转换为针对您数据的 SQL 查询。Genie 使用关于您的表和列的元数据来理解业务术语并生成适当的查询。

此连接器提供的功能

集成功能

通过 Databricks 集成,Claude 可以访问您工作区中的资源:

  • 执行自定义函数:Claude 可以运行由您的组织定义的 Unity Catalog 函数。这包括执行复杂的业务逻辑、应用计算或通过您的团队创建的函数调用外部 API。例如,如果您的组织构建了自定义客户健康评分函数,Claude 可以在分析中一致地应用它。

  • 语义搜索:使用向量搜索索引,Claude 可以根据含义而不仅仅是关键字查找相关文档和内容。这对于搜索合同、研究报告、客户反馈或技术文档特别有用,其中相似的概念可能以不同的方式表达。

  • 自然语言查询:通过 Genie,Claude 可以将纯英文问题转换为 SQL 查询。您无需编写复杂的 SQL,可以提出诸如"我们上个季度的收入增长是多少?"之类的问题,Claude 将使用 Genie 生成并执行适当的查询。

  • 受管访问:通过连接器的所有数据访问都遵守您组织的 Unity Catalog 权限和策略。Claude 只能访问您的用户账户有权限使用的数据和执行函数。

Claude 如何使用 Databricks 数据

Claude 以多种方式应用 Databricks 功能来支持全面的数据分析:

  • 多源分析:Claude 结合来自数据库查询、向量搜索和自定义函数的结果来提供全面的见解。例如,在验证投资论点时,Claude 可能会从您的投资组合数据库查询历史财务表现,搜索过去的尽职调查报告以了解类似的行业投资,并应用您的专有 IRR 计算函数来模拟预期回报。

  • 迭代探索:Claude 可以查询数据、分析初始结果,并根据发现完善搜索。这允许进行分析,其中一个查询的见解为下一个查询提供信息。

  • 自定义逻辑应用:通过执行 Unity Catalog 函数,Claude 应用您组织的特定规则和计算。这确保专有指标、调整后的计算和公司特定的逻辑在所有分析中统一应用。

  • 上下文查询构建:当您用纯英文提出问题时,Claude 使用 Genie 将其转换为适当的 SQL 查询。此转换考虑您的表结构、列名称和关系,以生成与您的数据库结构匹配的准确查询。

  • 模式识别:通过向量搜索,Claude 可以在文档和数据中查找模式和相似性。这有助于查找相关问题、类似交易或可能不通过传统关键字搜索明显的可比情况。

设置 Databricks 连接器

Databricks 集成由三个独立的连接器组成,每个都需要单独设置:

  1. 函数服务器:访问 Unity Catalog 函数以进行计算、业务逻辑和数据转换。

  2. 向量搜索服务器:支持跨索引文档和数据集的语义搜索。

  3. Genie 服务器:提供自然语言到 SQL 查询转换功能。

Databricks 连接器的技术详情可以在 Databricks 的 MCP 服务器文档中找到。与 Databricks 连接器的身份验证通过 OAuth(用于 Claude.ai 和 Claude Desktop)或通过 Databricks 个人访问令牌(仅用于 Claude Desktop)处理。

作为组织所有者添加连接器

  1. 向下滚动并单击列表底部的"添加自定义连接器"。

  2. 输入 您的 Databricks 工作区的集成 URL

  3. 命名集成。请记住有三个独立的 Databricks 服务器,因此请考虑为每个服务器唯一命名(例如,"Databricks UC"、"Databricks Genie"、"Databricks Search")

  4. 单击"添加"

对于个人用户

了解

这是否解答了您的问题?