Коннектор Databricks предоставляет Claude доступ к внутренним данным вашей организации через Unity Catalog, позволяя анализировать ваши базы данных, запускать пользовательскую бизнес-логику и получать доступ к неструктурированным документам. Databricks предоставляет три отдельных коннектора: один для функций, один для векторного поиска и один для Genie, каждый из которых обеспечивает доступ к различным возможностям в вашем рабочем пространстве Databricks.
Напоминание о компонентах Databricks
Прежде чем изучать, что Claude может делать с Databricks, важно понять три основных компонента, которые существуют в вашем рабочем пространстве Databricks:
Unity Catalog Functions: Пользовательские функции Python или SQL, созданные вашей организацией для конкретных расчётов, преобразований данных или интеграций API. Они могут включать собственные алгоритмы оценки, нормализованные финансовые расчёты или специфичную для бизнеса логику обработки данных.
Vector Search: Индексы семантического поиска, построенные на документах и наборах данных вашей организации. Они позволяют искать концептуально похожий контент даже когда точные ключевые слова не совпадают.
Genie: Интерфейс на естественном языке, который переводит простые вопросы на английском языке в SQL-запросы к вашим данным. Genie использует метаданные о ваших таблицах и столбцах для понимания бизнес-терминологии и создания соответствующих запросов.
Что предоставляет этот коннектор
Возможности интеграции
Через интеграцию Databricks Claude может получать доступ к ресурсам в вашем рабочем пространстве:
Выполнение пользовательских функций: Claude может запускать функции Unity Catalog, определённые вашей организацией. Это включает выполнение сложной бизнес-логики, применение расчётов или вызов внешних API через функции, созданные вашей командой. Например, если ваша организация создала пользовательскую функцию оценки здоровья клиента, Claude может применять её последовательно во всех анализах.
Семантический поиск: Используя индексы векторного поиска, Claude может находить релевантные документы и контент на основе смысла, а не только ключевых слов. Это особенно полезно при поиске в контрактах, исследовательских отчётах, отзывах клиентов или технической документации, где похожие концепции могут быть выражены по-разному.
Запросы на естественном языке: Через Genie Claude может переводить простые вопросы на английском языке в SQL-запросы. Вместо написания сложного SQL вы можете задать вопрос типа «Какой был наш рост доходов в прошлом квартале?» и Claude будет использовать Genie для создания и выполнения соответствующего запроса.
Управляемый доступ: Весь доступ к данным через коннектор соответствует разрешениям и политикам Unity Catalog вашей организации. Claude может получать доступ только к данным и выполнять функции, которые разрешены вашей учётной записи пользователя.
Как Claude использует данные Databricks
Claude применяет возможности Databricks несколькими способами для поддержки комплексного анализа данных:
Анализ из нескольких источников: Claude объединяет результаты запросов к базам данных, векторного поиска и пользовательских функций для предоставления комплексных insights. Например, при проверке инвестиционного тезиса Claude может запросить историческую финансовую производительность из вашей базы данных портфеля, найти в прошлых отчётах о комплексной проверке информацию о похожих инвестициях в секторе и применить вашу собственную функцию расчёта IRR для моделирования ожидаемых доходов.
Итеративное исследование: Claude может запрашивать данные, анализировать начальные результаты и уточнять поиск на основе полученных результатов. Это позволяет проводить анализ, где insights из одного запроса информируют следующий.
Применение пользовательской логики: Выполняя функции Unity Catalog, Claude применяет специфичные для вашей организации правила и расчёты. Это гарантирует, что собственные метрики, скорректированные расчёты и специфичная для компании логика применяются единообразно во всех анализах.
Контекстное построение запросов: Когда вы задаёте вопросы на простом английском языке, Claude использует Genie для перевода их в соответствующие SQL-запросы. Этот перевод учитывает структуры ваших таблиц, имена столбцов и связи для создания точных запросов, которые соответствуют структуре вашей базы данных.
Распознавание закономерностей: Через векторный поиск Claude может находить закономерности и сходства в документах и данных. Это помогает находить связанные проблемы, похожие транзакции или сравнимые ситуации, которые могут быть неочевидны при традиционном поиске по ключевым словам.
Настройка коннектора Databricks
Интеграция Databricks состоит из трёх отдельных коннекторов, каждый из которых требует отдельной настройки:
Functions Server: Обеспечивает доступ к функциям Unity Catalog для расчётов, бизнес-логики и преобразований данных.
Vector Search Server: Включает семантический поиск по индексированным документам и наборам данных.
Genie Server: Предоставляет возможности перевода естественного языка в SQL-запросы.
Технические детали коннекторов Databricks можно найти в документации MCP Server Databricks. Аутентификация с коннекторами Databricks осуществляется через OAuth (для Claude.ai и Claude Desktop) или через личный токен доступа Databricks (только для Claude Desktop).
Добавление коннектора владельцем организации
Перейдите в
