Коннектор Databricks предоставляет Claude доступ к внутренним данным вашей организации через Unity Catalog, позволяя анализировать ваши базы данных, запускать пользовательскую бизнес-логику и получать доступ к неструктурированным документам. Databricks предоставляет три отдельных коннектора: один для функций, один для векторного поиска и один для Genie, каждый из которых обеспечивает доступ к различным возможностям в вашем рабочем пространстве Databricks.
Напоминание о компонентах Databricks
Прежде чем изучать, что Claude может делать с Databricks, важно понять три основных компонента, которые существуют в вашем рабочем пространстве Databricks:
Функции Unity Catalog: пользовательские функции Python или SQL, созданные вашей организацией для конкретных расчетов, преобразований данных или интеграций API. Они могут включать собственные алгоритмы оценки, нормализованные финансовые расчеты или специфичную для бизнеса логику обработки данных.
Векторный поиск: индексы семантического поиска, построенные на документах и наборах данных вашей организации. Они позволяют искать концептуально похожий контент даже когда точные ключевые слова не совпадают.
Genie: интерфейс на естественном языке, который переводит простые вопросы на английском языке в SQL-запросы к вашим данным. Genie использует метаданные о ваших таблицах и столбцах для понимания бизнес-терминологии и создания соответствующих запросов.
Что предоставляет этот коннектор
Возможности интеграции
Через интеграцию Databricks Claude может получать доступ к ресурсам в вашем рабочем пространстве:
Выполнение пользовательских функций: Claude может запускать функции Unity Catalog, определенные вашей организацией. Это включает выполнение сложной бизнес-логики, применение расчетов или вызов внешних API через функции, созданные вашей командой. Например, если ваша организация создала пользовательскую функцию оценки здоровья клиента, Claude может применять ее последовательно во всех анализах.
Семантический поиск: используя индексы векторного поиска, Claude может находить релевантные документы и контент на основе смысла, а не только ключевых слов. Это особенно полезно при поиске в контрактах, исследовательских отчетах, отзывах клиентов или технической документации, где похожие концепции могут быть выражены по-разному.
Запросы на естественном языке: через Genie Claude может переводить простые вопросы на английском языке в SQL-запросы. Вместо написания сложного SQL вы можете задать вопрос типа "Какой был наш рост доходов в прошлом квартале?" и Claude будет использовать Genie для создания и выполнения соответствующего запроса.
Управляемый доступ: весь доступ к данным через коннектор соответствует разрешениям и политикам Unity Catalog вашей организации. Claude может получать доступ только к данным и выполнять функции, которые разрешены вашей учетной записи пользователя.
Как Claude использует данные Databricks
Claude применяет возможности Databricks несколькими способами для поддержки комплексного анализа данных:
Анализ из нескольких источников: Claude объединяет результаты запросов к базам данных, векторного поиска и пользовательских функций для предоставления комплексных аналитических данных. Например, при проверке инвестиционного тезиса Claude может запросить историческую финансовую производительность из базы данных вашего портфеля, найти в прошлых отчетах о проверке должной осмотрительности аналогичные инвестиции в секторе и применить вашу собственную функцию расчета IRR для моделирования ожидаемых доходов.
Итеративное исследование: Claude может запрашивать данные, анализировать начальные результаты и уточнять поиск на основе полученных результатов. Это позволяет проводить анализ, при котором аналитические данные из одного запроса информируют следующий.
Применение пользовательской логики: выполняя функции Unity Catalog, Claude применяет специфичные для вашей организации правила и расчеты. Это гарантирует, что собственные метрики, скорректированные расчеты и специфичная для компании логика применяются единообразно во всех анализах.
Контекстное построение запросов: когда вы задаете вопросы на простом английском языке, Claude использует Genie для перевода их в соответствующие SQL-запросы. Этот перевод учитывает структуры ваших таблиц, имена столбцов и связи для создания точных запросов, которые соответствуют структуре вашей базы данных.
Распознавание закономерностей: через векторный поиск Claude может находить закономерности и сходства в документах и данных. Это помогает находить связанные проблемы, похожие транзакции или сравнимые ситуации, которые могут быть неочевидны при традиционном поиске по ключевым словам.
Настройка коннектора Databricks
Интеграция Databricks состоит из трех отдельных коннекторов, каждый из которых требует отдельной настройки:
Сервер функций: обеспечивает доступ к функциям Unity Catalog для расчетов, бизнес-логики и преобразований данных.
Сервер векторного поиска: обеспечивает семантический поиск по индексированным документам и наборам данных.
Сервер Genie: предоставляет возможности перевода естественного языка в SQL-запросы.
Технические детали коннекторов Databricks можно найти в документации MCP Server Databricks. Аутентификация с коннекторами Databricks осуществляется через OAuth (для Claude.ai и Claude Desktop) или через личный токен доступа Databricks (только для Claude Desktop).
Добавление коннектора владельцем организации
Перейдите в Параметры администратора > Коннекторы.
Прокрутите вниз и нажмите "Добавить пользовательский коннектор" в конце списка.
Введите URL интеграции для вашего рабочего пространства Databricks
Назовите интеграцию. Помните, что существует три отдельных сервера Databricks, поэтому рассмотрите возможность уникального именования каждого (например, "Databricks UC", "Databricks Genie", "Databricks Search")
Нажмите "Добавить"
Для отдельных пользователей
Узнайте о поиске и подключении инструментов.
Типичные варианты использования
Пример доступных ресурсов
Чтобы проиллюстрировать, как эти возможности работают вместе, рассмотрим фирму прямых инвестиций со следующими настроенными ресурсами Databricks:
Таблицы в этом сценарии
portfolio_companies: детали компании, информация об приобретении, текущие оценки и уровни долга
financial_statements: периодическая финансовая отчетность, включая доход, EBITDA с корректировками и операционные метрики, такие как количество клиентов и отток
market_comparables: сравнимые компании в секторе с мультипликаторами оценки и темпами роста
due_diligence_docs: хранилище отчетов о проверке должной осмотрительности, документов анализа и меморандумов о сделках
Функции Unity Catalog в этом сценарии
calculate_normalized_ebitda(): применяет стандартные корректировки прямых инвестиций к отчетному EBITDA, удаляя разовые затраты и нормализуя компенсацию владельцу
compute_portfolio_irr(): рассчитывает внутреннюю норму доходности и деньги на инвестированный капитал на основе денежных потоков и периодов владения
estimate_debt_capacity(): моделирует максимальную емкость заимствований с проверкой соответствия ковенантам при стресс-тестировании в различных сценариях
Индекс векторного поиска в этом сценарии
due_diligence_index: семантический поиск по всем документам проверки должной осмотрительности, меморандумам о сделках и отчетам анализа
Анализ готовности портфеля к выходу
Пример входного запроса:
Какие компании портфеля готовы к выходу? Покажите диапазоны оценки и
ожидаемые доходы на основе текущих рыночных мультипликаторов.
Для этого анализа Claude может использовать различные функции UC и Genie на следующих этапах:
Genie: определить компании портфеля, находящиеся в собственности более 3 лет, и получить их последнюю финансовую отчетность.
Функция UC: вызвать
calculate_normalized_ebitda()для каждой компании для применения корректировок PE.Функция UC: выполнить
compute_portfolio_irr()для расчета IRR и MOIC для каждой компании.Genie: запросить рыночные сравнимые и применить мультипликаторы сектора к нормализованному EBITDA для диапазонов оценки.
Claude может затем представить свои результаты в сводке, показывающей компании, готовые к выходу, с IRR, MOIC и диапазонами оценки на основе текущих рыночных мультипликаторов.
Оценка новой сделки
Пример входного запроса:
Мы оцениваем приобретение TechCorp (SaaS, доход $45M, EBITDA $12M).
Какова справедливая оценка и сколько долга мы можем поддерживать? Включите
предыдущие записи проверки должной осмотрительности в ваш анализ.
Для выполнения этого запроса Claude может следовать этому рабочему процессу:
Genie: запросить рыночные сравнимые для компаний аналогичного размера в секторе цели для установления эталонов оценки.
Функция UC: вызвать
estimate_debt_capacity()с метриками цели для моделирования сценариев заимствований и стресс-тестирования соответствия ковенантам.Векторный поиск: найти в индексе проверки должной осмотрительности релевантные сценарии создания стоимости и прецедентные транзакции.
Синтез: объединить результаты для создания диапазона оценки, рекомендуемой структуры капитала и релевантных прецедентов.
В идеале Claude должен затем ответить отчетом о диапазоне оценки и рекомендуемой цене предложения, ссылаясь на источники, которые привели к его рекомендации.
Оценка риска нарушения ковенантов
Пример входного запроса:
Если мы увидим снижение EBITDA на 15-25% по всему портфелю, какие компании
рискуют нарушить ковенанты? Какие действия мы должны предпринять?
Для этой задачи Claude может использовать следующие ресурсы:
Genie: определить компании портфеля с долгом, сосредоточившись на тех, у которых заимствование > 4x.
Функция UC: вызвать calculate_normalized_ebitda() для каждой компании с высоким заимствованием для установления базовой линии.
Функция UC: запустить estimate_debt_capacity() со сценариями снижения на 15%, 20% и 25% для каждой компании.
Genie: запросить историческую финансовую отчетность для определения компаний с ухудшающимися тенденциями оборотного капитала.
Claude может затем ответить анализом риска нарушения, организованным по компаниям и сценариям.
Советы по использованию Databricks
Будьте конкретны в отношении того, какие данные вы ищете.
Пример: вместо "Анализировать клиентов" попробуйте "Покажи мне наших топ 20 клиентов по…"
Используйте язык "найти похожее" для сопоставления закономерностей
Пример: "Найди отзывы, которые упоминают проблемы, похожие на эту жалобу."
Помните, что все разрешения доступа к данным следуют вашим разрешениям Unity Catalog. Claude может получать доступ только к данным, к которым вы имеете доступ.
Пользовательские функции обеспечивают согласованные расчеты. Рассмотрите возможность добавления функций UC для расчета стандартизированных метрик.
Сложные анализы могут требовать нескольких этапов. Сначала попросите план и проверьте предложенный Claude подход.
