Le connecteur Databricks fournit à Claude l'accès aux données internes de votre organisation via Unity Catalog, permettant l'analyse de vos bases de données, l'exécution de logiques métier personnalisées et l'accès à des documents non structurés. Databricks fournit trois connecteurs distincts : un pour les fonctions, un pour la recherche vectorielle et un pour Genie, chacun accédant à des capacités différentes au sein de votre espace de travail Databricks.

Rappel sur les composants Databricks

Avant d'explorer ce que Claude peut faire avec Databricks, il est important de comprendre trois composants fondamentaux qui existent dans votre espace de travail Databricks :

Fonctions Unity Catalog : Fonctions Python ou SQL personnalisées que votre organisation a créées pour des calculs spécifiques, des transformations de données ou des intégrations d'API. Celles-ci peuvent inclure des algorithmes de notation propriétaires, des calculs financiers normalisés ou une logique de traitement des données spécifique à l'entreprise.
Recherche vectorielle : Indexes de recherche sémantique construits sur les documents et ensembles de données de votre organisation. Ceux-ci permettent de rechercher du contenu conceptuellement similaire même lorsque les mots-clés exacts ne correspondent pas.
Genie : Une interface en langage naturel qui traduit les questions en anglais simple en requêtes SQL sur vos données. Genie utilise les métadonnées sur vos tables et colonnes pour comprendre la terminologie métier et générer les requêtes appropriées.

Ce que ce connecteur fournit

Capacités d'intégration

Grâce à l'intégration Databricks, Claude peut accéder aux ressources de votre espace de travail :

Exécuter des fonctions personnalisées : Claude peut exécuter les fonctions Unity Catalog définies par votre organisation. Cela inclut l'exécution de logiques métier complexes, l'application de calculs ou l'appel d'API externes via des fonctions créées par votre équipe. Par exemple, si votre organisation a créé une fonction personnalisée de score de santé client, Claude peut l'appliquer de manière cohérente dans les analyses.
Recherche sémantique : En utilisant les indexes de recherche vectorielle, Claude peut trouver des documents et du contenu pertinents en fonction du sens plutôt que simplement des mots-clés. Ceci est particulièrement utile pour rechercher dans les contrats, les rapports de recherche, les commentaires des clients ou la documentation technique où des concepts similaires pourraient être exprimés de différentes manières.
Requêtes en langage naturel : Via Genie, Claude peut traduire les questions en anglais simple en requêtes SQL. Au lieu d'écrire du SQL complexe, vous pouvez poser des questions comme « Quelle a été notre croissance des revenus le trimestre dernier ? » et Claude utilisera Genie pour générer et exécuter la requête appropriée.
Accès gouverné : Tous les accès aux données via le connecteur respectent les permissions et politiques de votre Unity Catalog organisationnel. Claude ne peut accéder qu'aux données et exécuter les fonctions que votre compte utilisateur est autorisé à utiliser.

Comment Claude utilise les données Databricks

Claude applique les capacités Databricks de plusieurs façons pour soutenir une analyse de données complète :

Analyse multi-sources : Claude combine les résultats des requêtes de base de données, des recherches vectorielles et des fonctions personnalisées pour fournir des insights complets. Par exemple, lors de la validation d'une thèse d'investissement, Claude pourrait interroger les performances financières historiques de votre base de données de portefeuille, rechercher dans les rapports de diligence raisonnable antérieurs des investissements sectoriels similaires et appliquer votre fonction de calcul TRI propriétaire pour modéliser les rendements attendus.
Exploration itérative : Claude peut interroger les données, analyser les résultats initiaux et affiner les recherches en fonction des résultats. Cela permet une analyse où les insights d'une requête informent la suivante.
Application de logique personnalisée : En exécutant les fonctions Unity Catalog, Claude applique les règles et calculs spécifiques de votre organisation. Cela garantit que les métriques propriétaires, les calculs ajustés et la logique spécifique à l'entreprise sont appliqués uniformément dans toutes les analyses.
Construction de requêtes contextuelle : Lorsque vous posez des questions en anglais simple, Claude utilise Genie pour les traduire en requêtes SQL appropriées. Cette traduction considère vos structures de table, noms de colonnes et relations pour générer des requêtes précises qui correspondent à votre structure de base de données.
Reconnaissance de motifs : Via la recherche vectorielle, Claude peut trouver des motifs et des similitudes dans les documents et les données. Cela aide à trouver les problèmes connexes, les transactions similaires ou les situations comparables qui pourraient ne pas être évidentes par les recherches par mots-clés traditionnelles.

Configuration du connecteur Databricks

L'intégration Databricks se compose de trois connecteurs distincts, chacun nécessitant une configuration séparée :

Serveur de fonctions : Accède aux fonctions Unity Catalog pour les calculs, la logique métier et les transformations de données.
Serveur de recherche vectorielle : Active la recherche sémantique sur les documents et ensembles de données indexés.
Serveur Genie : Fournit les capacités de traduction de requêtes SQL en langage naturel.

Les détails techniques des connecteurs Databricks se trouvent dans la documentation du serveur MCP de Databricks. L'authentification avec les connecteurs Databricks est gérée via OAuth (pour Claude.ai et Claude Desktop) ou via un jeton d'accès personnel Databricks (pour Claude Desktop uniquement).

Ajout du connecteur en tant que propriétaire d'organisation

Accédez à Paramètres d'administration > Connecteurs.
Faites défiler vers le bas et cliquez sur « Ajouter un connecteur personnalisé » en bas de la liste.
Entrez l'URL d'intégration pour votre espace de travail Databricks
Nommez l'intégration. Rappelez-vous qu'il y a trois serveurs Databricks distincts, donc envisagez de nommer chacun de manière unique (par exemple, « Databricks UC », « Databricks Genie », « Databricks Search »)
Cliquez sur « Ajouter »

Pour les utilisateurs individuels

Découvrez comment trouver et connecter des outils.

Cas d'usage courants

Exemple de ressources disponibles

Pour illustrer comment ces capacités fonctionnent ensemble, considérez une entreprise de capital-investissement avec les ressources Databricks suivantes configurées :

Tables dans ce scénario

portfolio_companies : Détails de l'entreprise, informations d'acquisition, valorisations actuelles et niveaux d'endettement
financial_statements : Données financières périodiques incluant les revenus, l'EBITDA avec ajustements et les métriques opérationnelles comme le nombre de clients et le taux de désabonnement
market_comparables : Entreprises comparables du secteur avec multiples de valorisation et taux de croissance
due_diligence_docs : Référentiel de rapports de diligence raisonnable, documents d'analyse et mémorandums d'accord

Fonctions Unity Catalog dans ce scénario

calculate_normalized_ebitda() : Applique les ajustements standard du capital-investissement à l'EBITDA déclaré, supprimant les coûts ponctuels et normalisant la rémunération du propriétaire
compute_portfolio_irr() : Calcule le taux de rendement interne et le capital investi en fonction des flux de trésorerie et des périodes de détention
estimate_debt_capacity() : Modélise la capacité d'endettement maximale avec test de stress de conformité aux clauses restrictives selon divers scénarios

Index de recherche vectorielle dans ce scénario

due_diligence_index : Recherche sémantique dans tous les documents de diligence raisonnable, mémorandums d'accord et rapports d'analyse

Analyse de la préparation à la sortie du portefeuille

Exemple d'invite d'entrée :

Quelles entreprises du portefeuille sont prêtes pour une sortie ? Montrez les
gammes de valorisation et les rendements attendus en fonction des multiples
de marché actuels.

Pour cette analyse, Claude pourrait utiliser les différentes fonctions UC et Genie selon les étapes suivantes :

Genie : Identifier les entreprises du portefeuille détenues depuis plus de 3 ans et récupérer leurs dernières données financières.
Fonction UC : Appeler calculate_normalized_ebitda() pour chaque entreprise afin d'appliquer les ajustements PE.
Fonction UC : Exécuter compute_portfolio_irr() pour calculer le TRI et le MOIC pour chaque entreprise.
Genie : Interroger les comparables de marché et appliquer les multiples sectoriels à l'EBITDA normalisé pour les gammes de valorisation.

Claude pourrait alors rapporter ses résultats dans un résumé montrant les entreprises prêtes pour la sortie avec le TRI, le MOIC et les gammes de valorisation en fonction des multiples de marché actuels.

Valorisation des nouveaux accords

Exemple d'invite d'entrée :

Nous évaluons l'acquisition de TechCorp (SaaS, 45 M$ de revenus, 12 M$
d'EBITDA). Quelle est une valorisation équitable et combien de dettes
pouvons-nous supporter ? Incluez les dossiers de diligence raisonnable
antérieurs dans votre analyse.

Pour compléter cette demande, Claude pourrait suivre ce flux de travail :

Genie : Interroger les comparables de marché pour les entreprises de taille similaire dans le secteur de la cible afin d'établir les repères de valorisation.
Fonction UC : Appeler estimate_debt_capacity() avec les métriques de la cible pour modéliser les scénarios de levier et tester les clauses restrictives de conformité.
Recherche vectorielle : Rechercher dans l'index de diligence raisonnable les playbooks de création de valeur pertinents et les transactions précédentes.
Synthèse : Combiner les résultats pour générer une gamme de valorisation, une structure de capital recommandée et les précédents pertinents.

Idéalement, Claude répondrait alors avec un rapport sur la gamme de valorisation et un prix d'offre recommandé, tout en citant les sources qui soutiennent sa recommandation.

Évaluation du risque de violation de clauses restrictives

Exemple d'invite d'entrée :

Si nous voyons un déclin de l'EBITDA de 15 à 25 % dans l'ensemble du
portefeuille, quelles entreprises risquent des violations de clauses
restrictives ? Quelles mesures devrions-nous prendre ?

Pour cette tâche, Claude pourrait utiliser les ressources suivantes :

Genie : Identifier les entreprises du portefeuille avec endettement, en se concentrant sur celles avec un levier > 4x.
Fonction UC : Appeler calculate_normalized_ebitda() pour chaque entreprise à fort levier afin d'établir la base de référence.
Fonction UC : Exécuter estimate_debt_capacity() avec des scénarios de déclin de 15 %, 20 % et 25 % pour chaque entreprise.
Genie : Interroger les données financières historiques pour identifier les entreprises avec des tendances de fonds de roulement se détériorant.

Claude pourrait alors répondre avec une analyse des risques de violation, organisée par entreprise et scénario.

Conseils pour utiliser Databricks

Soyez précis sur les données que vous recherchez.
- Exemple : Au lieu de « Analyser les clients », essayez « Montrez-moi nos 20 meilleurs clients par... »
Utilisez le langage « trouver similaire » pour la correspondance de motifs
- Exemple : « Trouvez les commentaires qui mentionnent des problèmes comme cette plainte. »
Rappelez-vous que tous les accès aux données respectent vos permissions Unity Catalog. Claude ne peut accéder qu'aux données auxquelles vous pouvez accéder.
Les fonctions personnalisées fournissent des calculs cohérents. Envisagez d'ajouter des fonctions UC pour calculer les métriques standardisées.
Les analyses complexes peuvent nécessiter plusieurs étapes. Demandez d'abord un plan et examinez l'approche proposée par Claude.

Utilisation de Databricks pour l'analyse de données

Rappel sur les composants Databricks

Ce que ce connecteur fournit

Capacités d'intégration

Comment Claude utilise les données Databricks

Configuration du connecteur Databricks

Ajout du connecteur en tant que propriétaire d'organisation

Pour les utilisateurs individuels

Cas d'usage courants

Exemple de ressources disponibles

Tables dans ce scénario

Fonctions Unity Catalog dans ce scénario

Index de recherche vectorielle dans ce scénario

Analyse de la préparation à la sortie du portefeuille

Valorisation des nouveaux accords

Évaluation du risque de violation de clauses restrictives

Conseils pour utiliser Databricks