Le connecteur Databricks fournit à Claude l'accès aux données internes de votre organisation via Unity Catalog, permettant l'analyse de vos bases de données, l'exécution de logiques métier personnalisées et l'accès à des documents non structurés. Databricks fournit trois connecteurs distincts : un pour les fonctions, un pour la recherche vectorielle et un pour Genie, chacun accédant à des capacités différentes au sein de votre espace de travail Databricks.
Rappel sur les composants Databricks
Avant d'explorer ce que Claude peut faire avec Databricks, il est important de comprendre trois composants fondamentaux qui existent dans votre espace de travail Databricks :
Fonctions Unity Catalog : Fonctions Python ou SQL personnalisées que votre organisation a créées pour des calculs spécifiques, des transformations de données ou des intégrations d'API. Celles-ci peuvent inclure des algorithmes de notation propriétaires, des calculs financiers normalisés ou une logique de traitement des données spécifique à l'entreprise.
Recherche vectorielle : Index de recherche sémantique construits sur les documents et ensembles de données de votre organisation. Ceux-ci permettent de rechercher du contenu conceptuellement similaire même lorsque les mots-clés exacts ne correspondent pas.
Genie : Une interface en langage naturel qui traduit les questions en anglais simple en requêtes SQL contre vos données. Genie utilise les métadonnées relatives à vos tables et colonnes pour comprendre la terminologie métier et générer les requêtes appropriées.
Ce que ce connecteur fournit
Capacités d'intégration
Grâce à l'intégration Databricks, Claude peut accéder aux ressources de votre espace de travail :
Exécuter des fonctions personnalisées : Claude peut exécuter les fonctions Unity Catalog définies par votre organisation. Cela inclut l'exécution de logiques métier complexes, l'application de calculs ou l'appel d'API externes via des fonctions créées par votre équipe. Par exemple, si votre organisation a créé une fonction personnalisée de score de santé client, Claude peut l'appliquer de manière cohérente dans les analyses.
Recherche sémantique : En utilisant les index de recherche vectorielle, Claude peut trouver des documents et du contenu pertinents en fonction du sens plutôt que simplement des mots-clés. Ceci est particulièrement utile pour rechercher dans les contrats, les rapports de recherche, les commentaires des clients ou la documentation technique où des concepts similaires pourraient être exprimés de différentes manières.
Requêtes en langage naturel : Via Genie, Claude peut traduire les questions en anglais simple en requêtes SQL. Au lieu d'écrire du SQL complexe, vous pouvez poser des questions comme « Quelle a été notre croissance des revenus le trimestre dernier ? » et Claude utilisera Genie pour générer et exécuter la requête appropriée.
Accès gouverné : Tous les accès aux données via le connecteur respectent les autorisations et politiques Unity Catalog de votre organisation. Claude ne peut accéder aux données et exécuter les fonctions que votre compte utilisateur est autorisé à utiliser.
Comment Claude utilise les données Databricks
Claude applique les capacités Databricks de plusieurs façons pour soutenir une analyse de données complète :
Analyse multi-sources : Claude combine les résultats des requêtes de base de données, des recherches vectorielles et des fonctions personnalisées pour fournir des informations complètes. Par exemple, lors de la validation d'une thèse d'investissement, Claude pourrait interroger les performances financières historiques de votre base de données de portefeuille, rechercher dans les rapports de diligence raisonnable antérieurs des investissements sectoriels similaires et appliquer votre fonction de calcul TRI propriétaire pour modéliser les rendements attendus.
Exploration itérative : Claude peut interroger les données, analyser les résultats initiaux et affiner les recherches en fonction des résultats. Cela permet une analyse où les informations d'une requête informent la suivante.
Application de logique personnalisée : En exécutant les fonctions Unity Catalog, Claude applique les règles et calculs spécifiques de votre organisation. Cela garantit que les métriques propriétaires, les calculs ajustés et la logique spécifique à l'entreprise sont appliqués uniformément dans toutes les analyses.
Construction de requêtes contextuelle : Lorsque vous posez des questions en anglais simple, Claude utilise Genie pour les traduire en requêtes SQL appropriées. Cette traduction considère vos structures de table, noms de colonnes et relations pour générer des requêtes précises qui correspondent à votre structure de base de données.
Reconnaissance de motifs : Via la recherche vectorielle, Claude peut trouver des motifs et des similitudes dans les documents et les données. Cela aide à trouver les problèmes connexes, les transactions similaires ou les situations comparables qui pourraient ne pas être évidentes par les recherches par mots-clés traditionnelles.
Configuration du connecteur Databricks
L'intégration Databricks se compose de trois connecteurs distincts, chacun nécessitant une configuration séparée :
Serveur de fonctions : Accède aux fonctions Unity Catalog pour les calculs, la logique métier et les transformations de données.
Serveur de recherche vectorielle : Active la recherche sémantique dans les documents et ensembles de données indexés.
Serveur Genie : Fournit des capacités de traduction de requêtes du langage naturel vers SQL.
Les détails techniques des connecteurs Databricks se trouvent dans la documentation du serveur MCP de Databricks. L'authentification avec les connecteurs Databricks est gérée via OAuth (pour Claude.ai et Claude Desktop) ou via un jeton d'accès personnel Databricks (pour Claude Desktop uniquement).
Ajout du connecteur en tant que propriétaire d'organisation
Accédez à Paramètres d'administration > Connecteurs.
Faites défiler vers le bas et cliquez sur « Ajouter un connecteur personnalisé » en bas de la liste.
Entrez l'URL d'intégration pour votre espace de travail Databricks
Nommez l'intégration. N'oubliez pas qu'il y a trois serveurs Databricks distincts, alors envisagez de nommer chacun de manière unique (par exemple, « Databricks UC », « Databricks Genie », « Databricks Search »)
Cliquez sur « Ajouter »
Pour les utilisateurs individuels
Découvrez comment
