Der Databricks-Connector bietet Claude Zugriff auf die internen Daten Ihrer Organisation über Unity Catalog und ermöglicht die Analyse Ihrer Datenbanken, die Ausführung benutzerdefinierter Geschäftslogik und den Zugriff auf unstrukturierte Dokumente. Databricks stellt drei separate Connectoren bereit: einen für Funktionen, einen für Vektorsuche und einen für Genie, die jeweils auf unterschiedliche Funktionen in Ihrem Databricks-Workspace zugreifen.
Erinnerung an Databricks-Komponenten
Bevor Sie erkunden, was Claude mit Databricks tun kann, ist es wichtig, drei Kernkomponenten zu verstehen, die in Ihrem Databricks-Workspace existieren:
Unity Catalog Functions: Benutzerdefinierte Python- oder SQL-Funktionen, die Ihre Organisation für spezifische Berechnungen, Datentransformationen oder API-Integrationen erstellt hat. Dazu können proprietäre Bewertungsalgorithmen, normalisierte Finanzberechnungen oder geschäftsspezifische Datenverarbeitungslogik gehören.
Vector Search: Semantische Suchindizes, die auf den Dokumenten und Datensätzen Ihrer Organisation aufgebaut sind. Diese ermöglichen die Suche nach konzeptionell ähnlichen Inhalten, auch wenn exakte Schlüsselwörter nicht übereinstimmen.
Genie: Eine natürlichsprachliche Schnittstelle, die einfache Fragen in englischer Sprache in SQL-Abfragen gegen Ihre Daten übersetzt. Genie verwendet Metadaten über Ihre Tabellen und Spalten, um Geschäftsterminologie zu verstehen und geeignete Abfragen zu generieren.
Was dieser Connector bietet
Integrationsfunktionen
Durch die Databricks-Integration kann Claude auf Ressourcen in Ihrem Workspace zugreifen:
Benutzerdefinierte Funktionen ausführen: Claude kann Unity Catalog-Funktionen ausführen, die von Ihrer Organisation definiert wurden. Dies umfasst die Ausführung komplexer Geschäftslogik, die Anwendung von Berechnungen oder den Aufruf externer APIs über Funktionen, die Ihr Team erstellt hat. Wenn Ihre Organisation beispielsweise eine benutzerdefinierte Funktion zur Bewertung der Kundengesundheit erstellt hat, kann Claude diese konsistent über alle Analysen hinweg anwenden.
Semantische Suche: Mithilfe von Vektorsuchindizes kann Claude relevante Dokumente und Inhalte basierend auf ihrer Bedeutung finden, nicht nur anhand von Schlüsselwörtern. Dies ist besonders nützlich für die Suche in Verträgen, Forschungsberichten, Kundenfeedback oder technischer Dokumentation, wo ähnliche Konzepte auf unterschiedliche Weise ausgedrückt werden können.
Natürlichsprachliche Abfragen: Über Genie kann Claude einfache Fragen in englischer Sprache in SQL-Abfragen übersetzen. Anstatt komplexes SQL zu schreiben, können Sie Fragen stellen wie „Wie hoch war unser Umsatzwachstum im letzten Quartal?" und Claude wird Genie verwenden, um die entsprechende Abfrage zu generieren und auszuführen.
Gesteuerter Zugriff: Jeder Datenzugriff über den Connector respektiert die Unity Catalog-Berechtigungen und -Richtlinien Ihrer Organisation. Claude kann nur auf Daten zugreifen und Funktionen ausführen, für die Ihr Benutzerkonto eine Berechtigung hat.
Wie Claude Databricks-Daten verwendet
Claude wendet Databricks-Funktionen auf verschiedene Weise an, um umfassende Datenanalysen zu unterstützen:
Multi-Quellen-Analyse: Claude kombiniert Ergebnisse aus Datenbankabfragen, Vektorsuchen und benutzerdefinierten Funktionen, um umfassende Erkenntnisse zu liefern. Bei der Validierung einer Investitionsthese könnte Claude beispielsweise die historische finanzielle Performance aus Ihrer Portfolio-Datenbank abfragen, frühere Due-Diligence-Berichte nach ähnlichen Brancheninvestitionen durchsuchen und Ihre proprietäre IRR-Berechnungsfunktion anwenden, um erwartete Renditen zu modellieren.
Iterative Exploration: Claude kann Daten abfragen, erste Ergebnisse analysieren und Suchen basierend auf Erkenntnissen verfeinern. Dies ermöglicht Analysen, bei denen Erkenntnisse aus einer Abfrage die nächste informieren.
Anwendung benutzerdefinierter Logik: Durch die Ausführung von Unity Catalog-Funktionen wendet Claude die spezifischen Regeln und Berechnungen Ihrer Organisation an. Dies stellt sicher, dass proprietäre Metriken, angepasste Berechnungen und unternehmensspezifische Logik einheitlich über alle Analysen hinweg angewendet werden.
Kontextbezogene Abfrageerstellung: Wenn Sie Fragen in einfacher Sprache stellen, verwendet Claude Genie, um sie in geeignete SQL-Abfragen zu übersetzen. Diese Übersetzung berücksichtigt Ihre Tabellenstrukturen, Spaltennamen und Beziehungen, um genaue Abfragen zu generieren, die zu Ihrer Datenbankstruktur passen.
Mustererkennung: Durch Vektorsuche kann Claude Muster und Ähnlichkeiten über Dokumente und Daten hinweg finden. Dies hilft beim Auffinden verwandter Probleme, ähnlicher Transaktionen oder vergleichbarer Situationen, die durch traditionelle Schlüsselwortsuchen möglicherweise nicht offensichtlich sind.
Einrichten des Databricks-Connectors
Die Databricks-Integration besteht aus drei separaten Connectoren, die jeweils eine separate Einrichtung erfordern:
Functions Server: Greift auf Unity Catalog-Funktionen für Berechnungen, Geschäftslogik und Datentransformationen zu.
Vector Search Server: Ermöglicht semantische Suche über indizierte Dokumente und Datensätze.
Genie Server: Bietet Funktionen zur Übersetzung von natürlicher Sprache in SQL-Abfragen.
Technische Details zu den Databricks-Connectoren finden Sie in der MCP Server-Dokumentation von Databricks. Die Authentifizierung mit den Databricks-Connectoren erfolgt über OAuth (für Claude.ai und Claude Desktop) oder über ein Databricks Personal Access Token (nur für Claude Desktop).
Hinzufügen des Connectors als Organisationsinhaber
Navigieren Sie zu Admin-Einstellungen > Connectoren.
Scrollen Sie nach unten und klicken Sie
