Zum Hauptinhalt springen

Databricks für Datenanalyse verwenden

Gestern aktualisiert

Der Databricks-Connector bietet Claude Zugriff auf die internen Daten Ihrer Organisation über Unity Catalog und ermöglicht die Analyse Ihrer Datenbanken, die Ausführung benutzerdefinierter Geschäftslogik und den Zugriff auf unstrukturierte Dokumente. Databricks bietet drei separate Connectors: einen für Funktionen, einen für Vektorsuche und einen für Genie, die jeweils auf verschiedene Funktionen in Ihrem Databricks-Workspace zugreifen.

Erinnerung an Databricks-Komponenten

Bevor Sie erkunden, was Claude mit Databricks tun kann, ist es wichtig, drei Kernkomponenten zu verstehen, die in Ihrem Databricks-Workspace vorhanden sind:

  1. Unity Catalog-Funktionen: Benutzerdefinierte Python- oder SQL-Funktionen, die Ihre Organisation für spezifische Berechnungen, Datentransformationen oder API-Integrationen erstellt hat. Diese können proprietäre Scoring-Algorithmen, normalisierte Finanzberechnungen oder geschäftsspezifische Datenverarbeitungslogik umfassen.

  2. Vektorsuche: Semantische Suchindizes, die auf den Dokumenten und Datensätzen Ihrer Organisation aufgebaut sind. Diese ermöglichen die Suche nach konzeptionell ähnlichen Inhalten, auch wenn exakte Schlüsselwörter nicht übereinstimmen.

  3. Genie: Eine natürlichsprachliche Schnittstelle, die einfache englische Fragen in SQL-Abfragen gegen Ihre Daten übersetzt. Genie nutzt Metadaten über Ihre Tabellen und Spalten, um Geschäftsterminologie zu verstehen und angemessene Abfragen zu generieren.

Was dieser Connector bietet

Integrationsfunktionen

Durch die Databricks-Integration kann Claude auf Ressourcen in Ihrem Workspace zugreifen:

  • Benutzerdefinierte Funktionen ausführen: Claude kann Unity Catalog-Funktionen ausführen, die von Ihrer Organisation definiert wurden. Dies umfasst die Ausführung komplexer Geschäftslogik, die Anwendung von Berechnungen oder das Aufrufen externer APIs über von Ihrem Team erstellte Funktionen. Wenn Ihre Organisation beispielsweise eine benutzerdefinierte Kundenzustandsbewertungsfunktion erstellt hat, kann Claude diese konsistent über Analysen hinweg anwenden.

  • Semantische Suche: Mit Hilfe von Vektorsuchindizes kann Claude relevante Dokumente und Inhalte basierend auf ihrer Bedeutung und nicht nur auf Schlüsselwörtern finden. Dies ist besonders nützlich bei der Suche in Verträgen, Forschungsberichten, Kundenfeedback oder technischer Dokumentation, wo ähnliche Konzepte auf unterschiedliche Weise ausgedrückt werden können.

  • Natürlichsprachige Abfragen: Durch Genie kann Claude einfache englische Fragen in SQL-Abfragen übersetzen. Anstatt komplexes SQL zu schreiben, können Sie Fragen wie „Wie war unser Umsatzwachstum im letzten Quartal?" stellen, und Claude wird Genie verwenden, um die entsprechende Abfrage zu generieren und auszuführen.

  • Kontrollierter Zugriff: Alle Datenzugriffe über den Connector respektieren die Berechtigungen und Richtlinien Ihres Unity Catalog der Organisation. Claude kann nur auf Daten zugreifen und Funktionen ausführen, auf die Ihr Benutzerkonto Zugriff hat.

Wie Claude Databricks-Daten nutzt

Claude wendet Databricks-Funktionen auf mehrere Arten an, um umfassende Datenanalysen zu unterstützen:

  • Multi-Source-Analyse: Claude kombiniert Ergebnisse aus Datenbankabfragen, Vektorsuchvorgängen und benutzerdefinierten Funktionen, um umfassende Erkenntnisse zu liefern. Beispielsweise könnte Claude bei der Validierung einer Investitionsthese historische finanzielle Leistungen aus Ihrer Portfolio-Datenbank abfragen, frühere Due-Diligence-Berichte für ähnliche Sektor-Investitionen durchsuchen und Ihre proprietäre IRR-Berechnungsfunktion anwenden, um erwartete Renditen zu modellieren.

  • Iterative Exploration: Claude kann Daten abfragen, erste Ergebnisse analysieren und Suchvorgänge basierend auf Erkenntnissen verfeinern. Dies ermöglicht Analysen, bei denen Erkenntnisse aus einer Abfrage die nächste informieren.

  • Anwendung benutzerdefinierter Logik: Durch die Ausführung von Unity Catalog-Funktionen wendet Claude die spezifischen Regeln und Berechnungen Ihrer Organisation an. Dies stellt sicher, dass proprietäre Metriken, angepasste Berechnungen und unternehmensspezifische Logik einheitlich über alle Analysen hinweg angewendet werden.

  • Kontextuelle Abfrageerstellung: Wenn Sie Fragen in einfachem Englisch stellen, nutzt Claude Genie, um diese in angemessene SQL-Abfragen zu übersetzen. Diese Übersetzung berücksichtigt Ihre Tabellenstrukturen, Spaltennamen und Beziehungen, um genaue Abfragen zu generieren, die Ihrer Datenbankstruktur entsprechen.

  • Mustererkennung: Durch Vektorsuche kann Claude Muster und Ähnlichkeiten über Dokumente und Daten hinweg finden. Dies hilft dabei, verwandte Probleme, ähnliche Transaktionen oder vergleichbare Situationen zu finden, die durch traditionelle Schlüsselwortsuchen möglicherweise nicht offensichtlich sind.

Einrichtung des Databricks-Connectors

Die Databricks-Integration besteht aus drei separaten Connectors, die jeweils eine separate Einrichtung erfordern:

  1. Functions Server: Greift auf Unity Catalog-Funktionen für Berechnungen, Geschäftslogik und Datentransformationen zu.

  2. Vector Search Server: Ermöglicht semantische Suche über indizierte Dokumente und Datensätze.

  3. Genie Server: Bietet Funktionen zur Übersetzung von natürlicher Sprache in SQL-Abfragen.

Technische Details der Databricks-Connectors finden Sie in der MCP Server-Dokumentation von Databricks. Die Authentifizierung mit den Databricks-Connectors erfolgt über OAuth (für Claude.ai und Claude Desktop) oder über ein Databricks Personal Access Token (nur für Claude Desktop).

Hinzufügen des Connectors als Organisationsinhaber

  1. Scrollen Sie nach unten und klicken Sie auf „Benutzerdefinierten Connector hinzufügen" am Ende der Liste.

  2. Geben Sie die Integrations-URL für Ihren Databricks-Workspace ein

  3. Benennen Sie die Integration. Denken Sie daran, dass es drei separate Databricks-Server gibt, daher sollten Sie jeden eindeutig benennen (z. B. „Databricks UC", „Databricks Genie", „Databricks Search")

  4. Klicken Sie auf „Hinzufügen"

Für einzelne Benutzer

Erfahren Sie mehr über das Finden und Verbinden von Tools.

Häufige Anwendungsfälle

Beispiel verfügbarer Ressourcen

Um zu veranschaulichen, wie diese Funktionen zusammenwirken, betrachten Sie eine Private-Equity-Firma mit den folgenden konfigurierten Databricks-Ressourcen:

Tabellen in diesem Szenario

  1. portfolio_companies: Unternehmensdetails, Akquisitionsinformationen, aktuelle Bewertungen und Schuldenniveaus

  2. financial_statements: Periodische Finanzdaten einschließlich Umsatz, EBITDA mit Anpassungen und operativer Metriken wie Kundenzahl und Abwanderung

  3. market_comparables: Vergleichbare Unternehmen im Sektor mit Bewertungsmultiplikatoren und Wachstumsraten

  4. due_diligence_docs: Repository von Due-Diligence-Berichten, Analysedokumenten und Deal-Memos

Unity Catalog-Funktionen in diesem Szenario

  1. calculate_normalized_ebitda(): Wendet standardmäßige Private-Equity-Anpassungen auf das gemeldete EBITDA an, entfernt einmalige Kosten und normalisiert die Eigentümervergütung

  2. compute_portfolio_irr(): Berechnet die interne Rendite und das Geld auf investiertes Kapital basierend auf Cashflows und Haltedauern

  3. estimate_debt_capacity(): Modelliert die maximale Verschuldungskapazität mit Covenant-Compliance-Stresstests unter verschiedenen Szenarien

Vektorsuchindex in diesem Szenario

  1. due_diligence_index: Semantische Suche über alle Due-Diligence-Dokumente, Deal-Memos und Analysberichte

Analyse der Portfolio-Ausstiegsbereitschaft

Beispiel-Eingabeaufforderung:

Welche Portfolio-Unternehmen sind bereit für einen Ausstieg? Zeigen Sie Bewertungsspannen und 
erwartete Renditen basierend auf aktuellen Marktmultiplikatoren.

Für diese Analyse könnte Claude die verschiedenen UC-Funktionen und Genie in den folgenden Schritten verwenden:

  1. Genie: Identifizieren Sie Portfolio-Unternehmen, die länger als 3 Jahre gehalten werden, und rufen Sie ihre neuesten Finanzdaten ab.

  2. UC-Funktion: Rufen Sie calculate_normalized_ebitda() für jedes Unternehmen auf, um PE-Anpassungen anzuwenden.

  3. UC-Funktion: Führen Sie compute_portfolio_irr() aus, um IRR und MOIC für jedes Unternehmen zu berechnen.

  4. Genie: Fragen Sie Marktvergleichswerte ab und wenden Sie Sektor-Multiplikatoren auf normalisiertes EBITDA an, um Bewertungsspannen zu erhalten.

Claude könnte dann seine Ergebnisse in einer Zusammenfassung berichten, die ausstiegsreife Unternehmen mit IRR, MOIC und Bewertungsspannen basierend auf aktuellen Marktmultiplikatoren zeigt.

Bewertung neuer Deals

Beispiel-Eingabeaufforderung:

Wir evaluieren die Übernahme von TechCorp (SaaS, 45 Mio. $ Umsatz, 12 Mio. $ EBITDA).
Was ist eine faire Bewertung und wie viel Schulden können wir tragen? Beziehen Sie frühere
Due-Diligence-Unterlagen in Ihre Analyse ein.

Um diese Anfrage zu erfüllen, könnte Claude den folgenden Workflow befolgen:

  1. Genie: Fragen Sie Marktvergleichswerte für ähnlich große Unternehmen im Sektor des Zielunternehmens ab, um Bewertungs-Benchmarks zu etablieren.

  2. UC-Funktion: Rufen Sie estimate_debt_capacity() mit Zielmetriken auf, um Verschuldungsszenarien zu modellieren und Covenant-Compliance zu stresstesten.

  3. Vektorsuche: Durchsuchen Sie den Due-Diligence-Index nach relevanten Wertschöpfungs-Playbooks und Präzedenzfällen.

  4. Synthese: Kombinieren Sie Ergebnisse, um Bewertungsspanne, empfohlene Kapitalstruktur und relevante Präzedenzfälle zu generieren.

Idealerweise würde Claude dann mit einem Bericht über die Bewertungsspanne und einen empfohlenen Angebotspreis antworten, während er Quellen zitiert, die zu seiner Empfehlung führen.

Bewertung des Covenant-Verletzungsrisikos

Beispiel-Eingabeaufforderung:

Wenn wir einen EBITDA-Rückgang von 15-25% im gesamten Portfolio sehen, welche Unternehmen 
riskieren Covenant-Verstöße? Welche Maßnahmen sollten wir ergreifen?

Für diese Aufgabe könnte Claude die folgenden Ressourcen nutzen:

  1. Genie: Identifizieren Sie Portfolio-Unternehmen mit Schulden, konzentrieren Sie sich auf diejenigen mit Verschuldung > 4x.

  2. UC-Funktion: Rufen Sie calculate_normalized_ebitda() für jedes hochverschuldete Unternehmen auf, um eine Baseline zu etablieren.

  3. UC-Funktion: Führen Sie estimate_debt_capacity() mit Rückgangsszenarien von 15%, 20% und 25% für jedes Unternehmen aus.

  4. Genie: Fragen Sie historische Finanzdaten ab, um Unternehmen mit sich verschlechternden Betriebskapitaltrends zu identifizieren.

Claude könnte dann mit einer Analyse des Verletzungsrisikos antworten, organisiert nach Unternehmen und Szenario.

Tipps zur Verwendung von Databricks

  • Seien Sie spezifisch darüber, welche Daten Sie suchen.

    • Beispiel: Anstatt „Analysieren Sie Kunden", versuchen Sie „Zeigen Sie mir unsere Top-20-Kunden nach…"

  • Verwenden Sie „ähnliche finden"-Sprache für Mustererkennung

    • Beispiel: „Finden Sie Feedback, das Probleme wie diese Beschwerde erwähnt."

  • Denken Sie daran, dass alle Datenzugriffsberechtigungen Ihren Unity Catalog-Berechtigungen folgen. Claude kann nur auf Daten zugreifen, auf die Sie zugreifen können.

  • Benutzerdefinierte Funktionen bieten konsistente Berechnungen. Erwägen Sie, UC-Funktionen zum Berechnen standardisierter Metriken hinzuzufügen.

  • Komplexe Analysen können mehrere Schritte erfordern. Fragen Sie zuerst nach einem Plan und überprüfen Sie Claudes vorgeschlagenen Ansatz.

Hat dies deine Frage beantwortet?