Vai al contenuto principale

Utilizzo di Databricks per l'Analisi dei Dati

Aggiornato oggi

Il connettore Databricks fornisce a Claude l'accesso ai dati interni della tua organizzazione attraverso Unity Catalog, consentendo l'analisi dei tuoi database, l'esecuzione di logica di business personalizzata e l'accesso a documenti non strutturati. Databricks fornisce tre connettori separati: uno per le funzioni, uno per la ricerca vettoriale e uno per Genie, ciascuno accedendo a diverse capacità all'interno del tuo workspace Databricks.

Promemoria sui Componenti Databricks

Prima di esplorare cosa Claude può fare con Databricks, è importante comprendere tre componenti fondamentali che esistono all'interno del tuo workspace Databricks:

  1. Funzioni Unity Catalog: Funzioni Python o SQL personalizzate create dalla tua organizzazione per calcoli specifici, trasformazioni di dati o integrazioni API. Potrebbero includere algoritmi di scoring proprietari, calcoli finanziari normalizzati o logica di elaborazione dati specifica del business.

  2. Vector Search: Indici di ricerca semantica costruiti sui documenti e dataset della tua organizzazione. Questi consentono di cercare contenuti concettualmente simili anche quando le parole chiave esatte non corrispondono.

  3. Genie: Un'interfaccia in linguaggio naturale che traduce domande in inglese semplice in query SQL sui tuoi dati. Genie utilizza metadati sulle tue tabelle e colonne per comprendere la terminologia di business e generare query appropriate.

Cosa Fornisce Questo Connettore

Capacità di Integrazione

Attraverso l'integrazione Databricks, Claude può accedere alle risorse nel tuo workspace:

  • Eseguire Funzioni Personalizzate: Claude può eseguire funzioni Unity Catalog definite dalla tua organizzazione. Questo include l'esecuzione di logica di business complessa, l'applicazione di calcoli o la chiamata di API esterne attraverso funzioni create dal tuo team. Ad esempio, se la tua organizzazione ha creato una funzione personalizzata di health score del cliente, Claude può applicarla in modo coerente in tutte le analisi.

  • Ricerca Semantica: Utilizzando indici di ricerca vettoriale, Claude può trovare documenti e contenuti rilevanti in base al significato piuttosto che solo alle parole chiave. Questo è particolarmente utile per cercare tra contratti, rapporti di ricerca, feedback dei clienti o documentazione tecnica dove concetti simili potrebbero essere espressi in modi diversi.

  • Query in Linguaggio Naturale: Attraverso Genie, Claude può tradurre domande in inglese semplice in query SQL. Invece di scrivere SQL complesso, puoi fare domande come "Qual è stata la nostra crescita dei ricavi lo scorso trimestre?" e Claude userà Genie per generare ed eseguire la query appropriata.

  • Accesso Governato: Tutto l'accesso ai dati attraverso il connettore rispetta i permessi e le politiche di Unity Catalog della tua organizzazione. Claude può accedere solo ai dati ed eseguire funzioni che il tuo account utente ha il permesso di utilizzare.

Come Claude Utilizza i Dati Databricks

Claude applica le capacità Databricks in diversi modi per supportare un'analisi dei dati completa:

  • Analisi Multi-Fonte: Claude combina i risultati da query di database, ricerche vettoriali e funzioni personalizzate per fornire insight completi. Ad esempio, quando convalida una tesi di investimento, Claude potrebbe interrogare le prestazioni finanziarie storiche dal tuo database di portfolio, cercare tra i rapporti di due diligence passati per investimenti simili nel settore e applicare la tua funzione di calcolo IRR proprietaria per modellare i rendimenti attesi.

  • Esplorazione Iterativa: Claude può interrogare i dati, analizzare i risultati iniziali e affinare le ricerche in base ai risultati. Questo consente un'analisi in cui gli insight da una query informano la successiva.

  • Applicazione di Logica Personalizzata: Eseguendo funzioni Unity Catalog, Claude applica le regole e i calcoli specifici della tua organizzazione. Questo assicura che le metriche proprietarie, i calcoli aggiustati e la logica specifica dell'azienda siano applicati uniformemente in tutte le analisi.

  • Costruzione di Query Contestuale: Quando fai domande in inglese semplice, Claude utilizza Genie per tradurle in query SQL appropriate. Questa traduzione considera le tue strutture di tabella, i nomi delle colonne e le relazioni per generare query accurate che corrispondono alla struttura del tuo database.

  • Riconoscimento di Modelli: Attraverso la ricerca vettoriale, Claude può trovare modelli e somiglianze tra documenti e dati. Questo aiuta a trovare problemi correlati, transazioni simili o situazioni comparabili che potrebbero non essere ovvie attraverso ricerche tradizionali per parole chiave.

Configurazione del Connettore Databricks

L'integrazione Databricks consiste di tre connettori separati, ciascuno richiedente una configurazione separata:

  1. Functions Server: Accede alle funzioni Unity Catalog per calcoli, logica di business e trasformazioni di dati.

  2. Vector Search Server: Abilita la ricerca semantica tra documenti e dataset indicizzati.

  3. Genie Server: Fornisce capacità di traduzione da linguaggio naturale a query SQL.

I dettagli tecnici dei connettori Databricks si trovano nella Documentazione MCP Server di Databricks. L'autenticazione con i connettori Databricks è gestita tramite OAuth (per Claude.ai e Claude Desktop) o tramite un Databricks Personal Access Token (solo per Claude Desktop).

Aggiunta del Connettore come Proprietario dell'Organizzazione

  1. Scorri verso il basso e fai clic su "Aggiungi connettore personalizzato" in fondo all'elenco.

  2. Inserisci l'URL di integrazione per il tuo workspace Databricks

  3. Assegna un nome all'integrazione. Ricorda che ci sono tre server Databricks separati, quindi considera di assegnare a ciascuno un nome univoco (ad es. "Databricks UC", "Databricks Genie", "Databricks Search")

  4. Fai clic su "Aggiungi"

Per Utenti Individuali

Casi d'Uso Comuni

Esempio di Risorse Disponibili

Per illustrare come queste capacità funzionano insieme, considera una società di private equity con le seguenti risorse Databricks configurate:

Tabelle in questo scenario

  1. portfolio_companies: Dettagli dell'azienda, informazioni di acquisizione, valutazioni attuali e livelli di debito

  2. financial_statements: Dati finanziari periodici inclusi ricavi, EBITDA con aggiustamenti e metriche operative come numero di clienti e churn

  3. market_comparables: Aziende comparabili del settore con multipli di valutazione e tassi di crescita

  4. due_diligence_docs: Repository di rapporti di due diligence, documenti di analisi e deal memo

Funzioni Unity Catalog in questo scenario

  1. calculate_normalized_ebitda(): Applica aggiustamenti standard di private equity all'EBITDA riportato, rimuovendo costi una tantum e normalizzando la compensazione del proprietario

  2. compute_portfolio_irr(): Calcola il tasso di rendimento interno e il denaro sul capitale investito in base ai flussi di cassa e ai periodi di detenzione

  3. estimate_debt_capacity(): Modella la capacità di leva massima con stress test di conformità ai covenant in vari scenari

Indice Vector Search in questo scenario

  1. due_diligence_index: Ricerca semantica tra tutti i documenti di due diligence, deal memo e rapporti di analisi

Analisi di Prontezza per l'Uscita dal Portfolio

Esempio di prompt di input:

Quali aziende del portfolio sono pronte per l'uscita? Mostra intervalli di valutazione e 
rendimenti attesi in base ai multipli di mercato attuali.

Per questa analisi, Claude potrebbe utilizzare le diverse Funzioni UC e Genie nei seguenti passaggi:

  1. Genie: Identifica le aziende del portfolio detenute da più di 3 anni e recupera i loro ultimi dati finanziari.

  2. Funzione UC: Chiama calculate_normalized_ebitda() per ogni azienda per applicare aggiustamenti PE.

  3. Funzione UC: Esegui compute_portfolio_irr() per calcolare IRR e MOIC per ogni azienda.

  4. Genie: Interroga i comparabili di mercato e applica i multipli del settore all'EBITDA normalizzato per gli intervalli di valutazione.

Claude potrebbe quindi riportare i suoi risultati in un riepilogo che mostra le aziende pronte per l'uscita con IRR, MOIC e intervalli di valutazione in base ai multipli di mercato attuali.

Valutazione di Nuovi Accordi

Esempio di prompt di input:

Stiamo valutando l'acquisizione di TechCorp (SaaS, ricavi di $45M, EBITDA di $12M).
Qual è una valutazione equa e quanto debito possiamo supportare? Includi i record
di due diligence precedenti nella tua analisi.

Per completare questa richiesta, Claude potrebbe seguire questo flusso di lavoro:

  1. Genie: Interroga i comparabili di mercato per aziende di dimensioni simili nel settore del target per stabilire benchmark di valutazione.

  2. Funzione UC: Chiama estimate_debt_capacity() con le metriche del target per modellare scenari di leva e stress-test la conformità ai covenant.

  3. Vector Search: Cerca nell'indice di due diligence playbook di creazione di valore rilevanti e transazioni precedenti.

  4. Sintesi: Combina i risultati per generare intervallo di valutazione, struttura di capitale consigliata e precedenti rilevanti.

Idealmente, Claude risponderebbe quindi con un rapporto sull'intervallo di valutazione e un prezzo di offerta consigliato, citando le fonti che portano alla sua raccomandazione.

Valutazione del Rischio di Violazione dei Covenant

Esempio di prompt di input:

Se vediamo un calo dell'EBITDA del 15-25% in tutto il portfolio, quali aziende 
rischiano violazioni dei covenant? Quali azioni dovremmo intraprendere?

Per questo compito, Claude potrebbe utilizzare le seguenti risorse:

  1. Genie: Identifica le aziende del portfolio con debito, concentrandosi su quelle con leva > 4x.

  2. Funzione UC: Chiama calculate_normalized_ebitda() per ogni azienda ad alta leva per stabilire la baseline.

  3. Funzione UC: Esegui estimate_debt_capacity() con scenari di calo del 15%, 20% e 25% per ogni azienda.

  4. Genie: Interroga i dati finanziari storici per identificare le aziende con tendenze di capitale circolante deterioranti.

Claude potrebbe quindi rispondere con un'analisi del rischio di violazione, organizzata per azienda e scenario.

Suggerimenti per l'Utilizzo di Databricks

  • Sii specifico riguardo ai dati che stai cercando.

    • Esempio: Invece di "Analizza i clienti", prova "Mostrami i nostri top 20 clienti per…"

  • Usa il linguaggio "trova simile" per il riconoscimento di modelli

    • Esempio: "Trova feedback che menzionano problemi come questo reclamo."

  • Ricorda che tutti i permessi di accesso ai dati seguono i tuoi permessi di Unity Catalog. Claude può accedere solo ai dati a cui puoi accedere.

  • Le funzioni personalizzate forniscono calcoli coerenti. Considera di aggiungere Funzioni UC per il calcolo di metriche standardizzate.

  • Le analisi complesse potrebbero richiedere più passaggi. Chiedi prima un piano e rivedi l'approccio proposto da Claude.

Hai ricevuto la risposta alla tua domanda?