Vai al contenuto principale

Utilizzo di Databricks per l'Analisi dei Dati

Aggiornato ieri

Il connettore Databricks fornisce a Claude l'accesso ai dati interni della tua organizzazione attraverso Unity Catalog, consentendo l'analisi dei tuoi database, l'esecuzione di logica di business personalizzata e l'accesso a documenti non strutturati. Databricks fornisce tre connettori separati: uno per le funzioni, uno per la ricerca vettoriale e uno per Genie, ciascuno accedendo a diverse capacità all'interno del tuo workspace Databricks.

Promemoria sui Componenti Databricks

Prima di esplorare cosa Claude può fare con Databricks, è importante comprendere tre componenti fondamentali che esistono all'interno del tuo workspace Databricks:

  1. Funzioni Unity Catalog: Funzioni Python o SQL personalizzate create dalla tua organizzazione per calcoli specifici, trasformazioni di dati o integrazioni API. Potrebbero includere algoritmi di scoring proprietari, calcoli finanziari normalizzati o logica di elaborazione dati specifica del business.

  2. Vector Search: Indici di ricerca semantica costruiti sui documenti e dataset della tua organizzazione. Questi consentono di cercare contenuti concettualmente simili anche quando le parole chiave esatte non corrispondono.

  3. Genie: Un'interfaccia in linguaggio naturale che traduce domande in inglese semplice in query SQL sui tuoi dati. Genie utilizza metadati sulle tue tabelle e colonne per comprendere la terminologia di business e generare query appropriate.

Cosa Fornisce Questo Connettore

Capacità di Integrazione

Attraverso l'integrazione Databricks, Claude può accedere alle risorse nel tuo workspace:

  • Eseguire Funzioni Personalizzate: Claude può eseguire funzioni Unity Catalog definite dalla tua organizzazione. Questo include l'esecuzione di logica di business complessa, l'applicazione di calcoli o la chiamata di API esterne attraverso funzioni create dal tuo team. Ad esempio, se la tua organizzazione ha creato una funzione personalizzata di health score del cliente, Claude può applicarla in modo coerente in tutte le analisi.

  • Ricerca Semantica: Utilizzando indici di ricerca vettoriale, Claude può trovare documenti e contenuti rilevanti in base al significato piuttosto che solo alle parole chiave. Questo è particolarmente utile per cercare tra contratti, rapporti di ricerca, feedback dei clienti o documentazione tecnica dove concetti simili potrebbero essere espressi in modi diversi.

  • Query in Linguaggio Naturale: Attraverso Genie, Claude può tradurre domande in inglese semplice in query SQL. Invece di scrivere SQL complesso, puoi fare domande come "Qual è stata la nostra crescita dei ricavi lo scorso trimestre?" e Claude userà Genie per generare ed eseguire la query appropriata.

  • Accesso Governato: Tutto l'accesso ai dati attraverso il connettore rispetta i permessi e le politiche di Unity Catalog della tua organizzazione. Claude può accedere solo ai dati ed eseguire funzioni che il tuo account utente ha il permesso di utilizzare.

Come Claude Utilizza i Dati Databricks

Claude applica le capacità Databricks in diversi modi per supportare un'analisi dei dati completa:

  • Analisi Multi-Fonte: Claude combina risultati da query di database, ricerche vettoriali e funzioni personalizzate per fornire insight completi. Ad esempio, quando convalida una tesi di investimento, Claude potrebbe interrogare le prestazioni finanziarie storiche dal tuo database di portfolio, cercare tra i rapporti di due diligence passati per investimenti simili nel settore e applicare la tua funzione di calcolo IRR proprietaria per modellare i rendimenti attesi.

  • Esplorazione Iterativa: Claude può interrogare i dati, analizzare i risultati iniziali e affinare le ricerche in base ai risultati. Questo consente un'analisi in cui gli insight da una query informano la successiva.

  • Applicazione di Logica Personalizzata: Eseguendo funzioni Unity Catalog, Claude applica le regole e i calcoli specifici della tua organizzazione. Questo assicura che metriche proprietarie, calcoli aggiustati e logica specifica dell'azienda siano applicati uniformemente in tutte le analisi.

  • Costruzione di Query Contestuale: Quando fai domande in inglese semplice, Claude utilizza Genie per tradurle in query SQL appropriate. Questa traduzione considera le tue strutture di tabella, i nomi delle colonne e le relazioni per generare query accurate che corrispondono alla struttura del tuo database.

  • Riconoscimento di Modelli: Attraverso la ricerca vettoriale, Claude può trovare modelli e somiglianze tra documenti e dati. Questo aiuta a trovare problemi correlati, transazioni simili o situazioni comparabili che potrebbero non essere ovvie attraverso ricerche tradizionali per parole chiave.

Configurazione del Connettore Databricks

L'integrazione Databricks consiste di tre connettori separati, ciascuno richiedente una configurazione separata:

  1. Server Funzioni: Accede alle funzioni Unity Catalog per calcoli, logica di business e trasformazioni di dati.

  2. Server Vector Search: Abilita la ricerca semantica su documenti e dataset indicizzati.

  3. Server Genie: Fornisce capacità di traduzione da linguaggio naturale a query SQL.

I dettagli tecnici dei connettori Databricks si trovano nella Documentazione MCP Server di Databricks. L'autenticazione con i connettori Databricks è gestita tramite OAuth (per Claude.ai e Claude Desktop) o tramite un Token di Accesso Personale Databricks (solo per Claude Desktop).

Aggiunta del Connettore come Proprietario dell'Organizzazione

  1. Scorri verso il basso e fai clic su "Aggiungi connettore personalizzato" in fondo all'elenco.

  2. Inserisci l'URL di integrazione per il tuo workspace Databricks

  3. Assegna un nome all'integrazione. Ricorda che ci sono tre server Databricks separati, quindi considera di assegnare a ciascuno un nome univoco (ad es. "Databricks UC", "Databricks Genie", "Databricks Search")

  4. Fai clic su "Aggiungi"

Per Utenti Individuali

Hai ricevuto la risposta alla tua domanda?