Ir al contenido principal

Uso de Databricks para Análisis de Datos

Actualizado ayer

El conector de Databricks proporciona a Claude acceso a los datos internos de su organización a través de Unity Catalog, permitiendo el análisis de sus bases de datos, la ejecución de lógica empresarial personalizada y el acceso a documentos no estructurados. Databricks proporciona tres conectores separados: uno para funciones, uno para búsqueda vectorial y uno para Genie, cada uno accediendo a diferentes capacidades dentro de su espacio de trabajo de Databricks.

Recordatorio sobre componentes de Databricks

Antes de explorar lo que Claude puede hacer con Databricks, es importante entender tres componentes principales que existen dentro de su espacio de trabajo de Databricks:

  1. Funciones de Unity Catalog: Funciones personalizadas de Python o SQL que su organización ha creado para cálculos específicos, transformaciones de datos o integraciones de API. Estos podrían incluir algoritmos de puntuación propietarios, cálculos financieros normalizados o lógica de procesamiento de datos específica del negocio.

  2. Búsqueda Vectorial: Índices de búsqueda semántica construidos sobre los documentos y conjuntos de datos de su organización. Estos permiten buscar contenido conceptualmente similar incluso cuando las palabras clave exactas no coinciden.

  3. Genie: Una interfaz de lenguaje natural que traduce preguntas en inglés simple a consultas SQL contra sus datos. Genie utiliza metadatos sobre sus tablas y columnas para entender la terminología empresarial y generar consultas apropiadas.

Lo que proporciona este conector

Capacidades de integración

A través de la integración de Databricks, Claude puede acceder a recursos en su espacio de trabajo:

  • Ejecutar funciones personalizadas: Claude puede ejecutar funciones de Unity Catalog definidas por su organización. Esto incluye ejecutar lógica empresarial compleja, aplicar cálculos o llamar a API externas a través de funciones que su equipo ha creado. Por ejemplo, si su organización ha construido una función personalizada de puntuación de salud del cliente, Claude puede aplicarla consistentemente en todos los análisis.

  • Búsqueda semántica: Utilizando índices de búsqueda vectorial, Claude puede encontrar documentos y contenido relevantes basados en el significado en lugar de solo palabras clave. Esto es particularmente útil para buscar en contratos, informes de investigación, comentarios de clientes o documentación técnica donde conceptos similares podrían expresarse de diferentes maneras.

  • Consultas en lenguaje natural: A través de Genie, Claude puede traducir preguntas en inglés simple a consultas SQL. En lugar de escribir SQL complejo, puede hacer preguntas como "¿Cuál fue nuestro crecimiento de ingresos el trimestre pasado?" y Claude usará Genie para generar y ejecutar la consulta apropiada.

  • Acceso gobernado: Todo acceso a datos a través del conector respeta los permisos y políticas de Unity Catalog de su organización. Claude solo puede acceder a datos y ejecutar funciones que su cuenta de usuario tiene permiso para usar.

Cómo Claude utiliza datos de Databricks

Claude aplica capacidades de Databricks de varias maneras para apoyar análisis de datos integral:

  • Análisis de múltiples fuentes: Claude combina resultados de consultas de base de datos, búsquedas vectoriales y funciones personalizadas para proporcionar información integral. Por ejemplo, al validar una tesis de inversión, Claude podría consultar el desempeño financiero histórico de su base de datos de cartera, buscar en informes de diligencia debida anteriores inversiones de sectores similares y aplicar su función de cálculo de TIR propietaria para modelar rendimientos esperados.

  • Exploración iterativa: Claude puede consultar datos, analizar resultados iniciales y refinar búsquedas basadas en hallazgos. Esto permite análisis donde los conocimientos de una consulta informan la siguiente.

  • Aplicación de lógica personalizada: Al ejecutar funciones de Unity Catalog, Claude aplica las reglas y cálculos específicos de su organización. Esto asegura que las métricas propietarias, cálculos ajustados y lógica específica de la empresa se apliquen uniformemente en todos los análisis.

  • Construcción de consultas contextual: Cuando hace preguntas en inglés simple, Claude usa Genie para traducirlas a consultas SQL apropiadas. Esta traducción considera sus estructuras de tabla, nombres de columnas y relaciones para generar consultas precisas que coincidan con su estructura de base de datos.

  • Reconocimiento de patrones: A través de búsqueda vectorial, Claude puede encontrar patrones y similitudes en documentos y datos. Esto ayuda a encontrar problemas relacionados, transacciones similares o situaciones comparables que podrían no ser obvias a través de búsquedas tradicionales por palabras clave.

Configuración del conector de Databricks

La integración de Databricks consta de tres conectores separados, cada uno requiere configuración separada:

  1. Servidor de funciones: Accede a funciones de Unity Catalog para cálculos, lógica empresarial y transformaciones de datos.

  2. Servidor de búsqueda vectorial: Habilita búsqueda semántica en documentos y conjuntos de datos indexados.

  3. Servidor Genie: Proporciona capacidades de traducción de lenguaje natural a consultas SQL.

Los detalles técnicos de los conectores de Databricks se pueden encontrar en la documentación del servidor MCP de Databricks. La autenticación con los conectores de Databricks se maneja a través de OAuth (para Claude.ai y Claude Desktop) o a través de un token de acceso personal de Databricks (solo para Claude Desktop).

Agregar el conector como propietario de la organización

  1. Desplácese hacia abajo y haga clic en "Agregar conector personalizado" en la parte inferior de la lista.

  2. Ingrese la URL de integración para su espacio de trabajo de Databricks

  3. Nombre la integración. Recuerde que hay tres servidores de Databricks separados, así que considere nombrar cada uno de manera única (por ejemplo, "Databricks UC", "Databricks Genie", "Databricks Search")

  4. Haga clic en "Agregar"

Para usuarios individuales

Obtenga más información sobre cómo encontrar y conectar herramientas.

Casos de uso com

¿Ha quedado contestada tu pregunta?