Lewati ke konten utama

Menggunakan Databricks untuk Analisis Data

Diperbarui kemarin

Konektor Databricks memberikan Claude akses ke data internal organisasi Anda melalui Unity Catalog, memungkinkan analisis database Anda, menjalankan logika bisnis khusus, dan mengakses dokumen tidak terstruktur. Databricks menyediakan tiga konektor terpisah: satu untuk fungsi, satu untuk pencarian vektor, dan satu untuk Genie, masing-masing mengakses kemampuan berbeda dalam workspace Databricks Anda.

Pengingat tentang Komponen Databricks

Sebelum mengeksplorasi apa yang dapat dilakukan Claude dengan Databricks, penting untuk memahami tiga komponen inti yang ada dalam workspace Databricks Anda:

  1. Unity Catalog Functions: Fungsi Python atau SQL khusus yang telah dibuat organisasi Anda untuk perhitungan spesifik, transformasi data, atau integrasi API. Ini mungkin termasuk algoritma penilaian proprietary, perhitungan keuangan yang dinormalisasi, atau logika pemrosesan data khusus bisnis.

  2. Vector Search: Indeks pencarian semantik yang dibangun di atas dokumen dan dataset organisasi Anda. Ini memungkinkan pencarian konten yang secara konseptual serupa bahkan ketika kata kunci yang tepat tidak cocok.

  3. Genie: Antarmuka bahasa alami yang menerjemahkan pertanyaan bahasa Inggris biasa ke dalam kueri SQL terhadap data Anda. Genie menggunakan metadata tentang tabel dan kolom Anda untuk memahami terminologi bisnis dan menghasilkan kueri yang sesuai.

Apa yang Disediakan Konektor Ini

Kemampuan Integrasi

Melalui integrasi Databricks, Claude dapat mengakses sumber daya di workspace Anda:

  • Jalankan Fungsi Khusus: Claude dapat menjalankan fungsi Unity Catalog yang ditentukan oleh organisasi Anda. Ini termasuk menjalankan logika bisnis kompleks, menerapkan perhitungan, atau memanggil API eksternal melalui fungsi yang telah dibuat tim Anda. Misalnya, jika organisasi Anda telah membangun fungsi skor kesehatan pelanggan khusus, Claude dapat menerapkannya secara konsisten di seluruh analisis.

  • Pencarian Semantik: Menggunakan indeks pencarian vektor, Claude dapat menemukan dokumen dan konten yang relevan berdasarkan makna daripada hanya kata kunci. Ini sangat berguna untuk mencari kontrak, laporan penelitian, umpan balik pelanggan, atau dokumentasi teknis di mana konsep serupa mungkin diekspresikan dengan cara yang berbeda.

  • Kueri Bahasa Alami: Melalui Genie, Claude dapat menerjemahkan pertanyaan bahasa Inggris biasa ke dalam kueri SQL. Alih-alih menulis SQL yang kompleks, Anda dapat mengajukan pertanyaan seperti "Berapa pertumbuhan pendapatan kami kuartal lalu?" dan Claude akan menggunakan Genie untuk menghasilkan dan menjalankan kueri yang sesuai.

  • Akses yang Diatur: Semua akses data melalui konektor menghormati izin dan kebijakan Unity Catalog organisasi Anda. Claude hanya dapat mengakses data dan menjalankan fungsi yang memiliki izin akun pengguna Anda.

Bagaimana Claude Menggunakan Data Databricks

Claude menerapkan kemampuan Databricks dalam beberapa cara untuk mendukung analisis data yang komprehensif:

  • Analisis Multi-Sumber: Claude menggabungkan hasil dari kueri database, pencarian vektor, dan fungsi khusus untuk memberikan wawasan komprehensif. Misalnya, saat memvalidasi tesis investasi, Claude mungkin menanyakan kinerja keuangan historis dari database portfolio Anda, mencari laporan due diligence sebelumnya untuk investasi sektor serupa, dan menerapkan fungsi perhitungan IRR proprietary Anda untuk memodelkan pengembalian yang diharapkan.

  • Eksplorasi Iteratif: Claude dapat menanyakan data, menganalisis hasil awal, dan menyempurnakan pencarian berdasarkan temuan. Ini memungkinkan analisis di mana wawasan dari satu kueri menginformasikan kueri berikutnya.

  • Penerapan Logika Khusus: Dengan menjalankan fungsi Unity Catalog, Claude menerapkan aturan dan perhitungan spesifik organisasi Anda. Ini memastikan bahwa metrik proprietary, perhitungan yang disesuaikan, dan logika khusus perusahaan diterapkan secara seragam di seluruh semua analisis.

  • Pembangunan Kueri Kontekstual: Ketika Anda mengajukan pertanyaan dalam bahasa Inggris biasa, Claude menggunakan Genie untuk menerjemahkannya ke dalam kueri SQL yang sesuai. Penerjemahan ini mempertimbangkan struktur tabel Anda, nama kolom, dan hubungan untuk menghasilkan kueri akurat yang sesuai dengan struktur database Anda.

  • Pengenalan Pola: Melalui pencarian vektor, Claude dapat menemukan pola dan kesamaan di seluruh dokumen dan data. Ini membantu dalam menemukan masalah terkait, transaksi serupa, atau situasi yang sebanding yang mungkin tidak jelas melalui pencarian kata kunci tradisional.

Menyiapkan Konektor Databricks

Integrasi Databricks terdiri dari tiga konektor terpisah, masing-masing memerlukan penyiapan terpisah:

  1. Functions Server: Mengakses fungsi Unity Catalog untuk perhitungan, logika bisnis, dan transformasi data.

  2. Vector Search Server: Memungkinkan pencarian semantik di seluruh dokumen dan dataset yang diindeks.

  3. Genie Server: Menyediakan kemampuan terjemahan kueri bahasa alami ke SQL.

Detail teknis konektor Databricks dapat ditemukan di Dokumentasi MCP Server Databricks. Autentikasi dengan konektor Databricks ditangani melalui OAuth (untuk Claude.ai dan Claude Desktop) atau melalui Databricks Personal Access Token (hanya untuk Claude Desktop).

Menambahkan Konektor sebagai Pemilik Organisasi

  1. Gulir ke bawah dan klik "Add custom connector" di bagian bawah daftar.

  2. Masukkan URL integrasi untuk workspace Databricks Anda

  3. Beri nama integrasi. Ingat bahwa ada tiga server Databricks terpisah, jadi pertimbangkan untuk memberi nama setiap server secara unik (misalnya, "Databricks UC", "

Apakah pertanyaan Anda terjawab?