Databricksコネクタは、Unity Catalogを通じてClaudeに組織の内部データへのアクセスを提供し、データベースの分析、カスタムビジネスロジックの実行、および非構造化ドキュメントへのアクセスを可能にします。Databricksは3つの独立したコネクタを提供します。1つは関数用、1つはベクトル検索用、1つはGenie用で、それぞれがDatabricksワークスペース内の異なる機能にアクセスします。
Databricksコンポーネントの確認
ClaudeがDatabricksで何ができるかを探索する前に、Databricksワークスペース内に存在する3つのコアコンポーネントを理解することが重要です。
Unity Catalog関数:特定の計算、データ変換、またはAPI統合のために組織が作成したカスタムPythonまたはSQL関数。これらには、独自のスコアリングアルゴリズム、正規化された財務計算、またはビジネス固有のデータ処理ロジックが含まれる場合があります。
ベクトル検索:組織のドキュメントとデータセット上に構築されたセマンティック検索インデックス。これらにより、正確なキーワードが一致しない場合でも、概念的に類似したコンテンツを検索できます。
Genie:プレーンな英語の質問をデータに対するSQLクエリに変換する自然言語インターフェース。Genieはテーブルと列に関するメタデータを使用して、ビジネス用語を理解し、適切なクエリを生成します。
このコネクタが提供するもの
統合機能
Databricks統合を通じて、Claudeはワークスペース内のリソースにアクセスできます。
カスタム関数の実行:Claudeは組織によって定義されたUnity Catalog関数を実行できます。これには、複雑なビジネスロジックの実行、計算の適用、またはチームが作成した関数を通じた外部APIの呼び出しが含まれます。たとえば、組織がカスタム顧客ヘルススコア関数を構築している場合、Claudeは分析全体で一貫してそれを適用できます。
セマンティック検索:ベクトル検索インデックスを使用して、Claudeはキーワードだけでなく意味に基づいて関連するドキュメントとコンテンツを見つけることができます。これは、契約書、研究報告書、顧客フィードバック、または技術ドキュメントを検索する場合に特に有用です。類似の概念が異なる方法で表現される場合があります。
自然言語クエリ:Genieを通じて、Claudeはプレーンな英語の質問をSQLクエリに変換できます。複雑なSQLを記述する代わりに、「先四半期の売上成長率は?」のような質問をすることができ、ClaudeはGenieを使用して適切なクエリを生成して実行します。
管理されたアクセス:コネクタを通じたすべてのデータアクセスは、組織のUnity Catalogの権限とポリシーを尊重します。Claudeは、ユーザーアカウントがアクセス権を持つデータと関数のみにアクセスできます。
ClaudeがDatabricksデータを使用する方法
Claudeは包括的なデータ分析をサポートするために、複数の方法でDatabricks機能を適用します。
マルチソース分析:Claudeはデータベースクエリ、ベクトル検索、およびカスタム関数の結果を組み合わせて、包括的なインサイトを提供します。たとえば、投資テーゼを検証する場合、Claudeはポートフォリオデータベースから過去の財務パフォーマンスをクエリし、類似のセクター投資に関する過去のデューデリジェンスレポートを検索し、予想リターンをモデル化するために独自のIRR計算関数を適用する場合があります。
反復的な探索:Claudeはデータをクエリし、初期結果を分析し、調査結果に基づいて検索を絞り込むことができます。これにより、1つのクエリからのインサイトが次のクエリに情報を提供する分析が可能になります。
カスタムロジックの適用:Unity Catalog関数を実行することにより、Claudeは組織の特定のルールと計算を適用します。これにより、独自のメトリクス、調整された計算、および会社固有のロジックがすべての分析全体で均一に適用されることが保証されます。
コンテキストに応じたクエリ構築:プレーンな英語で質問をすると、ClaudeはGenieを使用してそれを適切なSQLクエリに変換します。この変換は、テーブル構造、列名、および関係を考慮して、データベース構造に一致する正確なクエリを生成します。
パターン認識:ベクトル検索を通じて、Claudeはドキュメントとデータ全体のパターンと類似性を見つけることができます。これは、関連する問題、類似したトランザクション、または従来のキーワード検索では明らかでない可能性のある比較可能な状況を見つけるのに役立ちます。
Databricksコネクタの設定
Databricks統合は3つの独立したコネクタで構成され、それぞれ個別のセットアップが必要です。
関数サーバー:計算、ビジネスロジック、およびデータ変換のためのUnity Catalog関数にアクセスします。
ベクトル検索サーバー:インデックス付きドキュメントとデータセット全体のセマンティック検索を有効にします。
Genieサーバー:自然言語からSQLクエリへの変換機能を提供します。
Databricksコネクタの技術詳細は、DatabricksのMCPサーバードキュメントに記載されています。Databricksコネクタとの認証は、OAuth(Claude.aiおよびClaude Desktopの場合)またはDatabricks個人アクセストークン(Claude Desktopのみ)を通じて処理されます。
