메인 콘텐츠로 건너뛰기

데이터 분석을 위한 Databricks 사용하기

이번 주에 업데이트함

Databricks 커넥터는 Claude가 Unity Catalog을 통해 조직의 내부 데이터에 액세스할 수 있도록 하여 데이터베이스 분석, 맞춤형 비즈니스 로직 실행, 비정형 문서 액세스를 가능하게 합니다. Databricks는 세 가지 별도의 커넥터를 제공합니다: 함수용 커넥터, 벡터 검색용 커넥터, Genie용 커넥터로, 각각 Databricks 워크스페이스 내의 서로 다른 기능에 액세스합니다.

Databricks 구성 요소 안내

Claude가 Databricks로 무엇을 할 수 있는지 살펴보기 전에, Databricks 워크스페이스 내에 존재하는 세 가지 핵심 구성 요소를 이해하는 것이 중요합니다:

  1. Unity Catalog Functions: 조직이 특정 계산, 데이터 변환 또는 API 통합을 위해 생성한 맞춤형 Python 또는 SQL 함수입니다. 여기에는 독점 점수 알고리즘, 정규화된 재무 계산 또는 비즈니스별 데이터 처리 로직이 포함될 수 있습니다.

  2. Vector Search: 조직의 문서 및 데이터셋을 기반으로 구축된 의미론적 검색 인덱스입니다. 정확한 키워드가 일치하지 않더라도 개념적으로 유사한 콘텐츠를 검색할 수 있습니다.

  3. Genie: 일반 영어 질문을 데이터에 대한 SQL 쿼리로 변환하는 자연어 인터페이스입니다. Genie는 테이블과 열에 대한 메타데이터를 사용하여 비즈니스 용어를 이해하고 적절한 쿼리를 생성합니다.

이 커넥터가 제공하는 기능

통합 기능

Databricks 통합을 통해 Claude는 워크스페이스의 리소스에 액세스할 수 있습니다:

  • 맞춤형 함수 실행: Claude는 조직에서 정의한 Unity Catalog 함수를 실행할 수 있습니다. 여기에는 복잡한 비즈니스 로직 실행, 계산 적용 또는 팀이 생성한 함수를 통한 외부 API 호출이 포함됩니다. 예를 들어, 조직에서 맞춤형 고객 건강 점수 함수를 구축한 경우 Claude는 이를 분석 전반에 걸쳐 일관되게 적용할 수 있습니다.

  • 의미론적 검색: 벡터 검색 인덱스를 사용하여 Claude는 키워드뿐만 아니라 의미를 기반으로 관련 문서와 콘텐츠를 찾을 수 있습니다. 이는 유사한 개념이 다른 방식으로 표현될 수 있는 계약서, 연구 보고서, 고객 피드백 또는 기술 문서를 검색하는 데 특히 유용합니다.

  • 자연어 쿼리: Genie를 통해 Claude는 일반 영어 질문을 SQL 쿼리로 변환할 수 있습니다. 복잡한 SQL을 작성하는 대신 "지난 분기 우리의 매출 성장률은 얼마였나요?"와 같은 질문을 할 수 있으며, Claude는 Genie를 사용하여 적절한 쿼리를 생성하고 실행합니다.

  • 관리되는 액세스: 커넥터를 통한 모든 데이터 액세스는 조직의 Unity Catalog 권한 및 정책을 준수합니다. Claude는 사용자 계정이 사용할 권한이 있는 데이터에만 액세스하고 함수를 실행할 수 있습니다.

Claude가 Databricks 데이터를 사용하는 방법

Claude는 포괄적인 데이터 분석을 지원하기 위해 여러 가지 방식으로 Databricks 기능을 적용합니다:

  • 다중 소스 분석: Claude는 데이터베이스 쿼리, 벡터 검색 및 맞춤형 함수의 결과를 결합하여 포괄적인 인사이트를 제공합니다. 예를 들어, 투자 논제를 검증할 때 Claude는 포트폴리오 데이터베이스에서 과거 재무 성과를 쿼리하고, 유사한 섹터 투자에 대한 과거 실사 보고서를 검색하며, 독점 IRR 계산 함수를 적용하여 예상 수익을 모델링할 수 있습니다.

  • 반복적 탐색: Claude는 데이터를 쿼리하고, 초기 결과를 분석하며, 발견 사항을 기반으로 검색을 개선할 수 있습니다. 이를 통해 한 쿼리의 인사이트가 다음 쿼리에 정보를 제공하는 분석이 가능합니다.

  • 맞춤형 로직 적용: Unity Catalog 함수를 실행함으로써 Claude는 조직의 특정 규칙과 계산을 적용합니다. 이를 통해 독점 메트릭, 조정된 계산 및 회사별 로직이 모든 분석에 균일하게 적용됩니다.

  • 맥락적 쿼리 구축: 일반 영어로 질문하면 Claude는 Genie를 사용하여 이를 적절한 SQL 쿼리로 변환합니다. 이 변환은 테이블 구조, 열 이름 및 관계를 고려하여 데이터베이스 구조와 일치하는 정확한 쿼리를 생성합니다.

  • 패턴 인식: 벡터 검색을 통해 Claude는 문서와 데이터 전반에 걸쳐 패턴과 유사성을 찾을 수 있습니다. 이는 기존 키워드 검색으로는 명확하지 않을 수 있는 관련 문제, 유사한 거래 또는 비교 가능한 상황을 찾는 데 도움이 됩니다.

Databricks 커넥터 설정

Databricks 통합은 세 가지 별도의 커넥터로 구성되며, 각각 별도의 설정이 필요합니다:

  1. Functions Server: 계산, 비즈니스 로직 및 데이터 변환을 위한 Unity Catalog 함수에 액세스합니다.

  2. Vector Search Server

답변이 도움되었나요?