주요 개념
카탈로그
카탈로그는 Data Catalog에서 사용자 데이터의 메타데이터를 저장하고 관리하는 중앙 리포지토리입니다.
- 사용자 네트워크가 다른 카탈로그 간에는 메타데이터가 공유되지 않습니다.
- Data Catalog를 활성화하면 사용자는 VPC(Subnet)를 지정해서 카탈로그를 생성할 수 있습니다.
- 카탈로그는 고가용성(HA)으로 운영됩니다.
- 사용자는 카탈로그에 소유한 데이터의 테이블 정의와 저장 경로 같은 메타데이터를 저장하고, 수정하며, 삭제할 수 있습니다.
- 카탈로그는 Apache Hive Metastore와 호환됩니다.
데이터베이스
Data Catalog의 데이터베이스는 테이블을 저장하는 컨테이너입니다.
- 데이터베이스는 메타데이터 테이블을 구성하는 데 사용됩니다.
- 테이블은 하나의 데이터베이스에만 속할 수 있습니다.
- 카카오클라우드 콘솔의 데이터베이스 목록에서는 프로젝트에 속한 모든 데이터베이스를 볼 수 있습니다.
테이블
Data Catalog에서 테이블은 데이터 스토어의 데이터를 표현하는 메타데이터입니다. 카카오클라우드 콘솔에서 테이블을 생성할 수 있으며, 콘솔의 테이블 목록에는 테이블의 메타데이터 값이 표시됩니다.
- 테이블은 스키마, 파티션, 테이블 속성 등 하위 메타데이터를 포함합니다.