데이터베이스 생성 및 관리
데이터베이스는 테이블을 저장하는 논리적 컨테이너입니다. 카탈로그 하위에 데이터베이스를 생성하여 테이블을 체계적으로 관리할 수 있습니다. 이 문서에서는 데이터베이스 생성, 조회, 수정, 삭제 방법을 설명합니다.
데이터베이스 생성
데이터베이스를 생성하려면 먼저 카탈로그가 생성되어 있어야 하며, 카탈로그 상태가 Running이어야 합니다.
-
카카오클라우드 콘솔 > Analytics > Data Catalog로 이동합니다.
-
데이터베이스 메뉴에서 [데이터베이스 생성] 버튼을 클릭합니다.
-
팝업창에서 아래 정보를 입력한 후, [생성] 버튼을 클릭합니다.
구분 설명 유형 데이터베이스 유형 선택
-Standard 데이터베이스
-Iceberg 데이터베이스카탈로그 데이터베이스를 추가할 카탈로그 선택
- 선택한 유형과 동일한 유형의 카탈로그만 표시이름 데이터베이스 이름 경로 데이터베이스가 사용하는 Object Storage의 경로 입력
- 버킷 선택: Object Storage 버킷 선택
- 디렉터리: 버킷 하위 디렉터리 경로 입력
* 참고 :
- 데이터베이스 경로에 따라 하위 테이블의 경로 값이 참조됨
- Hive, Spark, Trino를 사용하여 테이블 생성 시 경로를 설정하지 않을 경우, 테이블이 속한 데이터베이스 경로 하위에{database location}/{table_name}과 같이 자동으로 경로가 설정됨
- 전체 경로는s3a://형태로 저장속성 (선택) 데이터베이스 속성 설명 (선택) 데이터베이스에 대한 설명
데이터베이스 목록 조회
현재 생성된 데이터베이스 목록과 데이터베이스의 기본 정보를 확인할 수 있습니다.
-
카카오클라우드 콘솔 > Analytics > Data Catalog로 이동합니다.
-
데이터베이스 메뉴를 클릭하고 데이터베이스 목록을 확인합니다.
구분 설명 이름 사용자가 지정한 데이터베이스의 이름 연결된 카탈로그 데이터베이스가 속한 카탈로그의 이름 상태 데이터베이스의 상태
- 각 상태 값에 대한 자세한 설명은 리소스 상태 정보와 생명주기 참고유형 데이터베이스 유형
-Standard 데이터베이스또는Iceberg 데이터베이스경로 데이터베이스가 위치한 경로 생성 일시 데이터베이스를 생성한 일자 생성자 데이터베이스 생성자 [⋮] 버튼 데이터베이스 수정, 삭제
데이터베이스 상세 조회
데이터베이스의 상세 정보를 확인할 수 있습니다.
-
카카오클라우드 콘솔 > Analytics > Data Catalog로 이동합니다.
-
데이터베이스 메뉴에서 상세 정보를 확인할 데이터베이스를 선택합니다.
-
데이터베이스의 상세 정보를 확인합니다.
요약 정보
구분 설명 상태 데이터베이스 상태 유형 데이터베이스 유형
-StandardorIceberg연결된 카탈로그 데이터베이스와 연결된 카탈로그 이름 ID 데이터베이스 UUID 경로 데이터베이스가 위치한 경로 생성 일시 데이터베이스를 생성한 일자
상세 정보
데이터베이스에 소속된 테이블과 데이터베이스 속성을 조회, 생성, 관리할 수 있습니다.
- 테이블
- 데이터베이스 속성
구분 설명 테이블 이름 사용자가 생성한 테이블 이름 설명 사용자가 입력한 설명 상태 테이블의 상태
- 각 상태 값에 대한 리소스 상태 정보와 생명주기 참고테이블 유형 테이블 유형
-StandardorIceberg데이터 유형 테이블의 데이터 유형
Standard 테이블 유형
- JSON, ORC, Parquet, CSV, Avro, text, custom
ㄴ hadoop-eco에 의해서 생성된 후, 마이그레이션 된 테이블은 text, custom 유형으로 나타날 수 있음
ㄴ text: SerDe 라이브러리가org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe인 경우
ㄴ custom: Avro, JSON, Parquet, ORC, CSV, text 유형 중 어디에도 속하지 않는 경우
Iceberg 테이블 유형
- Avro, Parquet, ORC데이터 저장 경로 사용자가 생성한 테이블의 데이터 저장 경로 최종 수정일 테이블을 마지막으로 수정한 일자 구분 설명 키 사용자 정의 데이터베이스 속성의 키 값 사용자 정의 데이터베이스 속성의 값 안내- 데이터베이스 속성 삭제 기능은 Iceberg 데이터베이스에서만 지원됩니다.
- Iceberg 데이터베이스 유형의 데이터베이스 속성 중
location은 데이터베이스 생성시 입력되었던 경로의 값과 동일합니다. 또한 해당 속성 수정시 데이터베이스의 경로 역시 수정되면 반대로 데이터베이스 경로 수정시에도 해당 속성이 함께 수정됩니다.
데이터베이스 수정
데이터베이스 설정값은 경로와 설명만 수정할 수 있습니다. 데이터베이스 이름과 연결된 카탈로그는 수정할 수 없으며, 변경이 필요한 경우에는 데이터베이스를 새로 생성해야 합니다.
-
카카오클라우드 콘솔 > Analytics > Data Catalog로 이동합니다.
-
데이터베이스 메뉴에서 수정할 데이터베이스의 [⋮] 버튼 > 데이터베이스 수정을 선택합니다.
-
데이터베이스 수정 팝업창에서 정보를 수정하고 [수정] 버튼을 클릭합니다.
구분 설명 경로(선택) 데이터베이스가 위치한 경로 수정
- 버킷 이름: Object Storage 버킷 선택
- 디렉터리: 버킷 하위 디렉터리 경로 입력
* 참고 : 전체 경로는s3a://형태로 저장설명(선택) 데이터베이스의 설명을 수정
- 단,Standard 데이터베이스유형의 경우 수정 불가
데이터베이스 삭제
더 이상 사용하지 않는 데이터베이스는 삭제할 수 있습니다.
삭제한 데이터베이스 리소스는 종료한 후 완전히 반납되어 복구할 수 없습니다.
데이터베이스 하위에 생성한 테이블도 데이터베이스 삭제와 동시에 함께 삭제되며 복구할 수 없습니다.
- 카카오클라우드 콘솔 > Analytics > Data Catalog로 이동합니다.
- 데이터베이스 메뉴에서 삭제할 데이터베이스의 [⋮] 버튼 > 데이터베이스 삭제를 선택합니다.
- 데이터베이스 삭제 팝업창에서 삭제할 데이터베이스를 확인한 후,
영구 삭제또는 데이터베이스의 이름을 입력하고 [삭제] 버튼을 클릭합니다.