데이터베이스 생성 및 관리
데이터베이스 생성
데이터베이스는 테이블을 저장하는 컨테이너입니다. 데이터베이스를 생성하려면 먼저 카탈로그가 생성되어 있어야 합니다.
생성한 카탈로그의 상태가 Running이 되면 카탈로그에 데이터베이스를 생성할 수 있습니다.
Data Catalog 서비스에서 데이터베이스를 만드는 방법은 다음과 같습니다.
- 카카오클라우드 콘솔 > Analytics > Data Catalog 메뉴로 이동합니다.
- 데이터베이스 메뉴에서 [데이터베이스 생성] 버튼을 클릭합니다.
- 데이터베이스 생성 팝업창에서 아래 정보를 입력한 후, [생성] 버튼을 클릭합니다.
구분 설명 유형 데이터베이스 유형 선택
-Standard 데이터베이스
-Iceberg 데이터베이스
카탈로그 데이터베이스를 추가할 카탈로그 선택
- 선택한 유형에 해당되는 카탈로그 목록만 제공이름 데이터베이스 이름 경로 데이터베이스가 사용하는 Object Storage의 경로 입력
- 버킷 선택: Object Storage 버킷 선택
- 디렉터리: 버킷 하위 디렉터리 경로 입력
* 참고 :
- 데이터베이스 경로에 따라 하위 테이블의 경로 값이 참조됨
- Hive, Spark, Trino를 사용하여 테이블 생성 시 경로를 설정하지 않을 경우, 테이블이 속한 데이터베이스 경로 하위에
'{database location}/{table_name}'과 같이 자동으로 경로가 설정됨
- 전체 경로는s3a://
형태로 세팅됨속성 (선택) 데이터베이스 속성 추가 설명 (선택) 설명을 입력
데이터베이스 관리
Data Catalog 서비스에서 데이터베이스를 관리하는 방법은 다음과 같습니다.
데이터베이스 목록 보기
현재 생성된 데이터베이스 목록과 데이터베이스의 기본 정보를 확인할 수 있습니다.
-
카카오클라우드 콘솔 > Analytics > Data Catalog 메뉴로 이동합니다.
-
데이터베이스 메뉴를 클릭하고 데이터베이스 목록을 확인합니다.
구분 설명 이름 사용자가 지정한 데이터베이스의 이름 연결된 카탈로그 데이터베이스가 속한 카탈로그의 이름 상태 데이터베이스의 상태
- 각 상태 값에 대한 자세한 설명은 리소스 상태 정보와 생명주기 참고유형 데이터베이스 유형
-Standard 데이터베이스
orIceberg 데이터베이스
경로 데이터베이스가 위치한 경로 생성 일시 데이터베이스를 생성한 일자 생성자 데이터베이스를 생성자 [더 보기] 아이콘 - 데이터베이스 수정: 데이터베이스의 경로와 설명을 수정
- 데이터베이스 삭제: 데이터베이스를 삭제
*INACTIVE
상태의 경우, 단일 삭제만 가능하며 데이터베이스 수정 불가
데이터베이스 상세 보기
데이터베이스의 상세 정보를 확인할 수 있습니다.
-
카카오클라우드 콘솔 > Analytics > Data Catalog 메뉴로 이동합니다.
-
데이터베이스 메뉴에서 상세 정보를 확인할 데이터베이스를 선택합니다.
-
데이터베이스의 상세 페이지에서 정보를 확인합니다.
요약 정보
구분 설명 연결된 카탈로그 데이터베이스와 연결된 카탈로그 이름 ID 데이터베이스 UUID 유형 데이터베이스 유형
-Standard
orIceberg
경로 데이터베이스가 위치한 경로 생성 일시 데이터베이스를 생성한 일자 기본 정보
구분 설명 테이블 이름 사용자가 생성한 테이블 이름 설명 사용자가 입력한 설명 상태 테이블의 상태
- 각 상태 값에 대한 리소스 상태 정보와 생명주기 참고테이블 유형 테이블 유형
-Standard
orIceberg
데이터 유형 테이블의 데이터 유형
Standard 테이블 유형
- JSON, ORC, Parquet, CSV, Avro, text, custom
ㄴ hadoop-eco에 의해서 생성된 후, 마이그레이션 된 테이블은 text, custom 유형으로 나타날 수 있음
ㄴ text: SerDe 라이브러리가org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe
인 경우
ㄴ custom: Avro, JSON, Parquet, ORC, CSV, text 유형 중 어디에도 속하지 않는 경우
Iceberg 테이블 유형
- Avro, Parquet, ORC데이터 저장 경로 사용자가 생성한 테이블의 데이터 저장 경로 최종 수정일 테이블을 마지막으로 수정한 일자
데이터베이스 수정
데이터베이스 설정값은 경로와 설명만 수정할 수 있습니다. 데이터베이스 이름과 연결된 카탈로그는 수정할 수 없으며, 수정을 원할 경우에는 데이터베이스를 새로 생성해야 합니다.
-
카카오클라우드 콘솔 > Analytics > Data Catalog 메뉴로 이동합니다.
-
데이터베이스 메뉴에서 수정할 데이터베이스의 [더 보기] 아이콘 > 데이터베이스 수정을 선택합니다.
-
데이터베이스 수정 팝업창에서 정보를 수정하고 [수정] 버튼을 클릭합니다.
구분 설명 경로(선택) 데이터베이스가 위치한 경로 수정
- 버킷 이름: Object Storage 버킷 선택
- 디렉터리: 버킷 하위 디렉터리 경로 입력
- 참고 : 전체 경로는s3a://
형태로 세팅됨설명(선택) 데이터베이스의 설명을 수정
- 단,Standard 데이터베이스
유형의 경우 수정이 불가함
데이터베이스 삭제
더 이상 사용하지 않는 데이터베이스는 삭제할 수 있습니다.
삭제한 데이터베이스 리소스는 종료한 후 완전히 반납되어 복구할 수 없습니다.
데이터베이스 하위에 생성한 테이블도 데이터베이스 삭제와 동시에 함께 삭제되며 복구할 수 없습니다.
- 카카오클라우드 콘솔 > Analytics > Data Catalog 메뉴로 이동합니다.
- 데이터베이스 메뉴에서 삭제할 데이터베이스의 [더 보기] 아이콘 > 데이터베이스 삭제를 선택합니다.
- 여러 개의 데이터베이스를 한꺼번에 삭제하려는 경우, 삭제할 데이터베이스 좌측의 체크박스를 선택한 후 하단의 [삭제] 버튼을 클릭합니다.
- 데이터베이스 삭제 팝업창에서 삭제할 데이터베이스를 확인한 후,
영구 삭제
또는 데이터베이스의 이름을 입력하고 [삭제] 버튼을 클릭합니다.