본문으로 건너뛰기

데이터베이스 생성 및 관리

데이터베이스 생성

데이터베이스는 테이블을 저장하는 컨테이너입니다. 데이터베이스를 생성하려면 먼저 카탈로그가 생성되어 있어야 합니다.
생성한 카탈로그의 상태가 Running이 되면 카탈로그에 데이터베이스를 생성할 수 있습니다. Data Catalog 서비스에서 데이터베이스를 만드는 방법은 다음과 같습니다.

  1. 카카오클라우드 콘솔 > Analytics > Data Catalog 메뉴로 이동합니다.
  2. 데이터베이스 메뉴에서 [데이터베이스 생성] 버튼을 클릭합니다.
  3. 데이터베이스 생성 팝업창에서 아래 정보를 입력한 후, [생성] 버튼을 클릭합니다.
    구분설명
    유형데이터베이스 유형 선택
    - Standard 데이터베이스
    - Iceberg 데이터베이스
    카탈로그데이터베이스를 추가할 카탈로그 선택
    - 선택한 유형에 해당되는 카탈로그 목록만 제공
    이름데이터베이스 이름
    경로데이터베이스가 사용하는 Object Storage의 경로 입력
    - 버킷 선택: Object Storage 버킷 선택
    - 디렉터리: 버킷 하위 디렉터리 경로 입력

    * 참고 :
    - 데이터베이스 경로에 따라 하위 테이블의 경로 값이 참조됨
    - Hive, Spark, Trino를 사용하여 테이블 생성 시 경로를 설정하지 않을 경우, 테이블이 속한 데이터베이스 경로 하위에
    '{database location}/{table_name}'과 같이 자동으로 경로가 설정됨
    - 전체 경로는 s3a:// 형태로 세팅됨
    속성 (선택)데이터베이스 속성 추가
    설명 (선택)설명을 입력

데이터베이스 관리

Data Catalog 서비스에서 데이터베이스를 관리하는 방법은 다음과 같습니다.

데이터베이스 목록 보기

현재 생성된 데이터베이스 목록과 데이터베이스의 기본 정보를 확인할 수 있습니다.

  1. 카카오클라우드 콘솔 > Analytics > Data Catalog 메뉴로 이동합니다.

  2. 데이터베이스 메뉴를 클릭하고 데이터베이스 목록을 확인합니다.

    구분설명
    이름사용자가 지정한 데이터베이스의 이름
    연결된 카탈로그데이터베이스가 속한 카탈로그의 이름
    상태데이터베이스의 상태
    - 각 상태 값에 대한 자세한 설명은 리소스 상태 정보와 생명주기 참고
    유형데이터베이스 유형
    - Standard 데이터베이스 or Iceberg 데이터베이스
    경로데이터베이스가 위치한 경로
    생성 일시데이터베이스를 생성한 일자
    생성자데이터베이스를 생성자
    [더 보기] 아이콘- 데이터베이스 수정: 데이터베이스의 경로와 설명을 수정
    - 데이터베이스 삭제: 데이터베이스를 삭제
    * INACTIVE 상태의 경우, 단일 삭제만 가능하며 데이터베이스 수정 불가

데이터베이스 상세 보기

데이터베이스의 상세 정보를 확인할 수 있습니다.

  1. 카카오클라우드 콘솔 > Analytics > Data Catalog 메뉴로 이동합니다.

  2. 데이터베이스 메뉴에서 상세 정보를 확인할 데이터베이스를 선택합니다.

  3. 데이터베이스의 상세 페이지에서 정보를 확인합니다.

    요약 정보

    구분설명
    연결된 카탈로그데이터베이스와 연결된 카탈로그 이름
    ID데이터베이스 UUID
    유형데이터베이스 유형
    - Standard or Iceberg
    경로데이터베이스가 위치한 경로
    생성 일시데이터베이스를 생성한 일자

    기본 정보

    구분설명
    테이블 이름사용자가 생성한 테이블 이름
    설명사용자가 입력한 설명
    상태테이블의 상태
    - 각 상태 값에 대한 리소스 상태 정보와 생명주기 참고
    테이블 유형테이블 유형
    - Standard or Iceberg
    데이터 유형테이블의 데이터 유형

    Standard 테이블 유형
    - JSON, ORC, Parquet, CSV, Avro, text, custom
    ㄴ hadoop-eco에 의해서 생성된 후, 마이그레이션 된 테이블은 text, custom 유형으로 나타날 수 있음
    ㄴ text: SerDe 라이브러리가 org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe인 경우
    ㄴ custom: Avro, JSON, Parquet, ORC, CSV, text 유형 중 어디에도 속하지 않는 경우

    Iceberg 테이블 유형
    - Avro, Parquet, ORC
    데이터 저장 경로사용자가 생성한 테이블의 데이터 저장 경로
    최종 수정일테이블을 마지막으로 수정한 일자

데이터베이스 수정

데이터베이스 설정값은 경로와 설명만 수정할 수 있습니다. 데이터베이스 이름과 연결된 카탈로그는 수정할 수 없으며, 수정을 원할 경우에는 데이터베이스를 새로 생성해야 합니다.

  1. 카카오클라우드 콘솔 > Analytics > Data Catalog 메뉴로 이동합니다.

  2. 데이터베이스 메뉴에서 수정할 데이터베이스의 [더 보기] 아이콘 > 데이터베이스 수정을 선택합니다.

  3. 데이터베이스 수정 팝업창에서 정보를 수정하고 [수정] 버튼을 클릭합니다.

    구분설명
    경로(선택)데이터베이스가 위치한 경로 수정
    - 버킷 이름: Object Storage 버킷 선택
    - 디렉터리: 버킷 하위 디렉터리 경로 입력
    - 참고 : 전체 경로는 s3a:// 형태로 세팅됨
    설명(선택)데이터베이스의 설명을 수정
    - 단, Standard 데이터베이스 유형의 경우 수정이 불가함

데이터베이스 삭제

더 이상 사용하지 않는 데이터베이스는 삭제할 수 있습니다.

주의

삭제한 데이터베이스 리소스는 종료한 후 완전히 반납되어 복구할 수 없습니다.
데이터베이스 하위에 생성한 테이블도 데이터베이스 삭제와 동시에 함께 삭제되며 복구할 수 없습니다.

  1. 카카오클라우드 콘솔 > Analytics > Data Catalog 메뉴로 이동합니다.
  2. 데이터베이스 메뉴에서 삭제할 데이터베이스의 [더 보기] 아이콘 > 데이터베이스 삭제를 선택합니다.
    • 여러 개의 데이터베이스를 한꺼번에 삭제하려는 경우, 삭제할 데이터베이스 좌측의 체크박스를 선택한 후 하단의 [삭제] 버튼을 클릭합니다.
  3. 데이터베이스 삭제 팝업창에서 삭제할 데이터베이스를 확인한 후, 영구 삭제 또는 데이터베이스의 이름을 입력하고 [삭제] 버튼을 클릭합니다.