데이터베이스 생성 및 관리
데이터베이스 생성
데이터베이스는 테이블을 저장하는 컨테이너입니다. 데이터베이스를 생성하려면 먼저 카탈로그가 생성되어 있어야 합니다.
생성한 카탈로그의 상태가 Running이 되면 카탈로그에 데이터베이스를 생성할 수 있습니다.
Data Catalog 서비스에서 데이터베이스를 만드는 방법은 다음과 같습니다.
- 카카오클라우드 콘솔 > Analytics > Data Catalog 메뉴로 이동합니다.
- 데이터베이스 메뉴에서 [데이터베이스 생성] 버튼을 클릭합니다.
- 데이터베이스 생성 팝업창에서 아래 정보를 입력한 후, [생성] 버튼을 클릭합니다.
구분 설명 카탈로그 데이터베이스를 추가할 카탈로그 선택 이름 데이터베이스 이름 경로 데이터베이스가 사용하는 Object Storage의 경로 입력 (데이터베이스 경로에 따라 하위 테이블의 경로 값이 참조됨)
- s3 연결: 선택 시 전체 경로는s3a://
형태로 세팅되며, 미선택 시swifta
형태로 세팅
- 버킷 이름: Object Storage 버킷 이름 입력
- 디렉터리: 버킷 하위 디렉터리 경로 입력설명 (선택) 설명을 입력
데이터베이스 관리
Data Catalog 서비스에서 데이터베이스를 관리하는 방법은 다음과 같습니다.
데이터베이스 목록 보기
현재 생성된 데이터베이스 목록과 데이터베이스의 기본 정보를 확인할 수 있습니다.
-
카카오클라우드 콘솔 > Analytics > Data Catalog 메뉴로 이동합니다.
-
데이터베이스 메뉴를 클릭하고 데이터베이스 목록을 확인합니다.
구분 설명 데이터베이스 이름 사용자가 지정한 데이터베이스의 이름 연결된 카탈로그 데이터베이스가 속한 카탈로그의 이름 상태 데이터베이스의 상태
- CREATING, ALTERING, DELETING, ACTIVE, INACTIVE
- 각 상태 값에 대한 자세한 설명은 리소스 상태 정보와 생명주기 참고경로 데이터베이스가 위치한 경로 생성일 데이터베이스를 생성한 일자 [더 보기] 아이콘 - 데이터베이스 수정: 데이터베이스의 경로와 설명을 수정
- 데이터베이스 삭제: 데이터베이스를 삭제
*INACTIVE
상태의 경우, 단일 삭제만 가능하며 데이터베이스 수정 불가
데이터베이스 상세 보기
데이터베이스의 상세 정보를 확인할 수 있습니다.
-
카카오클라우드 콘솔 > Analytics > Data Catalog 메뉴로 이동합니다.
-
데이터베이스 메뉴에서 상세 정보를 확인할 데이터베이스를 선택합니다.
-
데이터베이스의 상세 페이지에서 정보를 확인합니다.
구분 설명 테이블 이름 사용자가 생성한 테이블 이름 데이터 저장 경로 사용자가 생성한 테이블의 데이터 저장 경로 상태 테이블의 상태
- CREATING, ALTERING, DELETING, ACTIVE, INACTIVE
- 각 상태 값에 대한 리소스 상태 정보와 생명주기 참고데이터 유형 테이블의 데이터 유형
- JSON, ORC, Parquet, CSV, Avro, text, custom
ㄴ hadoop-eco에 의해서 생성된 후, 마이그레이션 된 테이블은 text, custom 유형으로 나타날 수 있음
ㄴ text: Serde 라이브러리가org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe
인 경우
ㄴ custom: Avro, JSON, Parquet, ORC, CSV, text 유형 중 어디에도 속하지 않는 경우최종 수정일 테이블을 마지막으로 수정한 일자
데이터베이스 수정
데이터베이스 설정값은 경로와 설명만 수정할 수 있습니다. 데이터베이스 이름과 연결된 카탈로그는 수정할 수 없으며, 수정을 원할 경우에는 데이터베이스를 새로 생성해야 합니다.
-
카카오클라우드 콘솔 > Analytics > Data Catalog 메뉴로 이동합니다.
-
데이터베이스 메뉴에서 수정할 데이터베이스의 [더 보기] 아이콘 > 데이터베이스 수정을 선택합니다.
-
데이터베이스 수정 팝업창에서 정보를 수정하고 [수정] 버튼을 클릭합니다.
구분 설명 경로(선택) 데이터베이스가 위치한 경로
- s3 연결: 선택 시 전체 경로는s3a://
형태로 세팅되며, 미선택 시swifta://
형태로 세팅
- 버킷 이름: Object Storage 버킷 이름 입력
- 디렉터리: 버킷 하위 디렉터리 경로 입력설명(선택) 데이터베이스의 설명
데이터베이스 삭제
더 이상 사용하지 않는 데이터베이스는 삭제할 수 있습니다.
삭제한 데이터베이스 리소스는 종료한 후 완전히 반납되어 복구할 수 없습니다.
데이터베이스 하위에 생성한 테이블도 데이터베이스 삭제와 동시에 함께 삭제되며 복구할 수 없습니다.
- 카카오클라우드 콘솔 > Analytics > Data Catalog 메뉴로 이동합니다.
- 데이터베이스 메뉴에서 삭제할 데이터베이스의 [더 보기] 아이콘 > 데이터베이스 삭제를 선택합니다.
- 여러 개의 데이터베이스를 한꺼번에 삭제하려는 경우, 삭제할 데이터베이스 좌측의 체크박스를 선택한 후 하단의 [삭제] 버튼을 클릭합니다.
- 데이터베이스 삭제 팝업창에서 삭제할 데이터베이스를 확인한 후,
영구 삭제
또는 데이터베이스의 이름을 입력하고 [삭제] 버튼을 클릭합니다.