테이블 생성 및 관리
테이블은 데이터베이스에 종속된 메타데이터 단위입니다. 이 문서에서는 테이블 생성, 목록 조회, 상세 보기, 수정, 삭제 등 기본 관리 작업을 설명합니다.
테이블 생성
테이블을 생성하려면 먼저 카탈로그와 데이터베이스가 생성되어 있어야 합니다. 테이블 생성 전, 데이터베이스 상태는 Active 또는 Altering이어야 합니다.
Data Catalog 서비스에서 테이블을 만드는 방법은 다음과 같습니다.
-
카카오클라우드 콘솔 > Analytics > Data Catalog로 이동합니다.
-
테이블 메뉴 또는 데이터베이스 상세 페이지에서 [테이블 생성] 버튼을 클릭합니다.
-
아래 정보를 입력한 후, [생성] 버튼을 클릭합니다.
구분 설명 유형 테이블 유형 선택
-Standard 테이블또는Iceberg 테이블데이터베이스 테이블을 생성할 데이터베이스 선택 테이블 이름 테이블의 이름 데이터 저장 경로 테이블의 데이터가 저장되는 Object Storage의 경로 입력
- 버킷 선택: Object Storage 버킷 선택
- 디렉터리: 버킷 하위 디렉터리 경로 입력
* 참고 : 전체 경로는s3a://형태로 저장데이터 형식 테이블 데이터 형식 선택
-Standard 테이블지원 유형 : Avro, JSON, Parquet, ORC, CSV, TEXT
-Iceberg 테이블지원 유형 : Avro, Parquet, ORCPub/Sub 연동 Pub/Sub 연동 기능 활성화 여부 선택 (⚠️ Standard 유형에서만 표시)
- 활성화 시, 사용할 Pub/Sub 토픽 선택
- Pub/Sub 토픽 생성에 대한 자세한 설명은 Pub/Sub 토픽 생성 문서 참고설명 (선택) 테이블에 대한 부가 설명 속성 (선택) 테이블에 대한 속성 추가 스키마 [필드 추가] 버튼을 클릭해 스키마 구성
- 파티션 키: 파티션 키 지정 여부, 테이블 생성 시에만 지정 가능
- 컬럼 번호: 필드의 스키마 내 위치
- 필드 이름: 필드 이름
ㄴ avro 유형의 경우, 필드 이름은 숫자로 시작 불가
- 필드 타입: 필드의 데이터 타입
- 설명(선택): 필드에 대한 부가 설명
- [⋮] 버튼: 필드 수정, 삭제
- 파티션 키로 지정되지 않은 필드가 1개 이상 있어야 스키마 생성이 가능합니다.
- 필드와 파티션 필드를 합산하여 최대 50개까지 추가할 수 있습니다.
- 필드의 설명은 130자까지 입력 가능하며 이모지는 입력 불가합니다.
- Iceberg 테이블 유형은 파티션 필드와 동일한 이름의 필드가 추가되면 해당 필드를 identity transform으로 참조하는 파티션 속성이 추가됩니다.
- 필드에 대한 자세한 설명은 각 유형 별 스키마 필드 추가 내용을 참고하시기 바랍니다.
테이블 목록 및 상세 정보 조회
Data Catalog의 테이블 목록에서 현재 사용 중인 테이블의 주요 정보와 상태를 확인할 수 있습니다.
-
카카오클라우드 콘솔 > Analytics > Data Catalog 메뉴로 이동합니다.
-
테이블 메뉴를 클릭하여 테이블 목록을 확인합니다.
항목 설명 이름 생성 시 입력한 테이블 이름
- 테이블 이름을 클릭하여, 세부 정보 탭으로 이동 가능연결된 데이터베이스 테이블에 연결된 데이터베이스의 이름 상태 테이블의 상태 데이터 저장 경로 생성 시 입력한 테이블 데이터 저장 경로 유형 테이블의 유형
-Standard,Iceberg,MySQL데이터 형식 테이블의 데이터 포맷 최종 수정일 테이블의 최종 수정일시 [⋮] 버튼 - 전체 스키마 보기: 테이블의 전체 스키마 조회
- 테이블 수정: 테이블 이름과 설명 수정
- 테이블 삭제: 테이블 삭제
*INACTIVE상태의 경우, 단일 삭제만 가능하며 테이블 수정 불가 -
테이블 목록에서 상세 정보를 확인할 테이블을 선택하면, 세부 정보를 확인할 수 있습니다. 테이블 유형 별로 확인 가능한 상세 정보는 테이블 내 데이터 관리를 참고하시기 바랍니다.
테이블 수정
생성된 테이블 정보를 수정할 수 있습니다. 단, 테이블 유형에 따라 수정 가능 범위는 상이합니다.
- 카카오클라우드 콘솔 > Analytics > Data Catalog로 이동합니다.
- 테이블 메뉴를 클릭합니다.
- 테이블 목록에서 수정할 테이블의 [⋮] 버튼 > 수정을 선택합니다.
- 테이블 수정 팝업창에서 수정 가능한 영역을 확인합니다.
- Standard 유형 테이블
- Iceberg 유형 테이블
| 항목 | 설명 |
|---|---|
| 테이블 이름 | 테이블 이름 변경 |
| Pub/Sub 연동 | Pub/Sub 연동 활성/비활성 설정 - 연동에 사용된 Pub/Sub 토픽이 삭제된 경우 활성화 상태는 유지되며, 신규 토픽을 선택해야 정상적으로 사용 가능 |
| 항목 | 설명 |
|---|---|
| 설명 (선택) | 테이블 설명 수정 |
- [저장] 버튼을 클릭합니다.
테이블 삭제
더 이상 사용하지 않는 테이블을 삭제할 수 있습니다.
삭제한 테이블과 데이터는 복구할 수 없습니다.
- 카카오클라우드 콘솔 > Analytics > Data Catalog로 이동합니다.
- 테이블 메뉴를 클릭합니다.
- 테이블 목록에서 삭제할 테이블의 [⋮] 버튼 > 삭제를 선택합니다.
- 테이블 삭제 팝업창에서 삭제할 테이블의 이름을 동일하게 입력하고, [삭제] 버튼을 클릭합니다.
Pub/Sub 연동
테이블 메타데이터 변경 사항을 Pub/Sub 토픽으로 전달하여 외부 시스템과 연동할 수 있습니다.
Pub/Sub 토픽 연동
Pub/Sub 연동은 Standard 테이블에서만 사용할 수 있으며, 연동 전에 Pub/Sub 토픽이 미리 생성되어 있어야 합니다.
토픽 생성 방법은 Pub/Sub 토픽 생성을 참고하세요.
Data Catalog 테이블에서 Pub/Sub 토픽을 연동하는 방법은 다음과 같습니다.
- 테이블 생성 시, Pub/Sub 연동 항목을 활성화합니다.
- 사용 가능한 토픽 목록을 확인 후, 토픽을 선택합니다.
- 이미 테이블을 생성한 경우, 수정을 통해 Pub/Sub 연동 항목을 활성화합니다.
- 사용 가능한 토픽 목록을 확인 후, 토픽을 선택합니다.
Pub/Sub 이벤트 관리
테이블 정보를 변경하면 지정한 Pub/Sub 토픽으로 이벤트가 게시됩니다. 게시된 이벤트는 Pub/Sub의 서브스크립션 관리에서 확인할 수 있습니다.
생성되는 이벤트 유형과 종류는 다음과 같습니다.
| 유형 | 설명 | 종류 |
|---|---|---|
| Table 이벤트 | Data Catalog에서 테이블을 생성, 수정, 삭제하는 동작을 통해 생성 | - CreateTableEvent - AlterTableEvent - DropTableEvent |
| Partition 이벤트 | Hadoop Eco 연동 시 파티션 변경에 따라 게시되는 이벤트 | - AddPartitionEvent - AlterPartitionEvent - DropPartitionEvent |
테이블 내 데이터 관리
테이블은 SerDe 파라미터, 테이블 속성, 스키마, 파티션 등 다양한 메타데이터로 구성됩니다.
Data Catalog 콘솔에서는 테이블 유형(Standard, Iceberg)에 따라 메타데이터를 조회, 추가, 수정, 삭제할 수 있습니다.
크롤러로 생성된 테이블(MySQL 유형)의 경우 스키마 데이터만 노출됩니다.
- Standard 테이블 유형
- Iceberg 테이블 유형
Standard 테이블 유형
SerDe 파라미터 관리
[SerDe 파라미터 조회]
Standard 테이블의 SerDe 파라미터를 조회하는 방법은 다음과 같습니다.
-
카카오클라우드 콘솔 > Analytics > Data Catalog로 이동합니다.
-
테이블 메뉴를 클릭 후, 테이블 목록에서 SerDe 파라미터를 조회할 테이블을 선택합니다.
-
SerDe 파라미터 탭을 선택합니다.
항목 설명 키 SerDe 파라미터의 Key 값 SerDe 파라미터의 Value [⋮] 버튼 수정 기능 제공 (※ 삭제 기능 미지원)
[SerDe 파라미터 추가]
Standard 테이블에서 신규 SerDe 파라미터를 추가하는 방법은 다음과 같습니다.
-
카카오클라우드 콘솔 > Analytics > Data Catalog로 이동합니다.
-
테이블 메뉴를 클릭 후, 테이블 목록에서 SerDe 파라미터를 추가할 테이블을 선택합니다.
-
SerDe 파라미터 탭에서 [SerDe 파라미터 추가하기] 버튼을 클릭합니다.
-
SerDe 파라미터 추가 팝업창에서 파라미터를 추가하고 [추가] 버튼을 클릭합니다.
항목 설명 키 SerDe 파라미터의 Key 값 SerDe 파라미터의 Value
[SerDe 파라미터 수정]
Standard 테이블에서 SerDe 파라미터를 수정하는 방법은 다음과 같습니다.
-
카카오클라우드 콘솔 > Analytics > Data Catalog로 이동합니다.
-
Table 탭을 클릭 후, 테이블 목록에서 SerDe 파라미터를 수정할 테이블을 선택합니다.
-
SerDe 파라미터 탭에서 [⋮] 버튼 > 수정을 선택합니다.
-
SerDe 파라미터 수정 팝업창에서 Value를 수정하고 [수정] 버튼을 클릭합니다.
테이블 속성 관리
[테이블 속성 조회]
Standard 테이블 목록에서 현재 사용 중인 테이블 목록을 조회할 수 있습니다.
-
카카오클라우드 콘솔 > Analytics > Data Catalog로 이동합니다.
-
테이블 메뉴를 클릭 후, 테이블 목록에서 테이블 속성을 조회할 테이블을 선택합니다.
-
테이블 속성 탭에서 테이블 속성을 확인합니다.
항목 설명 키 테이블 속성의 Key 값 테이블 속성의 Value [⋮] 버튼 수정 및 삭제 기능
[테이블 속성 추가]
Standard 테이블의 속성을 추가하는 방법은 다음과 같습니다.
-
카카오클라우드 콘솔 > Analytics > Data Catalog로 이동합니다.
-
테이블 메뉴를 클릭 후, 테이블 목록에서 테이블 속성을 추가할 테이블을 선택합니다.
-
테이블 속성 탭에서 [테이블 속성 추가하기] 버튼을 클릭합니다.
-
테이블 속성 추가하기 팝업창에서 속성을 추가하고 [추가] 버튼을 클릭합니다.
항목 설명 키 테이블 속성의 Key 값 테이블 속성의 Value
[테이블 속성 수정]
Standard 테이블의 속성을 수정하는 방법은 다음과 같습니다.
-
카카오클라우드 콘솔 > Analytics > Data Catalog로 이동합니다.
-
테이블 메뉴를 클릭 후, 테이블 목록에서 테이블 속성을 추가할 테이블을 선택합니다.
-
테이블 속성 탭에서 수정할 테이블 속성의 [⋮] 버튼 > 수정을 선택합니다.
-
테이블 속성 수정 팝업창에서 속성을 수정하고 [수정] 버튼을 클릭합니다.
[테이블 속성 삭제]
Standard 테이블 상세 정보에서 현재 사용 중인 테이블 속성을 삭제할 수 있습니다.
삭제한 데이터는 복구할 수 없습니다.
-
카카오클라우드 콘솔 > Analytics > Data Catalog로 이동합니다.
-
테이블 메뉴를 클릭 후, 테이블 목록에서 테이블 속성을 삭제할 테이블을 선택합니다.
-
테이블 속성 탭에서 삭제할 테이블 속성의 [⋮] 버튼 > 삭제를 선택합니다.
-
테이블 속성 삭제 팝업창에서 [삭제] 버튼을 클릭합니다.
스키마 관리
[스키마 필드 조회]
Standard 테이블 상세 정보에서 스키마 필드를 조회할 수 있습니다.
-
카카오클라우드 콘솔 > Analytics > Data Catalog로 이동합니다.
-
테이블 메뉴를 클릭 후, 테이블 목록에서 스키마 필드를 조회할 테이블을 선택합니다.
-
스키마 탭에서 스키마 필드를 조회합니다.
항목 설명 No. 파티션 필드 정렬을 위한 칼럼 번호
- 최초 칼럼 번호는 1부터 시작
- 칼럼 번호는 1과 마지막 숫자에 +1을 한 숫자 사이에서 지정
- 파티션 키로 지정된 경우 입력하지 않음필드 이름 설정한 스키마 필드 이름 필드 타입 필드의 데이터 타입
- 지원하는 유형:array,bigint,binary,boolean,char,date,decimal,
double,float,int,map,smallint,string,struct,timestamp,tinyint,union,varchar파티션 키 테이블 생성 시 파티션 키 옵션 지정 유무 설명 스키마 관련 설명 [⋮] 버튼 필드 수정 및 삭제 기능
[스키마 필드 추가]
Standard 테이블 상세 정보에서 스키마 필드를 추가할 수 있습니다. 단, 최대 50개까지 추가할 수 있습니다.
MySQL 유형 및 데이터 형식이 JSON, CSV 인 경우, 테이블 생성 후 필드 추가, 수정, 삭제가 불가합니다.
-
카카오클라우드 콘솔 > Analytics > Data Catalog로 이동합니다.
-
테이블 메뉴를 클릭 후, 테이블 목록에서 스키마 필드를 추가할 테이블을 선택합니다.
-
스키마 탭을 클릭한 뒤 [필드 추가] 버튼을 클릭합니다.
-
필드 추가 팝업창에서 정보를 입력하고 [추가] 버튼을 클릭합니다.
항목 설명 칼럼 번호 파티션 필드를 정렬하는 번호
- 최초 칼럼 번호는 1부터 시작
- 칼럼 번호는 1과 마지막 숫자에 +1을 한 숫자 사이에서 지정
- 파티션 키로 지정된 경우 입력하지 않음필드 이름 필드 이름을 입력 필드 타입 필드의 데이터 타입
- 지원하는 타입:array,bigint,binary,boolean,char,date,decimal,
double,float,int,map,smallint,string,struct,timestamp,tinyint,union,varchar설명 (선택) 필드에 대한 설명
[스키마 필드 수정]
Standard 테이블 상세 정보에서 스키마 필드를 수정할 수 있습니다.
-
카카오클라우드 콘솔 > Analytics > Data Catalog로 이동합니다.
-
테이블 메뉴를 클릭 후, 테이블 목록에서 스키마 필드를 추가할 테이블을 선택합니다.
-
스키마 탭에서 수정할 스키마 필드의 [⋮] 버튼 > 수정을 선택합니다.
-
수정 팝업창에서 정보를 수정하고 [수정] 버튼을 클릭합니다.
[스키마 필드 삭제]
Standard 테이블 상세 정보에서 현재 사용 중인 스키마 필드를 삭제할 수 있습니다.
삭제한 데이터는 복구할 수 없습니다.
-
카카오클라우드 콘솔 > Analytics > Data Catalog로 이동합니다.
-
테이블 메뉴를 클릭 후, 테이블 목록에서 스키마 필드를 삭제할 테이블을 선택합니다.
-
스키마 탭에서 삭제할 스키마 필드의 [⋮] 버튼 > 삭제를 선택합니다.
-
삭제 팝업창에서 [삭제] 버튼을 클릭합니다.
파티션 관리
[파티션 조회]
Standard 테이블 상세 정보에서 파티션을 조회할 수 있습니다.
-
카카오클라우드 콘솔 > Analytics > Data Catalog로 이동합니다.
-
테이블 메뉴를 클릭 후, 테이블 목록에서 파티션을 조회할 테이블을 선택합니다.
-
파티션 탭에서 파티션 정보를 조회합니다.
항목 설명 Files 해당 파티션의 연결된 파일 링크 Properties 해당 파티션의 스키마 조회
Iceberg 테이블 유형
테이블 속성 관리
[테이블 속성 조회]
Iceberg 테이블 목록에서 현재 사용 중인 테이블 목록을 조회할 수 있습니다.
-
카카오클라우드 콘솔 > Analytics > Data Catalog로 이동합니다.
-
테이블 메뉴를 클릭 후, 테이블 목록에서 테이블 속성을 조회할 테이블을 선택합니다.
-
테이블 속성 탭에서 테이블 속성을 확인합니다.
항목 설명 키 테이블 속성의 Key 값 테이블 속성의 Value [⋮] 버튼 - 테이블 속성 수정
- 테이블 속성 삭제
[테이블 속성 추가]
Iceberg 테이블 속성을 추가하는 방법은 다음과 같습니다.
-
카카오클라우드 콘솔 > Analytics > Data Catalog로 이동합니다.
-
테이블 메뉴를 클릭 후, 테이블 목록에서 테이블 속성을 추가할 테이블을 선택합니다.
-
테이블 속성 탭에서 [테이블 속성 추가하기] 버튼을 클릭합니다.
-
테이블 속성 추가 팝업창에서 속성을 추가하고 [추가] 버튼을 클릭합니다.
항목 설명 키 테이블 속성의 Key 값 테이블 속성의 Value
[테이블 속성 수정]
Iceberg 테이블 속성을 수정하는 방법은 다음과 같습니다.
-
카카오클라우드 콘솔 > Analytics > Data Catalog로 이동합니다.
-
테이블 메뉴를 클릭 후, 테이블 목록에서 테이블 속성을 추가할 테이블을 선택합니다.
-
테이블 속성 탭에서 수정할 테이블 속성의 [⋮] 버튼 > 테이블 속성 수정을 선택합니다.
-
테이블 속성 수정 팝업창에서 속성을 수정하고 [수정] 버튼을 클릭합니다.
[테이블 속성 삭제]
Iceberg 테이블 상세 정보에서 현재 사용 중인 테이블 속성을 삭제할 수 있습니다.
삭제한 데이터는 복구할 수 없습니다.
-
카카오클라우드 콘솔 > Analytics > Data Catalog로 이동합니다.
-
테이블 메뉴를 클릭 후, 테이블 목록에서 테이블 속성을 삭제할 테이블을 선택합니다.
-
테이블 속성 탭에서 삭제할 테이블 속성의 [⋮] 버튼 > 테이블 속성 삭제를 선택합니다.
-
테이블 속성 삭제 팝업창에서 [삭제] 버튼을 클릭합니다.
파티션 속성 관리
[파티션 속성 조회]
Iceberg 테이블 상세 정보에서 파티션 속성을 조회할 수 있습니다.
-
카카오클라우드 콘솔 > Analytics > Data Catalog로 이동합니다.
-
테이블 메뉴를 클릭 후, 테이블 목록에서 파티션 속성을 조회할 테이블을 선택합니다.
-
파티션 속성 탭에서 파티션 속성 정보를 조회합니다.
항목 설명 파티션 정보 사용자가 생성한 파티션 속성 정보
스키마 관리
[스키마 필드 조회]
Iceberg 테이블 상세 정보에서 스키마 필드를 조회할 수 있습니다.
-
카카오클라우드 콘솔 > Analytics > Data Catalog로 이동합니다.
-
테이블 메뉴를 클릭 후, 테이블 목록에서 스키마 필드를 조회할 테이블을 선택합니다.
-
스키마 탭에서 스키마 필드를 조회합니다.
항목 설명 No. 파티션 필드 정렬을 위한 칼럼 번호
- 최초 칼럼 번호는 1부터 시작
- 칼럼 번호는 1과 마지막 숫자에 +1을 한 숫자 사이에서 지정
- 파티션 키로 지정된 경우 입력하지 않음필드 이름 설정한 스키마 필드 이름 필드 타입 필드의 데이터 타입
조회 가능한 스키마가 있는 경우, 클릭해 확인 가능
- 지원하는 타입:binary,boolean,date,decimal,double,float,int,long,string,time,timestamp,uuid파티션 키 테이블 생성 시 파티션 키 옵션 지정 유무 설명 스키마 관련 설명
[스키마 필드 추가]
Iceberg 테이블 상세 정보에서 스키마 필드를 추가할 수 있습니다. 단, 최대 50개까지 추가할 수 있습니다.
-
카카오클라우드 콘솔 > Analytics > Data Catalog 로 이동합니다.
-
테이블 메뉴를 클릭 후, 테이블 목록에서 스키마 필드를 추가할 테이블을 선택합니다.
-
스키마 탭을 클릭한 뒤 [필드 추가] 버튼을 클릭합니다.
-
필드 추가 팝업창에서 정보를 입력하고 [추가] 버튼을 클릭합니다.
항목 설명 컬럼 번호 필드를 정렬하는 번호
- 최초 칼럼 번호는 1부터 시작
- 칼럼 번호는 1과 마지막 숫자에 +1을 한 숫자 사이에서 지정필드 이름 필드 이름 필드 타입 필드의 데이터 타입
조회 가능한 스키마가 있는 경우, 클릭해 확인 가능
- 지원하는 타입:binary,boolean,date,double,float,int,long,string,time,timestamp,uuid설명(선택) 필드에 대한 부가 설명
[스키마 필드 수정]
Iceberg 테이블 상세 정보에서 스키마 필드를 수정할 수 있습니다.
-
카카오클라우드 콘솔 > Analytics > Data Catalog 로 이동합니다.
-
테이블 메뉴를 클릭 후, 테이블 목록에서 스키마 필드를 추가할 테이블을 선택합니다.
-
스키마 탭을 클릭한 뒤 [필드 추가] 버튼을 클릭합니다.
-
필드 수정 팝업창에서 정보를 입력하고 [수정] 버튼을 클릭합니다.
[스키마 필드 삭제]
Iceberg 테이블 상세 정보에서 현재 사용 중인 스키마 필드를 삭제할 수 있습니다.
삭제한 데이터는 복구할 수 없습니다.
-
카카오클라우드 콘솔 > Analytics > Data Catalog로 이동합니다.
-
테이블 메뉴를 클릭 후, 테이블 목록에서 스키마 필드를 삭제할 테이블을 선택합니다.
-
스키마 탭에서 삭제할 스키마 필드의 [⋮] 버튼 > 삭제를 선택합니다.
-
삭제 팝업창에서 [삭제] 버튼을 클릭합니다.