본문으로 건너뛰기

Data Catalog 개요

카카오클라우드 Data Catalog는 조직 내의 다양한 데이터 자산을 중앙에서 통합 관리하는 메타데이터 관리 서비스입니다. 각 데이터 소스에서 메타데이터를 수집해 중앙 리포지토리에 저장하며, 데이터 자산을 체계적으로 인벤토리화합니다.

또한 Hadoop Eco와 연동되어 분석 워크플로우 전반에서 메타데이터 기반의 데이터 탐색과 관리가 보다 효율적으로 이루어집니다.

사용 목적 및 사례

조직에서 관리하는 데이터가 방대할 경우, 분산된 데이터로 인해 데이터를 찾는 것이 어렵고, 데이터 중복/불일치/신뢰도 저하 등의 문제로 사용자 간 데이터를 공유하고 협업하는 데 문제가 생길 수 있습니다. 또한, 민감한 데이터가 적절하게 보호되지 않아 데이터 유출 및 보안에도 치명적인 악영향을 미칠 수 있습니다.
Data Catalog는 이런 문제를 해결하기 위해 데이터를 중앙에서 관리하고, 메타데이터 활용, 데이터 검색 및 공유, 보안 및 접근 제어, 데이터 품질 개선 기능을 통해 조직의 효율적이고 안전한 데이터 활용을 지원합니다.

특징

데이터 이동, 개별 검색 없이 한 번에 가능한 데이터 조회

  • 대규모의 데이터를 이동하거나 개별 검색할 필요 없이 Data Catalog 한 곳에서 조회할 수 있어 데이터 관리 효율성을 높임

다양한 대규모의 메타데이터 통합 관리

  • 카카오클라우드에 있는 다양한 종류의 메타데이터들을 통합해 콘솔에서 관리

빠른 데이터 검색, 조회

  • 스토리지 또는 DB에 일일이 접근할 필요 없이 Data Catalog 한 곳에서 데이터를 검색하고 조회할 수 있음
참고
  • Data Catalog 서비스 사용을 위한 자세한 가이드는 How-to Guides에서 확인하실 수 있습니다.
  • 카카오클라우드를 처음 시작하신다면, 시작하기 가이드에서 단계별 안내를 확인해보세요.