본문으로 건너뛰기

Data Catalog 개요

Beta kr-central-1 kr-central-2

카카오클라우드의 Data Catalog 서비스는 조직과 사용자의 데이터 자산을 중앙에서 체계적으로 파악하고 관리하는 데 도움을 주는 효율적인 데이터 관리 도구로, VPC 환경에서 제공됩니다. Data Catalog는 데이터 관리와 메타데이터화를 중심으로 조직 내 데이터 자산의 인벤토리 역할을 하며, 다양한 데이터에 대한 메타데이터를 수집하여 중앙 리포지토리에 저장합니다. 카카오클라우드의 데이터 분석 에코시스템인 Hadoop Eco 서비스와도 연동되기 때문에 데이터 처리 및 분석 작업을 더욱 원활하게 수행할 수 있습니다.
Data Catalog 서비스를 사용하면 개인은 자신이 소유한 데이터를 테이블 형태로 정의하고 데이터의 저장 위치, 속성 등을 자세히 등록하고 효율적으로 관리할 수 있습니다. 또한, 조직은 조직의 데이터 자산을 최적화할 수 있기 때문에 데이터 관리 비용을 절감하고, 효율적인 데이터 활용으로 비즈니스 목표를 달성할 수 있습니다.

사용 목적 및 사례

조직에서 관리하는 데이터가 방대할 경우, 분산된 데이터로 인해 데이터를 찾는 것이 어렵고, 데이터 중복/불일치/신뢰도 저하 등의 문제로 사용자 간 데이터를 공유하고 협업하는 데 문제가 생길 수 있습니다. 또한, 민감한 데이터가 적절하게 보호되지 않아 데이터 유출 및 보안에도 치명적인 악영향을 미칠 수 있습니다.
Data Catalog는 이런 문제를 해결하기 위해 데이터를 중앙에서 관리하고, 메타데이터 활용, 데이터 검색 및 공유, 보안 및 접근 제어, 데이터 품질 개선 기능을 통해 조직의 효율적이고 안전한 데이터 활용을 지원합니다.

특징

데이터 이동, 개별 검색 없이 한 번에 가능한 데이터 조회

  • 대규모의 데이터를 이동하거나 개별 검색할 필요 없이 Data Catalog 한 곳에서 조회할 수 있어 데이터 관리 효율성을 높임

다양한 대규모의 메타데이터 통합 관리

  • 카카오클라우드에 있는 다양한 종류의 메타데이터들을 통합해 콘솔에서 관리

빠른 데이터 검색, 조회

  • 스토리지 또는 DB에 일일이 접근할 필요 없이 Data Catalog 한 곳에서 데이터를 검색하고 조회할 수 있음

시작하기

Data Catalog에 대한 자세한 사용 가이드는 How-to Guides에서 설명합니다. 카카오클라우드를 처음 시작하신다면 카카오클라우드 시작하기를 참고하시기 바랍니다.