블로그 | 카카오클라우드

IAM 업데이트, 내 역할 확인과 전용 권한 체계 도입

2025년 7월 28일 · 약 4분

Service Manager

클라우드 환경에서 협업을 하다 보면 이런 궁금증이 자주 생깁니다.

“나는 이 프로젝트에 무슨 권한이 있는 거지?”
“왜 이 설정은 접근이 안 되는 걸까?”
“이 사용자에게 어떤 역할을 줬더라?”

이번 업데이트에서는 이러한 궁금증을 해소할 수 있도록, 각 사용자가 내 역할 정보를 직접 확인할 수 있는 기능이 추가되었습니다. 또한 클라우드 리소스를 제외한 IAM과 프로젝트의 관리 목적을 위한 전용 역할 체계가 새롭게 도입되어, 권한을 보다 정교하게 구성하고 운영할 수 있게 되었습니다.

🖥️ 내 역할 정보를 손쉽게 확인할 수 있어요

이번 업데이트의 가장 큰 변화 중 하나는 사용자가 자신의 역할 정보를 콘솔에서 직접 확인할 수 있게 되었다는 점입니다.

기존에는 “내가 어떤 역할을 갖고 있는지”, “어떤 설정에 접근할 수 있는지” 등을 확인하려면 관리자에게 따로 문의해야 했습니다. 특히 여러 프로젝트에 동시에 참여하고 있는 경우, 권한 범위를 명확히 파악하기 어려웠죠.

하지만 이제는 콘솔에서 조직 역할과 프로젝트 역할을 명확히 구분해 확인할 수 있는 기능이 제공됩니다.

먼저, 조직 단위의 역할은 콘솔 우측 상단 프로필 메뉴에서 조직 역할 항목을 선택하면 확인할 수 있습니다. 내게 부여된 역할 이름은 물론, 그것이 공통 역할인지, 특정 서비스에 국한된 서비스 역할인지도 함께 표시되어 현재 권한을 한눈에 파악할 수 있습니다.

프로젝트 단위의 역할도 마찬가지입니다. 같은 위치의 프로젝트 역할 메뉴에서 내가 속한 프로젝트 목록을 확인하고, 각 프로젝트 내에서 어떤 역할이 할당되어 있는지 확인할 수 있습니다. 프로젝트의 이름, 닉네임, ID, 설명과 함께 역할 유형과 명칭까지 함께 제공되어, 여러 프로젝트에 참여하고 있어도 내 권한이 어디까지인지 명확히 이해할 수 있습니다.

🎉 IAM과 프로젝트 관리 기능을 위한 역할이 새롭게 추가되었어요

이번 업데이트에서는 역할 체계에도 중요한 변화가 있었습니다.

기존에는 조직 관리자, 프로젝트 관리자, 멤버, 리더 등의 기본 역할만으로 구성되어 있었기 때문에, 실제 운영 환경에서 역할과 책임을 세분화하기 어려웠습니다. 예를 들어, 특정 사용자에게 IAM 설정만 관리할 수 있는 권한을 주고 싶어도, 조직 관리자나 프로젝트 관리자 역할은 리소스 관리 권한까지 포함하고 있어 고민이 따랐죠.

이러한 현실적인 요구를 반영해, IAM 서비스와 프로젝트 관리 기능에 특화된 전용 역할이 새롭게 도입되었습니다.

IAM 조직 관리자는 IAM 서비스에서 사용자에게 역할을 할당하거나 제거할 수 있는 권한을 가집니다.
IAM 조직 뷰어는 역할 정보를 조회할 수 있지만, 직접 수정은 할 수 없습니다.
IAM 프로젝트 관리자는 특정 프로젝트에 대한 사용자 권한을 할당하거나 수정할 수 있으며,
IAM 프로젝트 뷰어는 해당 프로젝트의 역할 정보를 조회할 수 있는 읽기 전용 권한을 가집니다.

이러한 전용 역할은 기존의 조직/프로젝트 관리자와는 독립적으로 할당할 수 있어, 사용자에 대한 관리 책임을 보다 세분화할 수 있습니다.
👉 IAM, 프로젝트 관리 역할 자세히 보기

💡 사용성을 높이고, 책임을 분명히

이번 IAM 업데이트는 단순히 기능이 추가된 것이 아니라, 조직 내에서 역할과 책임을 명확히 하고, 권한을 효율적으로 분산시킬 수 있는 체계를 제공한다는 점에서 의미가 큽니다.

관리자는 더 이상 “역할은 부여했으니 접근되는지 한번 확인해보세요”라고 말할 필요가 없습니다. 대신 이렇게 표현할 수 있을 것 같습니다. “필요한 권한은 콘솔에서 직접 확인하고 활용하세요” 즉, 확인 요청에서 자율 확인 안내로 바뀐 거죠.

또한, IAM과 프로젝트 관리에 특화된 새로운 역할을 활용하면, 서비스별 책임자를 지정하되, 꼭 필요한 권한만 부여할 수 있습니다. 이를 통해 보안 정책은 강화되고, 권한 운영은 더욱 효율적으로 이루어집니다.

앞으로 카카오클라우드는 IAM을 포함한 전반적인 서비스별 역할 체계를 더 세분화해 나갈 계획입니다. 이를 통해 조직은 최소 권한 원칙(Principle of Least Privilege) 에 더욱 충실하면서, 관리자는 업무별 맞춤형 권한 부여로 운영 부담을 줄이고, 사용자는 자신의 역할과 책임을 한층 더 명확하게 인식할 수 있게 계속 개선해 나가겠습니다.

IAM 문서에서 더 자세한 내용을 확인하고 싶으신가요?
👉 IAM 역할 관리 문서 보기

예측 가능한 클라우드 운영을 위한 Maintenance 서비스 출시

2025년 7월 22일 · 약 3분

Irene (윤영지)

Service Manager

클라우드를 운영해 본 분이라면 한 번쯤 이런 경험이 있으실 겁니다. 보안 취약점 보고서에 빠뜨린 업데이트가 지적되거나, 원치 않던 시간대에 서버가 재시작되어 사용자들이 몰려드는 순간 불안하게 모니터를 바라본 적 말이죠.

사실 이런 상황은 많은 운영자들이 겪는 현실입니다. 클라우드 환경이 점점 복잡해지고 보안 위협은 더욱 정교해지면서, 업데이트와 패치 관리가 운영자에게 주는 부담은 눈에 띄게 커지고 있기 때문입니다.

AWS, Azure, Google Cloud 역시 보안 패치 누락, 운영 시간 제약, 대규모 환경에서의 안정성 부족을 해결하기 위해 유지관리 서비스를 제공하며, 운영자가 본질적인 업무에 집중할 수 있도록 지원해 왔습니다.

카카오클라우드 역시 운영자들이 겪는 불안과 부담을 잘 알고 있습니다. 그리고 2025년 7월, 국내 고객의 환경에 맞춘 Maintenance 서비스를 선보이게 되었습니다.🎉 🎉 🎉

운영자가 직접 체감하는 변화

Maintenance 서비스는 단순히 업데이트를 자동화하는 기능을 넘어, 운영자가 직접 경험할 수 있는 안정성과 효율성을 제공합니다. 몇 가지 대표적인 상황을 살펴보겠습니다.

먼저 보안 패치의 경우입니다. 기존에는 언제 패치를 적용해야 할지, 적용 시 서비스에 어떤 영향을 줄지 늘 고민이었습니다. 하지만 이제는 그런 걱정을 덜 수 있습니다.
Maintenance 서비스는 새로운 보안 업데이트가 필요할 때 이를 자동으로 감지하고, 운영자가 선택한 시간대에 맞춰 예약 실행할 수 있습니다. 업데이트가 완료되면 이메일 알림을 통해 성공 여부를 즉시 확인할 수 있고, 실패가 발생한 경우 일정 재조정을 빠르게 진행할 수 있습니다. 덕분에 서비스 중단 위험의 위험성은 낮출 수 있습니다.

데이터베이스 운영에서도 효과는 분명합니다.
예를 들어 MySQL 인스턴스를 최신 버전으로 업그레이드해야 할 때, 과거에는 직접 다운타임을 관리하고 실행 과정을 지켜보며 불안감을 감수해야 했습니다. 그러나 Maintenance를 이용하면 운영자가 해야 할 일은 예약 시간과 작업 내용을 지정하는 것뿐입니다. Maintenance가 지정된 시간에 자동으로 업그레이드를 실행하고, 결과와 상태를 실시간으로 제공하기 때문에 별도의 수동 개입 없이도 안정적인 업그레이드가 가능합니다.

이처럼 Maintenance는 보안, 데이터베이스, 시스템 업데이트와 같이 서비스 안정성에 직접 영향을 주는 작업을 체계적이고 예측 가능하게 관리할 수 있도록 지원합니다.

Maintenance, 이렇게 활용할 수 있습니다

Maintenance의 사용 흐름은 단순합니다.

업데이트 대상 확인
자동으로 감지된 업그레이드 대상이나 사용자가 등록한 유지관리 작업 목록을 확인하고, 권장 일정과 예상 영향도를 사전에 검토합니다.
작업 일정 예약
각 작업의 실행 일시를 설정하고, 서비스 사용량이 적은 시간대로 예약해 운영 안정성을 확보합니다.
진행 상황 모니터링
예약된 시간이 되면 작업이 자동 실행되며, 진행 상태를 실시간으로 확인할 수 있습니다.
결과 확인 및 후속 조치
완료된 작업의 성공 여부와 상세 결과를 확인하고, 필요 시 재시도나 일정 변경을 진행합니다.

이 과정은 모두 직관적인 콘솔 UI에서 수행할 수 있어, 운영자는 복잡한 절차 없이 편리하게 유지관리를 이어갈 수 있습니다.

불확실성을 줄이는 예측 가능한 유지관리

클라우드 운영에서 핵심은 언제나 안정성과 예측 가능성입니다. Maintenance는 반복 작업의 자동화로 운영 효율성을 높이는 것은 물론, 업데이트 중 발생할 수 있는 중단 위험을 사전에 알림으로써 불확실성을 줄이고, 단계적 업데이트를 통해 안정성을 한층 강화합니다.

현재는 MySQL 인스턴스에 대한 유지관리를 지원하고 있으며, 앞으로 PostgreSQL을 비롯해 더 많은 관리형 서비스로 확대될 예정입니다.

카카오클라우드 Maintenance로 불필요한 운영 리스크를 줄이고, 서비스의 안정성을 한 단계 높여 보세요.

Maintenance 서비스에 대한 더 많은 내용은 기술문서에서 확인하실 수 있습니다.
👉 Maintenance 주요 개념 이해하기

카카오클라우드 IAM 온보딩 영상 가이드

2025년 6월 30일 · 약 4분

Martin (왕현수)

Service Manager

Kali (명시온)

Service Manager

클라우드를 사용한다는 건, 마치 열쇠가 수십 개 달린 가상의 건물을 운영하는 것과 같습니다. 🔐
누가 어떤 방에 들어갈 수 있는지, 어떤 문을 열 수 있는지를 명확히 정해두지 않으면 금세 혼란이 생기기 때문입니다.
이 열쇠를 누구에게, 어떤 조건으로 줄지를 정하는 것이 바로 IAM(Identity and Access Management)입니다. 즉, IAM은 사용자의 역할에 따라 필요한 권한만 부여해, 리소스를 효율적으로 관리하고 불필요한 접근을 줄일 수 있도록 도와주는 서비스라고 할 수 있습니다

하지만 IAM을 처음 접하는 분들에겐 이 개념이 다소 복잡하고 부담스럽게 느껴질 수도 있으실 텐데요.
콘텐츠 기획팀에서는 카카오클라우드의 IAM을 보다 정확히 이해하고 잘 활용할 수 있도록, 총 4편의 온보딩 영상 시리즈를 제작했습니다.
이번 글에서는 각 영상의 핵심 내용을 간단히 정리해 드릴게요.

🎬 1편. IAM 시작하기 – 개념과 기본 구조

IAM 온보딩 시리즈 첫 번째 영상에서는 IAM의 기본 개념과 프로젝트, 조직 단위의 구조를 소개합니다.
처음 IAM을 접하는 분들도 이 영상을 통해 IAM의 전체 구조를 쉽게 이해할 수 있습니다. 마치 도시의 지도처럼 각 영역에 어떤 권한이 배정되어야 하는지 큰 그림을 한눈에 그려보세요.

🎬 2편. IAM 그룹과 서비스 계정 – 사용자 관리 효율 높이기

2편에서는 IAM을 더 편리하고 체계적으로 운영하기 위해 꼭 알아야 할 두 가지 기능, IAM 그룹과 서비스 계정을 소개합니다.

IAM 그룹은 동일 권한이 필요한 사용자를 하나의 사용자 그룹으로 묶어 필요한 권한을 한 번에 설정하는 유용한 기능입니다. 예를 들어, 개발팀, 운영팀, 마케팅팀처럼 팀 단위로 묶고 각 팀에 필요한 권한을 그룹 단위로 설정해 두면, 새로운 팀원이 입사했을 때 해당 그룹에 추가만 하면 권한이 자동으로 부여되기 때문에 훨씬 효율적으로 사용자 관리를 할 수 있습니다.
서비스 계정은 서비스 계정은 실제 IAM 사용자 계정이 아닌, 애플리케이션이나 자동화 스크립트가 프로젝트 내 리소스에 접근하거나 이를 제어하기 위해 사용되는 비사용자용 계정으로, IAM 사용자 계정 대신 API 토큰을 발급받아 카카오클라우드 API를 호출할 수 있습니다.

이 두 기능을 적절히 활용하면, 사용자 관리와 시스템 권한 설정을 더욱 체계적이고 안전하게 운영할 수 있습니다. 자세한 내용은 영상에서 살펴보세요.

🎬 3편. Cloud Trail로 IAM 변경 이력 추적하기

IAM은 처음 설정도 중요하지만, 변경 이력을 꾸준히 확인하고 관리하는 것도 중요한데요. 3편에서는 카카오클라우드 Cloud Trail을 활용하여 누가 언제 어떤 IAM 설정을 변경했는지 이벤트 단위로 추적하는 방법을 소개합니다.

🎬 4편. IAM 운영 Best Practice 살펴보기

마지막 영상에서는 IAM을 안정적으로 운영하기 위한 다섯 가지 모범 사례를 소개합니다. 우리 조직에 아래 5가지 운영 팁이 모두 적용되어 있는 지 점검해 보시기 바랍니다.

불필요한 권한 없이, 꼭 필요한 권한만 최소한으로 부여하기
Cloud Trail을 활용해 변경 이력을 주기적으로 확인하기
퇴사자 및 휴면 계정을 정기적으로 점검하고 정리하기
사용자 계정과 서비스 계정을 명확히 분리해 운영하기
Alert Center와 연동해 이상 징후 발생 시 빠르게 감지하고 대응하기

어떠셨나요?
IAM은 단순한 권한 관리 도구를 넘어, 조직 내 리소스를 안전하게 보호하고 역할과 책임을 명확히 구분하는 중요한 기준입니다.
IAM의 기본 구조와 운영 방법을 잘 이해하면 복잡한 클라우드 환경에서도 안정적이고 신뢰할 수 있는 서비스를 꾸준히 제공할 수 있습니다.

카카오클라우드 IAM 서비스에 대해 자세히 알고 싶다면, 아래 링크를 참고해 주세요.
감사합니다 :)

분산된 리소스를 한곳에서, Resource Explorer 출시

2025년 5월 29일 · 약 3분

Kali (명시온)

Service Manager

클라우드 환경이 커질수록 따라오는 고민이 하나 있습니다. 바로 “지금 우리가 쓰고 있는 리소스가 도대체 얼마나 될까?”라는 질문이죠.
서버는 어디에 있고, 볼륨은 얼마나 연결돼 있는지, 사용 중인 퍼블릭 IP는 몇 개인지…
서비스별로 일일이 확인하고, 스프레드시트에 정리하는 작업은 시간이 오래 걸리고 실수도 생기기 마련입니다.

이런 불편을 해소하고자 카카오클라우드는 클라우드 리소스를 보다 쉽게 조회하고 관리할 수 있는 Resource Explorer 서비스를 정식 출시하였습니다.
Resource Explorer는 카카오클라우드 프로젝트 단위로 사용 중인 인스턴스, Block Storage, 퍼블릭 IP, 로드 밸런서 등 다양한 리소스를 한 화면에서 통합 조회할 수 있는 서비스입니다. 이름, ID, 상태, 태그 등 다양한 기준으로 리소스를 검색할 수 있고, 클릭 한 번으로 해당 리소스의 세부 정보 페이지로 이동해서 필요한 작업을 이어갈 수 있게 되었죠.

이번 포스트에서는 Resource Explorer의 출시를 알리고 주요 기능과 활용 방법에 대해 간략히 소개해 드리겠습니다.

🏷️ 리소스를 ‘맥락’으로 구분하는 방법 - '태그'!

리소스를 태그 기반으로 분류하고 필터링할 수 있다는 점은 사용자들에게 특히 유용한 부분입니다.

"이 인스턴스는 누가 만든 거지?"
"운영 중인 볼륨이 이렇게 많았나?"
"이건 테스트용이었나, 운영용이었나?"

이런 의문을 가장 간단하고 효과적으로 해결하는 방법이 바로 태그입니다. Resource Explorer는 이 태그 기능을 중심으로 클라우드 리소스를 체계적으로 정리하고 탐색할 수 있도록 돕습니다.

리소스마다 원하는 메타데이터를 키:값 형태의 태그로 지정할 수 있으며, 다음과 같이 명확한 의미와 목적을 부여할 수 있습니다.

Project:Alpha – 특정 프로젝트 소속
Environment:Production – 운영 환경
Owner:ML팀 – 담당 조직
Billing:2505 – 비용 관리

기존에는 이름이나 리소스 ID만으로 리소스를 구분했다면, 이제는 그 리소스가 왜 존재하는지, 어떤 의도로 만들었는지 태그를 통해 확인할 수 있습니다. 이처럼 의미 기반의 정리는 단순한 리스트보다 훨씬 빠르고 정확한 탐색이 가능합니다.

예를 들어,

✅ 운영 중인 AI 인프라만 빠르게 보고 싶다면?
→ Environment:Production, Owner:AI팀 으로 필터링!

✅ 지난달 새로 생성된 테스트 서버만 보고 싶다면? → Environment:Dev, CreateDate:2025-04 태그로 바로 확인!

사용자는 원하는 키와 값을 조합해 커스텀 태그를 자유롭게 생성할 수 있고, 선택한 리소스에 태그를 추가하거나 기존 태그를 편집하는 것도 손쉽게 가능합니다. 또한, 리소스 생성 시 자동으로 붙는 시스템 태그(kc:platform 등)도 함께 활용할 수 있습니다.

태그의 유형은 여기서 확인하세요!

이 밖에도 Resource Explorer는 클라우드 운영자가 자주 마주하는 상황을 더 빠르고 효율적으로 해결할 수 있도록 여러 기능을 함께 제공합니다.

📂 수많은 리소스, 한눈에 파악 – 통합 조회 기능

서비스별로 흩어진 리소스를 확인하려면, 콘솔을 오가며 하나하나 조회해야 했지만, 이제는 Resource Explorer에서 인스턴스, Block Storage, 퍼블릭 IP, 로드 밸런서, 백업까지 한 번에 확인할 수 있습니다. 프로젝트 내 전체 리소스 구조를 조망할 수 있어 자산 파악의 시작점으로 활용할 수 있습니다.

“운영 중인 모든 VM과 퍼블릭 IP 목록을 뽑아야 해.”
→ 프로젝트만 선택하면 자동으로 리스트업!

⏱️ 리소스를 바로 찾고, 바로 대응 – 조건 기반 빠른 검색

수많은 리소스 중 필요한 한두 개를 찾는 일, 생각보다 시간을 많이 잡아먹는 작업이죠. Resource Explorer에서는 이름, ID, 태그, 리전, 생성일 등 다양한 조건을 조합해 검색 조건을 저장하고 빠르게 재사용할 수 있는 탐색 기능을 제공합니다.

“지난달 생성된 Block Storage 중 이름에 ‘db’가 들어간 것만 보고 싶어.”
→ 조건 조합으로 필터링하면 몇 초 안에 바로 결과 확인!

🚀 이제 클라우드 리소스 관리는 더 가볍고 똑똑하게

Resource Explorer는 클라우드 운영자의 ‘눈’과 같은 도구입니다.👀 보이지 않던 리소스를 찾아주고, 파악이 어렵던 구조를 시각화하며, 보고와 대응의 흐름을 훨씬 빠르게 만들어 줍니다.

Resource Explorer는 별도 설정 없이 카카오클라우드 콘솔에서 바로 사용할 수 있습니다.
지금 바로 카카오클라우드를 시작하고, 다양한 서비스를 직접 경험해보세요.

Kubeflow로 시작하는 실전 머신러닝 워크플로우

2025년 5월 23일 · 약 4분

Jin (손진광)

Developer

Owen (정지성)

Developer

클라우드에서의 머신러닝(Machine Learning)과 AI 활용은 더 이상 특정 개발자나 연구자만의 영역이 아닌, 서비스를 기획하거나 운영하는 실무자, 혹은 AI 기술을 처음 접하는 입문자에게도 더 가까운 기술이 되고 있습니다.

카카오클라우드는 이런 흐름에 맞춰 최신 버전의 Kubeflow 서비스를 제공하고 있는데요, 이번에는 Kubeflow를 기반으로 누구나 머신러닝 파이프라인을 직접 구성해볼 수 있는 실습형 튜토리얼 시리즈 두 가지를 새롭게 제공하게 되었습니다.

이번에 공개된 튜토리얼은 LLM(대규모 언어 모델) 실습과 웹 서비스 트래픽 예측을 주제로 한 시리즈입니다. 단순한 코드 예제를 넘어, 모델 학습부터 서빙, 최적화, 자동화까지 실무 수준의 전 과정을 손쉽게 체험할 수 있습니다.

📘 생성형 AI, 직접 구현해보세요 — LLM 워크플로우 튜토리얼 시리즈

첫 번째 시리즈는 LLM 워크플로우 튜토리얼입니다.
이 시리즈는 대규모 언어 모델을 Kubeflow 환경에서 직접 서빙하고, 원하는 목적에 맞게 파인튜닝하며, 최종적으로 문서 기반 질의응답 시스템(RAG)을 구축하는 전 과정을 실습할 수 있도록 구성되었습니다.

특히 이 시리즈에선 Hugging Face Hub의 Meta Llama 3.2와 함께, 카카오가 자체 개발한 Kanana(카나나) 모델을 사용해 실습합니다. 실시간 추론부터 도메인 특화 학습까지 다양한 LLM 활용 시나리오를 직접 경험해볼 수 있습니다.

LLM 시리즈는 총 세 편으로 구성되어 있습니다.

1편: LLM 모델 서빙 Endpoint 생성
KServe를 이용해 사전 학습된 LLM을 클라우드 환경에 배포하고, 실시간 추론이 가능한 엔드포인트를 생성합니다.
2편: LLM 모델 파인튜닝
PEFT(LoRA 등)를 기반으로 선택한 모델을 특정 도메인 데이터로 효율적으로 재학습시키는 과정을 안내합니다. 학습 후 모델을 저장하고 재사용하는 방법도 포함됩니다.
3편: 문서 기반 RAG 구현
사용자의 텍스트 문서를 벡터 임베딩하여 FAISS에 저장하고, LangChain을 활용한 질의응답 API를 구성해 LLM 활용 사례를 완성합니다.

클라우드 환경에서 CPU/GPU를 활용해 직접 LLM을 구성해본다는 점에서, 이번 시리즈는 실제 제품화 가능성을 검토하려는 개발자와 AI 기획자에게 매우 유익한 출발점이 될 것이라는 생각입니다.

📌 Kubeflow 기반 LLM 워크플로우 시리즈 바로 가기

📈 로그에서 인사이트까지 — 트래픽 예측 모델 튜토리얼 시리즈

두 번째 시리즈는 트래픽 예측 모델을 구축하는 실습 튜토리얼입니다. 이 시리즈는 웹 서비스의 접근 로그 데이터를 수집하고, 이를 기반으로 향후 트래픽을 예측하는 시계열 머신러닝 모델을 만드는 과정을 단계별로 따라갑니다.

특히 이 튜토리얼은 분석에서 끝나지 않고, 학습된 모델을 API 형태로 서빙하고 전체 과정을 Kubeflow Pipelines로 자동화하는 것까지 다룹니다. 즉, 데이터 전처리부터 모델 개발, 하이퍼파라미터 최적화, 배포, 운영까지 엔드 투 엔드(End-to-End) 파이프라인을 한 번에 경험할 수 있습니다.

트래픽 예측 시리즈는 총 네 편으로 구성됩니다.

1편: 트래픽 데이터 수집 및 전처리
웹 서버 로그 데이터를 수집한 후, 시계열 분석에 적합한 형태로 정제합니다. 요일, 시간대 등 주기적 패턴을 반영한 피처를 생성해 머신러닝 모델 입력으로 활용할 수 있는 데이터셋을 구성합니다.
2편: 모델 하이퍼파라미터 튜닝
기본 모델 학습 결과를 바탕으로, Kubeflow Katib을 활용해 하이퍼파라미터 최적화를 수행하고 성능을 개선합니다.
3편: 모델 서빙 API 생성
학습된 모델을 KServe 기반 InferenceService로 배포하고 API 요청을 통해 예측을 수행합니다.
4편: 모델 파이프라인 구성
데이터 전처리, 모델 학습, 성능 검증, 서빙 배포까지의 전체 과정을 Kubeflow Pipelines로 자동화합니다.

이 시리즈는 운영 가능한 머신러닝 서비스 전체 흐름을 클라우드 환경에서 직접 실습할 수 있다는 점에서 MLOps 초입자 및 데이터 엔지니어에게 강력히 추천할 수 있습니다.

📌 Kubeflow 기반 트래픽 예측 모델 시리즈 바로 가기

🚀 Kubeflow로 시작하는 실전 머신러닝 워크플로우

이번에 공개한 두 시리즈는 모두 카카오클라우드의 Kubeflow 서비스를 기반으로 구성되었습니다. Kubeflow는 MLOps의 복잡한 과정을 간소화하고, 재현 가능한 머신러닝 실험을 쉽게 관리할 수 있게 도와주는 도구입니다.
GPU, 스토리지, 네트워크 설정 등 머신러닝 인프라를 카카오클라우드 콘솔에서 직관적으로 구성할 수 있고, 다양한 형태의 머신러닝 워크로드를 일관된 방식으로 배포하고 운영할 수 있는 기능을 제공합니다.

이번 튜토리얼은 단순히 따라 해보는 수준을 넘어, 실무에 적용 가능한 기술 흐름을 체득할 수 있는 실전형 학습 경로로 설계되었습니다. LLM과 같은 최신 생성형 AI 기술에서부터, 예측 모델과 파이프라인 구성까지! 복잡한 코드를 단순히 복사 실행하는 것이 아니라, 각 단계의 의미를 직접 구성해보는 방식으로 기술의 맥락을 이해하고, 활용 감각을 함께 기를 수 있습니다.

생성형 AI와 시계열 예측. 지금 주목받는 두 가지 머신러닝 분야를 카카오클라우드 환경에서 직접 실습하며 경험할 수 있습니다. Kubeflow 기반 실습 튜토리얼로 실전 머신러닝 파이프라인 구축을 시작해보세요.

📝 Machine Learning & AI 튜토리얼 모두 보기
👉 카카오클라우드 바로 시작하기

SSL 인증서를 더 안전하게, Certificate Manager 출시

2025년 4월 16일 · 약 2분

Joseph (송요섭)

Developer

2025년 4월, 카카오클라우드의 SSL 인증서 통합 관리 서비스인 Certificate Manager가 정식 출시되었습니다. 이제는 Load Balancer 나 Kubernetes Engine 등 개별 서비스에서 인증서를 각각 설정할 필요 없이, 하나의 통합된 콘솔에서 등록하고 연동할 수 있습니다.

🔐 Certificate Manager 서비스란?

Certificate Manager는 SSL 인증서를 등록하고 다양한 카카오클라우드 서비스에 연동할 수 있도록 지원하는 Management 그룹의 서비스입니다.
기존에는 서비스별로 인증서를 각각 설정해야 했지만, 이제는 인증서를 한 곳에서 등록하고 필요 시 선택하여 연동하는 방식으로 관리 효율성과 보안 일관성을 높일 수 있습니다.

주요 기능

카카오클라우드 Certificate Manager는 인증서의 라이프사이클을 통합적으로 관리할 수 있는 기능을 제공합니다.

🔐 인증서 등록 및 삭제
콘솔에서 SSL 인증서를 직접 등록할 수 있습니다.
PEM 형식의 인증서 본문, 프라이빗 키, 루트 및 중간 인증서를 포함한 체인 정보를 입력하면 간편하게 인증서를 추가할 수 있으며, 직관적인 UI에서 등록/삭제를 손쉽게 할 수 있습니다.
🧩 다양한 서비스에 연동
한 번 등록한 인증서를 다양한 서비스에 적용할 수 있습니다. 현재 Load Balancing ALB의 HTTPS 리스너 또는 NLB의 TLS 리스너 구성 시 드롭다운에서 인증서를 선택할 수 있게 개선되었고, Kubernetes Engine에서도 ALB 기반 HTTPS 인그레스를 구성할 때 등록된 인증서를 그대로 연동할 수 있습니다. 동일한 인증서를 반복 등록하지 않아도 되어 설정이 간소화되고, 보안 구성의 일관성과 운영 효율을 높일 수 있습니다.
⏰ 수명 주기 및 만료 관리
인증서의 만료일을 콘솔에서 확인할 수 있어, 갱신 또는 교체 시점을 사전에 파악하고 대응할 수 있습니다. 서비스 중단 없이 인증서를 주기적으로 관리할 수 있어, 안정적인 운영이 가능합니다.

✔️ Certificate Manager 출시로 개선된 사항을 요약하면 다음과 같습니다.

항목	기존	Certificate Manager 출시 이후
인증서 등록 위치	서비스별로 개별 등록	콘솔에서 통합 등록 후 다양한 서비스에서 선택 가능
리스너 구성 방식	서비스별로 직접 입력	등록된 인증서를 드롭다운에서 선택
만료일 관리	별도 추적 필요	콘솔에서 만료일 등 메타데이터 확인 가능

Certificate Manager는 기본적으로 제공되는 관리 서비스로, 자세한 사용 방법은 Certificate Manager 사용 가이드를 참고해 주세요.

📝 함께 보면 좋은 문서

카카오클라우드는 앞으로도 Certificate Manager의 출시와 같이 사용자의 운영 편의성과 보안 강화를 위한 기능들을 지속적으로 개선해 나가겠습니다. 보다 안전하고 신뢰할 수 있는 카카오클라우드를 직접 경험해 보시기를 바랍니다.

감사합니다.

Alert Center 서비스 전용 IAM 역할 소개

2025년 2월 24일 · 약 3분

Kali (명시온)

Service Manager

📢 Alert Center 권한이 세분화되었습니다!

카카오클라우드 Alert Center의 권한 관리 방식이 개선되어, 조직 및 프로젝트 단위에서 보다 정교한 역할을 설정할 수 있게 되었습니다. 이를 통해 사용자별로 적절한 권한을 부여하여 보다 안전하고 효율적으로 알림 정책을 운영할 수 있습니다.

이번 글에서는 Alert Center 전용 IAM 역할이 무엇인지, 그리고 이를 어떻게 효과적으로 활용할 수 있는지 소개해 드리겠습니다.

🔐 IAM과 Alert Center 권한 구조

카카오클라우드의 IAM(Identity and Access Management)은 클라우드 리소스의 접근 권한을 제어하는 서비스입니다. IAM에서는 RBAC(Role-Based Access Control, 역할 기반 접근 제어) 방식을 사용하여, 특정 역할을 부여받은 사용자만 필요한 리소스에 접근할 수 있도록 합니다.

기존에는 Alert Center 리소스의 권한을 조직 또는 프로젝트 단위로 세분화할 수 없어, 특정 조직이나 프로젝트의 알림만 관리하려는 사용자에게 적절한 권한을 부여하기 어려웠습니다. 이번 개선을 통해 조직 단위와 프로젝트 단위에서 각각 매니저와 뷰어 역할을 부여할 수 있도록 변경되어, 보다 유연한 권한 관리가 가능해졌습니다.

즉, 조직 전체의 Alert Center 관리를 담당하는 경우에는 조직 단위의 역할을, 특정 프로젝트의 알림만 관리하려는 경우에는 프로젝트 단위의 역할을 부여할 수 있습니다.

🏢 Alert Center 전용 역할 소개

🏛️ 조직 단위에서의 역할 관리

조직 단위의 Alert Center 역할은 IAM 및 Billing 서비스에서 발생하는 알림을 관리하는 권한을 가집니다. 조직 내에서 Alert Center 리소스를 관리하려면 Alert Center 조직 매니저 또는 Alert Center 조직 뷰어 역할을 부여해야 합니다.

조직 매니저는 Alert Center의 모든 리소스를 조회하고, 알림 정책과 수신 채널을 직접 관리할 수 있습니다. 반면, 조직 뷰어는 모든 리소스를 조회할 수 있지만 설정 변경은 불가능합니다. Alert Center의 알림 설정을 변경해야 한다면 매니저 역할을, 단순히 모니터링만 필요하다면 뷰어 역할을 부여하면 됩니다.

📌 프로젝트 단위에서의 역할 관리

Alert Center는 조직 단위뿐만 아니라 프로젝트 단위에서도 활용됩니다. 프로젝트 단위의 Alert Center 역할은 개별 프로젝트에서 발생하는 메트릭, 로그, 이벤트 등의 알림을 관리하는 권한을 가집니다. 특정 프로젝트에서 발생하는 알림을 관리해야 하는 경우, Alert Center 프로젝트 매니저 또는 Alert Center 프로젝트 뷰어 역할을 부여하면 됩니다.

프로젝트 매니저는 해당 프로젝트 내 모든 Alert Center 리소스를 조회하고, 알림 정책 및 수신 채널을 관리할 수 있습니다. 프로젝트 뷰어는 모든 리소스를 조회할 수 있지만, 설정을 변경할 수는 없습니다.

🚨 3월 18일부터 변경되는 사항

새로운 권한 시스템이 도입되면서 3월 18일부터 Alert Center의 기능을 사용하려면 반드시 적절한 역할이 할당되어야 합니다.

✔️ 조직 또는 프로젝트의 관리자, 혹은 Alert Center 역할을 가진 사용자만 리소스를 관리할 수 있습니다.
✔️ 권한이 없는 사용자는 Alert Center 리소스를 조회만 할 수 있으며, 기본 수신 채널의 수신자 목록은 조회할 수 없습니다.
✔️ 3월 18일 전까지는 기존과 동일하게 역할이 없어도 Alert Center의 리소스를 생성 및 삭제할 수 있습니다. 즉, 3월 18일 이후에도 Alert Center에서 알림 정책을 설정하려면 반드시 조직 또는 프로젝트 단위에서 적절한 역할을 미리 할당해야 합니다.

🔎 Alert Center를 더 안전하고 유연하게 활용하세요

새로운 Alert Center 전용 역할이 추가되었지만, 기존 IAM 프로젝트 역할이 있는 사용자도 일부 기능을 계속 사용할 수 있습니다.

예를 들어, 프로젝트 멤버 또는 프로젝트 리더 역할이 있는 사용자는 여전히 Alert Center에서 알림 정책, 수신 채널, 발신 내역을 열람할 수 있습니다. 다만, 수신 채널 내에서 수신자 목록은 조회할 수 없습니다. 즉, 기본적인 모니터링은 가능하지만, 세부적인 알림 관리를 위해서는 새로운 Alert Center 역할이 필요합니다.

Alert Center는 클라우드 서비스에서 발생하는 다양한 이벤트와 로그를 감지하고 알림을 제공하는 서비스입니다. 이번 IAM 역할 세분화를 통해 조직과 프로젝트 단위에서 보다 안전하고 효율적인 권한 관리가 가능해졌습니다. 안정적인 시스템 운영을 위해 필요한 역할을 잘 설정해 주세요.

더 자세한 내용은 Alert Center > 주요 개념에서 확인하실 수 있습니다.

감사합니다!

Kafka를 통한 CDC Pipeline 구축하기

2024년 12월 30일 · 약 4분

Harry (장민호)

Developer

안녕하세요. 이번 글에서는 카카오클라우드의 서비스들을 활용하여 실시간 데이터 동기화를 위한 CDC(Change Data Capture) 파이프라인을 구축하는 방법을 소개하려고 합니다.

CDC(Change Data Capture)는 데이터베이스의 변경 사항을 실시간으로 감지하고 이를 다른 시스템에 전달하는 기술입니다. 데이터베이스에서 발생하는 INSERT, UPDATE, DELETE 등의 변경 사항을 캡처하여 다른 시스템으로 전달함으로써, 실시간 데이터 동기화와 처리가 가능합니다. 이 기술은 마이크로서비스 간 실시간 데이터 공유, 실시간 분석을 위한 최신 데이터 제공, 데이터 백업의 신뢰성과 속도 향상 등 다양한 목적에 널리 활용됩니다.

고성능 관리형 모니터링을 위한 Advanced Managed Prometheus 서비스 출시

2024년 12월 26일 · 약 4분

Evan (진은용)

Service Manager

안녕하세요.
2024년 12월 26일 카카오클라우드의 새로운 서비스, Advanced Managed Prometheus가 출시되었습니다. 🎉

그 동안 클라우드 환경에서 복잡한 모니터링 설정이나 예상치 못한 장애 처리로 어려움을 겪은 적이 있으시다면, Advanced Managed Prometheus 서비스를 눈여겨 보시면 좋을 것 같습니다.

Advanced Managed Prometheus는 클라우드 네이티브 환경에서 메트릭 데이터를 효율적으로 수집, 저장, 분석할 수 있는 고성능 관리형 모니터링 서비스입니다. Kubernetes, Virtual Machine, 애플리케이션 등에서 발생하는 대규모 데이터를 안정적으로 처리할 수 있도록 설계되었으며, Prometheus의 기본 기능을 기반으로 클라우드 환경에 최적화된 확장성과 안정성을 제공합니다.

Prometheus란?

Prometheus는 2012년 SoundCloud에서 시작된 프로젝트로 현재는 Cloud Native Computing Foundation (CNCF)의 공식 프로젝트입니다. 메트릭 기반 모니터링을 제공하며, 시스템 및 애플리케이션 성능 데이터를 수집, 저장, 분석합니다. 특히 시계열(time-series) 데이터베이스를 기반으로 데이터를 효율적으로 저장하고 쿼리합니다.
확장성, 신뢰성, 유연성을 갖춘 Prometheus는 클라우드 네이티브 환경에서 필수적인 모니터링 도구라고 할 수 있습니다.

Advanced Managed Prometheus 서비스는?

그럼 카카오클라우드의 Advanced Managed Prometheus의 주요 기능과 특징에 대해 자세히 살펴보겠습니다.
Advanced Managed Prometheus는 Prometheus의 강력한 기능을 클라우드 네이티브 환경에 최적화한 서비스로, 복잡한 설정 없이도 실시간 메트릭 수집 및 모니터링을 제공합니다.

대규모 환경에서는 데이터 저장 용량과 처리 속도의 제약, 클러스터 구성 및 유지보수의 어려움, 장애를 사전에 감지하지 못하는 문제를 겪을 수 있는데요. Advanced Managed Prometheus는 이러한 운영상의 어려움을 해결하기 위해 설계되었습니다. 이 서비스는 데이터 지연이나 손실 위험 없이 실시간으로 메트릭 데이터를 수집합니다. 또한 Prometheus의 설치, 설정, 백업을 자동화함으로써 운영 부담을 줄이고, 사용자가 인프라 관리 대신 비즈니스 로직과 성능 최적화에 집중할 수 있도록 돕습니다.

특히 Kubernetes 환경에서는 대규모 컨테이너 기반 워크로드를 효과적으로 관리하며 클라우드 네이티브 애플리케이션의 가시성을 크게 향상시킵니다.

Advanced Managed Prometheus 주요 기능

1. 자동화된 운영 관리

Prometheus의 설치, 업그레이드, 백업을 자동화하여 운영 부담을 최소화합니다.
사용자는 복잡한 설정 없이도 안정적인 모니터링 환경을 구축할 수 있습니다.

2. 확장 가능한 데이터 스토리지

대규모 메트릭 데이터도 안정적으로 보존하고 처리할 수 있습니다.
증가하는 데이터 볼륨에도 탄력적으로 대응하여 성능을 유지합니다.

3. 실시간 알림 및 Alert Center 연동

카카오클라우드 Alert Center와 연동하여 주요 메트릭 및 로그에 대한 임계치 알림을 설정할 수 있습니다.
문제 발생 시 즉각적인 알림 메시지를 통해 신속하게 대응할 수 있습니다.

4. 통합 모니터링

Kubernetes, VM, 애플리케이션 등 다양한 리소스를 통합적으로 모니터링하고 관리할 수 있습니다.
모든 리소스를 한눈에 파악할 수 있어 운영 효율성이 높아집니다.

5. 실시간 대시보드 및 시각화

Grafana와 연동하여 실시간 대시보드 및 시각화 기능을 제공합니다.
복잡한 메트릭 데이터를 직관적으로 분석하고 이해할 수 있습니다.

사용 목적 및 사례

Advanced Managed Prometheus는 다음과 같은 상황에서 특히 유용합니다.

Kubernetes 클러스터의 대규모 워크로드 모니터링
VM 및 애플리케이션의 리소스 사용 현황 분석
실시간 메트릭 데이터 수집 및 알림 관리
운영 부담을 최소화하며 안정적인 모니터링 환경 구축

마무리하며

카카오클라우드의 Advanced Managed Prometheus는 클라우드 네이티브 환경에서 모니터링과 알림을 더 쉽고 안정적으로 운영할 수 있도록 설계되었습니다. 사실 그 동안 많은 고객 분들의 요청과 피드백을 바탕으로 Advanced Managed Prometheus 서비스가 탄생하게 되었는데요. 복잡한 모니터링 설정과 유지보수 부담을 줄이고, 더 효과적으로 인프라를 관리할 수 있도록 고민하고, 또 고민했습니다.

카카오클라우드 콘솔에서 Advanced Managed Prometheus 서비스를 선택해 간편하게 모니터링 환경을 구축해 보세요. 더 자세한 내용은 How-to Guides 문서를 참고해 보시면 좋을 것 같습니다.

감사합니다.

🖥️ 내 역할 정보를 손쉽게 확인할 수 있어요​

🎉 IAM과 프로젝트 관리 기능을 위한 역할이 새롭게 추가되었어요​

💡 사용성을 높이고, 책임을 분명히​

운영자가 직접 체감하는 변화​

Maintenance, 이렇게 활용할 수 있습니다​

불확실성을 줄이는 예측 가능한 유지관리​

🎬 1편. IAM 시작하기 – 개념과 기본 구조​

🎬 2편. IAM 그룹과 서비스 계정 – 사용자 관리 효율 높이기​

🎬 3편. Cloud Trail로 IAM 변경 이력 추적하기​

🎬 4편. IAM 운영 Best Practice 살펴보기​

🏷️ 리소스를 ‘맥락’으로 구분하는 방법 - '태그'!​

📂 수많은 리소스, 한눈에 파악 – 통합 조회 기능​

⏱️ 리소스를 바로 찾고, 바로 대응 – 조건 기반 빠른 검색​

🚀 이제 클라우드 리소스 관리는 더 가볍고 똑똑하게​

📘 생성형 AI, 직접 구현해보세요 — LLM 워크플로우 튜토리얼 시리즈​

📈 로그에서 인사이트까지 — 트래픽 예측 모델 튜토리얼 시리즈​

🚀 Kubeflow로 시작하는 실전 머신러닝 워크플로우​

🔐 Certificate Manager 서비스란?​

주요 기능​

📝 함께 보면 좋은 문서​

📢 Alert Center 권한이 세분화되었습니다!​

🔐 IAM과 Alert Center 권한 구조​

🏢 Alert Center 전용 역할 소개​

🏛️ 조직 단위에서의 역할 관리​

📌 프로젝트 단위에서의 역할 관리​

🚨 3월 18일부터 변경되는 사항​

🔎 Alert Center를 더 안전하고 유연하게 활용하세요​

🚀 Kubernetes Engine과 Rancher 연동 – 멀티 클러스터 관리 최적화​

📊 MySQL과 태블로 연동 – 클라우드 데이터 시각화 구현​

🔍 Cloud Trail 로그를 Splunk로 분석 – 실시간 보안 및 운영 모니터링​

🛠 카카오클라우드와 다양한 솔루션의 효율적인 활용​

Advanced Managed Prometheus 서비스는?​

Advanced Managed Prometheus 주요 기능​

사용 목적 및 사례​

마무리하며​

🖥️ 내 역할 정보를 손쉽게 확인할 수 있어요

🎉 IAM과 프로젝트 관리 기능을 위한 역할이 새롭게 추가되었어요

💡 사용성을 높이고, 책임을 분명히

운영자가 직접 체감하는 변화

Maintenance, 이렇게 활용할 수 있습니다

불확실성을 줄이는 예측 가능한 유지관리

🎬 1편. IAM 시작하기 – 개념과 기본 구조

🎬 2편. IAM 그룹과 서비스 계정 – 사용자 관리 효율 높이기

🎬 3편. Cloud Trail로 IAM 변경 이력 추적하기

🎬 4편. IAM 운영 Best Practice 살펴보기

🏷️ 리소스를 ‘맥락’으로 구분하는 방법 - '태그'!

📂 수많은 리소스, 한눈에 파악 – 통합 조회 기능

⏱️ 리소스를 바로 찾고, 바로 대응 – 조건 기반 빠른 검색

🚀 이제 클라우드 리소스 관리는 더 가볍고 똑똑하게

📘 생성형 AI, 직접 구현해보세요 — LLM 워크플로우 튜토리얼 시리즈

📈 로그에서 인사이트까지 — 트래픽 예측 모델 튜토리얼 시리즈

🚀 Kubeflow로 시작하는 실전 머신러닝 워크플로우

🔐 Certificate Manager 서비스란?

주요 기능

📝 함께 보면 좋은 문서

📢 Alert Center 권한이 세분화되었습니다!

🔐 IAM과 Alert Center 권한 구조

🏢 Alert Center 전용 역할 소개

🏛️ 조직 단위에서의 역할 관리

📌 프로젝트 단위에서의 역할 관리

🚨 3월 18일부터 변경되는 사항

🔎 Alert Center를 더 안전하고 유연하게 활용하세요

🚀 Kubernetes Engine과 Rancher 연동 – 멀티 클러스터 관리 최적화

📊 MySQL과 태블로 연동 – 클라우드 데이터 시각화 구현

🔍 Cloud Trail 로그를 Splunk로 분석 – 실시간 보안 및 운영 모니터링

🛠 카카오클라우드와 다양한 솔루션의 효율적인 활용

Advanced Managed Prometheus 서비스는?

Advanced Managed Prometheus 주요 기능

사용 목적 및 사례

마무리하며