본문으로 건너뛰기

주요 개념

Advanced AI Space는 AI 모델을 안정적으로 추론(Serving)할 수 있도록 지원하는 엔드포인트 기반 서비스입니다. 모델 카탈로그, 엔드포인트, GPU 프로파일, 모니터링 기능, API Key 등으로 구성되어 있으며, 사용자는 이들을 조합해 자신에게 맞는 추론 환경을 설계하고 운영할 수 있습니다.

안내

본 서비스는 사전 신청 고객에 한해 제공됩니다.
이용을 원하시면 헬프데스크 > 기타 문의에서 ‘Advanced AI Space 사용 신청’을 남겨 주세요. (단, 승인까지 일정 시간이 소요될 수 있습니다.)

모델 카탈로그

모델 카탈로그는 Advanced AI Space에서 사용할 수 있는 AI 모델 정보를 제공하는 저장소로, 기본 제공 모델커스텀 모델로 구분됩니다.

기본 제공 모델

  • 카카오클라우드에서 사전에 검증한 모델입니다.
  • 사용자는 모델의 상세 설명, 버전, 성능 정보를 확인한 뒤 즉시 추론 엔드포인트를 생성할 수 있습니다.
  • 안정성과 호환성이 보장되어 빠른 서비스 적용이 가능합니다.
  • 기본 제공 모델 리스트
상태설명
kanana-1.5-8b생성형 LLM으로 중형 범용 성능을 제공하며 명령어 수행·일반 생성에 적합한 모델
kanana-1.5-15.7b생성형 LLM으로 대형급 성능을 지향하며 추론 안정성·품질을 강화한 모델
kanana-1.5-2.1b생성형 LLM으로 경량·저비용을 지향하며 빠른 응답과 PoC·엣지에 적합한 모델
gpt-oss-20b생성형 LLM으로 20B급 오픈웨이트 모델이며 고품질 텍스트 생성·전문화에 적합한 모델
Qwen3-4B생성형 LLM으로 소형 범용 성능을 제공하며 다국어·명령어 수행에 적합한 모델
Qwen3-14B생성형 LLM으로 중대형 범용 성능을 제공하며 고품질 생성·추론에 적합한 모델
Qwen3-30B생성형 LLM으로 대형 범용 성능을 제공하며 복잡한 과업의 안정적 추론에 적합한 모델
bge-m3임베딩 모델로 다국어·다기능(밀집/멀티벡터/스파스) 임베딩을 제공해 검색·RAG에 적합한 모델
bert-base-cased인코더 모델로 대소문자를 구분하는 영어 일반 도메인 베이스라인에 적합한 모델
bert-base-ner인코더 모델로 영어 개체명 인식(NER)에 특화된 파인튜닝 모델
twitter-roberta-base인코더 모델로 트위터 도메인 텍스트 처리와 분류 태스크에 적합한 모델
t5-baseText-to-Text 모델로 요약·번역·질의응답 등 범용 시퀀스 변환에 적합한 모델

커스텀 모델

  • 사용자가 직접 학습한 모델 또는 허깅페이스(Hugging Face) 등 외부 공개 모델을 업로드해 활용할 수 있습니다.
  • 모델 등록 후 카탈로그에서 관리되며, 엔드포인트를 통해 서비스에 배포할 수 있습니다.
  • GPU 프로파일을 선택해 자원 규모를 조정하고, 서비스 목적에 맞는 환경을 구성할 수 있습니다.

엔드포인트

엔드포인트는 선택한 모델을 클라우드 환경에서 서비스 형태로 제공하는 전용 추론 환경입니다.

엔드포인트 생성

  • 모델 카탈로그에서 원하는 기본 제공 모델이나 커스텀 모델을 선택해 엔드포인트를 생성할 수 있습니다.
  • 생성 시 GPU 프로파일 및 MIG 옵션을 지정하여 성능과 비용을 최적화할 수 있습니다.

엔드포인트 상태 관리

  • 엔드포인트는 상태값을 통해 현재 동작 여부를 확인할 수 있습니다.
  • 생성, 수정, 삭제, 중지 등의 작업에 따라 상태가 변하며, 직관적으로 서비스 운영 상황을 파악할 수 있습니다.
상태설명
Creating엔드포인트 생성 요청
Active (unhealthy)엔드포인트 관련 자원 생성 중
Active엔드포인트 서비스 가능 상태
Updating엔드포인트 업데이트 중
Deleting엔드포인트 삭제 중
Stopping엔드포인트 중지 중
Stopped엔드포인트 중지 상태
Failed엔드포인트 생성/수정/삭제 실패

운영 및 관리 기능

  • 엔드포인트 수정 및 삭제, 최신 모델 리비전 적용 가능
  • 파드 로그 확인, GPU 자원 사용량 모니터링 제공

API Key

API Key는 추론 엔드포인트를 호출하기 위한 인증 수단입니다.

생성 및 관리

  • 사용자는 엔드포인트별 호출에 필요한 API Key를 생성할 수 있습니다.
  • Key는 만료 기간이 지정되며, 만료 시 간단한 절차로 재생성 가능합니다.

보안 및 접근 제어

  • 모든 추론 요청은 API Key 인증을 반드시 거쳐야 하며, 특정 프로젝트 단위에서만 사용 가능합니다.
  • 이를 통해 외부 API 대비 강화된 보안성을 제공하고, 민감 데이터가 포함된 서비스 환경에서도 안전하게 활용할 수 있습니다.