주요 개념
Advanced AI Space는 AI 모델을 안정적으로 추론(Serving)할 수 있도록 지원하는 엔드포인트 기반 서비스입니다. 모델 카탈로그, 엔드포인트, GPU 프로파일, 모니터링 기능, API Key 등으로 구성되어 있으며, 사용자는 이들을 조합해 자신에게 맞는 추론 환경을 설계하고 운영할 수 있습니다.
안내
본 서비스는 사전 신청 고객에 한해 제공됩니다.
이용을 원하시면 헬프데스크 > 기타 문의에서 ‘Advanced AI Space 사용 신청’을 남겨 주세요. (단, 승인까지 일정 시간이 소요될 수 있습니다.)
모델 카탈로그
모델 카탈로그는 Advanced AI Space에서 사용할 수 있는 AI 모델 정보를 제공하는 저장소로, 기본 제공 모델과 커스텀 모델로 구분됩니다.
기본 제공 모델
- 카카오클라우드에서 사전에 검증한 모델입니다.
- 사용자는 모델의 상세 설명, 버전, 성능 정보를 확인한 뒤 즉시 추론 엔드포인트를 생성할 수 있습니다.
- 안정성과 호환성이 보장되어 빠른 서비스 적용이 가능합니다.
- 기본 제공 모델 리스트
상태 | 설명 |
---|---|
kanana-1.5-8b | 생성형 LLM으로 중형 범용 성능을 제공하며 명령어 수행·일반 생성에 적합한 모델 |
kanana-1.5-15.7b | 생성형 LLM으로 대형급 성능을 지향하며 추론 안정성·품질을 강화한 모델 |
kanana-1.5-2.1b | 생성형 LLM으로 경량·저비용을 지향하며 빠른 응답과 PoC·엣지에 적합한 모델 |
gpt-oss-20b | 생성형 LLM으로 20B급 오픈웨이트 모델이며 고품질 텍스트 생성·전문화에 적합한 모델 |
Qwen3-4B | 생성형 LLM으로 소형 범용 성능을 제공하며 다국어·명령어 수행에 적합한 모델 |
Qwen3-14B | 생성형 LLM으로 중대형 범용 성능을 제공하며 고품질 생성·추론에 적합한 모델 |
Qwen3-30B | 생성형 LLM으로 대형 범용 성능을 제공하며 복잡한 과업의 안정적 추론에 적합한 모델 |
bge-m3 | 임베딩 모델로 다국어·다기능(밀집/멀티벡터/스파스) 임베딩을 제공해 검색·RAG에 적합한 모델 |
bert-base-cased | 인코더 모델로 대소문자를 구분하는 영어 일반 도메인 베이스라인에 적합한 모델 |
bert-base-ner | 인코더 모델로 영어 개체명 인식(NER)에 특화된 파인튜닝 모델 |
twitter-roberta-base | 인코더 모델로 트위터 도메인 텍스트 처리와 분류 태스크에 적합한 모델 |
t5-base | Text-to-Text 모델로 요약·번역·질의응답 등 범용 시퀀스 변환에 적합한 모델 |
커스텀 모델
- 사용자가 직접 학습한 모델 또는 허깅페이스(Hugging Face) 등 외부 공개 모델을 업로드해 활용할 수 있습니다.
- 모델 등록 후 카탈로그에서 관리되며, 엔드포인트를 통해 서비스에 배포할 수 있습니다.
- GPU 프로파일을 선택해 자원 규모를 조정하고, 서비스 목적에 맞는 환경을 구성할 수 있습니다.
엔드포인트
엔드포인트는 선택한 모델을 클라우드 환경에서 서비스 형태로 제공하는 전용 추론 환경입니다.
엔드포인트 생성
- 모델 카탈로그에서 원하는 기본 제공 모델이나 커스텀 모델을 선택해 엔드포인트를 생성할 수 있습니다.
- 생성 시 GPU 프로파일 및 MIG 옵션을 지정하여 성능과 비용을 최적화할 수 있습니다.
엔드포인트 상태 관리
- 엔드포인트는 상태값을 통해 현재 동작 여부를 확인할 수 있습니다.
- 생성, 수정, 삭제, 중지 등의 작업에 따라 상태가 변하며, 직관적으로 서비스 운영 상황을 파악할 수 있습니다.
상태 | 설명 |
---|---|
Creating | 엔드포인트 생성 요청 |
Active (unhealthy) | 엔드포인트 관련 자원 생성 중 |
Active | 엔드포인트 서비스 가능 상태 |
Updating | 엔드포인트 업데이트 중 |
Deleting | 엔드포인트 삭제 중 |
Stopping | 엔드포인트 중지 중 |
Stopped | 엔드포인트 중지 상태 |
Failed | 엔드포인트 생성/수정/삭제 실패 |
운영 및 관리 기능
- 엔드포인트 수정 및 삭제, 최신 모델 리비전 적용 가능
- 파드 로그 확인, GPU 자원 사용량 모니터링 제공
API Key
API Key는 추론 엔드포인트를 호출하기 위한 인증 수단입니다.
생성 및 관리
- 사용자는 엔드포인트별 호출에 필요한 API Key를 생성할 수 있습니다.
- Key는 만료 기간이 지정되며, 만료 시 간단한 절차로 재생성 가능합니다.
보안 및 접근 제어
- 모든 추론 요청은 API Key 인증을 반드시 거쳐야 하며, 특정 프로젝트 단위에서만 사용 가능합니다.
- 이를 통해 외부 API 대비 강화된 보안성을 제공하고, 민감 데이터가 포함된 서비스 환경에서도 안전하게 활용할 수 있습니다.