대시보드 사용
Kubeflow 대시보드 접근
본격적인 MLOps 워크플로우를 구성하기 위해서는 Notebook, Pipelines등과 같은 컴포넌트 접속을 지원하는 Kubeflow 대시보드 웹 콘솔 접근이 필요합니다.
로드 밸런서를 통한 접근
서비스 생성 시 Kubeflow 인그레스 컨트롤러를 통해 생성된 카카오클라우드 Load balancer 서비스에 할당된 퍼블릭/프라이빗 IP를 통해 직접 접근 및 DNS 연결이 가능합니다.
퍼블릭 IP 연결에 대한 자세한 설명은 퍼블릭 IP로 Kubeflow 대시보드 연결을 참고하시기 바랍니다.
- 퍼블릭 IP 연결 후 TLS 설정이 필요합니다. TLS 미설정 시 Visual Studio 및 RStudio 사용이 원활하지 않을 수 있습니다.
Kubectl Port-forwarding으로 접근
Kubeflow 게이트웨이에 접근하거나 Kubeflow Istio 게이트웨이로 kubectl
CLI를 통해 포트 포워딩 연결도 가능합니다.
kubectl port-forward -n istio-system svc/istio-ingressgateway 8080:80
Kubectl CLI 설치 관련 자세한 설명은 kubectl 제어 설정을 참고하시기 바랍니다.
로그인
-
사용자 등록 시 사용된 이메일 주소와 해당 주소로 발송된 임시 비밀번호를 통해 로그인합니다. Kubeflow 사용자 로그인
-
로그인 후 패스워드를 변경합니다. Kubeflow 사용자 패스워드 변경
Dashboard
Dashboard는 로그인 인증을 통해 사용자에게 허가된 Notebooks, Experiments(AutoML), Experiments (KFP) 등의 컴포넌트 UI를 웹브라우저 형태로 제공합니다.
- Kubeflow 1.8 버전
- Kubeflow 1.6 버전
Kubeflow 대시보드 메뉴 구성
구분 | 설명 |
---|---|
Notebooks | 노트북 서버 관리 |
TensorBoards | TensorBoard 서버 관리 |
Volumes | 클러스터 볼륨 관리 |
Endpoints | Kserve 모델 배포 관리 |
Training Jobs | Training Job 관리 |
Experiments (AutoML) | Katib을 통한 기계 학습 자동화 관리 |
Experiments (KFP) | 파이프라인 실험 관리 |
Pipelines | 파이프라인 관리 |
Runs | 파이프라인 Run(실행 단위) 관리 |
Recurring Runs | 파이프라인 Run 스케줄링 관리 |
Artifacts | ML Workflow 내 입력값 또는 결괏값으로 사용되는 파일 관리 및 추적 |
Executions | ML Workflow 내 컴포넌트 실행 결과 관리 및 추적 |
Manage Account | 사용자 대시보드 계정 관리 (비밀번호 재설정, 접근 가능한 네임스페이스 목록 확인 등) |
Manage Group Users | 그룹 네임스페이스 사용자 관리 (그룹 네임스페이스 Admin 권한 보유 시에만 노출되는 메뉴) |
Kubeflow 대시보드 메뉴 구성
구분 | 설명 |
---|---|
Notebooks | 노트북 서버 관리 |
TensorBoards | TensorBoard 서버 관리 |
Volumes | 클러스터 볼륨 관리 |
Models | Kserve 모델 배포 관리 |
Training Jobs | Training Job 관리 |
Experiments (AutoML) | Katib을 통한 기계 학습 자동화 관리 |
Experiments (KFP) | 파이프라인 실험 관리 |
Pipelines | 파이프라인 관리 |
Runs | 파이프라인 Run(실행 단위) 관리 |
Recurring Runs | 파이프라인 Run 스케줄링 관리 |
Artifacts | ML Workflow 내 입력값 또는 결괏값으로 사용되는 파일 관리 및 추적 |
Executions | ML Workflow 내 컴포넌트 실행 결과 관리 및 추적 |
Manage Account | 사용자 대시보드 계정 관리 (비밀번호 재설정, 접근 가능한 네임스페이스 목록 확인 등) |
Manage Group Users | 그룹 네임스페이스 사용자 관리 (그룹 네임스페이스 Admin 권한 보유 시에만 노출되는 메뉴) |
자세한 설명은 Kubeflow > Central Dashboard 공식 문서를 확인해 주세요.
그룹 사용자 관리
Manage Group Users 탭을 통해 그룹 네임스페이스에 사용자를 추가하거나 등록된 사용자를 관리할 수 있습니다.
해당 탭은 그룹 네임스페이스 Admin 권한 보유 시에만 노출되며, 2개 이상의 그룹 네임스페이스 Admin 권한을 보유한 경우 선택한 그룹 네임스페이스별로 사용자를 관리할 수 있습니다.
-
원하는 그룹 네임스페이스를 선택합니다.
-
Manage Group User 탭을 선택합니다.
-
[Add Group User] 버튼을 통해 사용자를 추가하거나 [Remove User] 버튼을 통해 사용자 제거가 가능합니다.
- 그룹에서 사용자를 제거해도 사용자가 Kubeflow에서 삭제되는 것은 아니며 그룹에서만 빠지게 됩니다. 사용자 삭제는 Kubeflow 탭별 정보의 사용자 탭을 참고하시기 바랍니다.
-
[RESET PASSWORD] 버튼을 통해 사용자의 비밀번호를 초기화할 수 있습니다.
- Admin 권한을 가진 사용자만 Edit,View 권한이 있는 다른 사용자의 비밀번호를 초기화할 수 있습니다.
- 만약 Edit/View 권한이 있는 사용자가 여러 그룹에 속해있을 경우 대시보드에서는 초기화는 불가하며, 콘솔 > 사용자 수정을 통해 가능합니다.
-
Admin 권한이 있는 사용자의 비밀번호 초기화는 콘솔 > 사용자 수정에서 가능합니다.
Tensorboard 관리
Tensorboard는 Notebook 또는 Pipeline의 결과값을 시각화할 수 있는 도구입니다.
기본적인 사용 방법은 Tensorboard에서 사용할 로그가 저장된 스토리지를 선택한 뒤 저장된 마운트 패스 값을 입력해 주면 데이터를 읽어와 시각화를 할 수 있습니다.
-
TensorBoards 탭을 선택 후 [New TensorBoard] 버튼을 클릭합니다.
-
Tensorboard 이름을 입력 후 로그가 저장된 스토리지(KC Object Storage / PVC)를 선택합니다.
KakaoCloud Object Storage 선택 시
-
Object Storage 메뉴 선택 후, 버킷 탭에서 정보를 확인할 파일이 있는 버킷을 선택합니다.
-
객채 텝에서 정보를 확인할 파일의 [더 보기] 아이콘 > 파일 정보를 선택합니다.
-
파일 정보 팝업창에서 URL을 복사합니다.
-
복사한 URL 내에서 ‘파일명’을 제외한 경로를 입력합니다.
-
예시:
https://objectstorage.kr-central-2.kakaocloud.com/v1/073fcf9f6d269789bb/kubeflow/tensorboard/temp/test.log
인 경우 test.log 파일명 제거 -
또는 버킷 최상위 경로부터 상대 경로까지 입력해 줍니다.
예시: bucket > temp 폴더에 저장되어 있을 시temp
만 입력 / bucket > temp > temp1의 경우temp/temp1
입력
-
PVC 선택 시
- PVC 메뉴 선택 후 버킷 탭에서 정보를 확인할 파일이 있는 버킷을 선택합니다.
- 마운트 패스 값을 입력합니다.
-
-
필요한 만큼의 CPU와 메모리를 설정한 후 [Create] 버튼을 클릭합니다.
Kubeflow 서비스를 활용한 더 많은 사용 예제는 튜토리얼의 Machine Learning & AI 카테고리에서 확인할 수 있습니다.