NPU 인스턴스

NPU는 Neural Processing Unit(신경망 처리 장치)의 약자로, 주로 인공 신경망 작업을 수행하는 데 특화된 하드웨어입니다. NPU 기반 인스턴스는 이러한 NPU를 사용하여 작업을 가속화하는 인스턴스를 말합니다.
NPU는 기존의 중앙 처리 장치(CPU)와는 다른 딥러닝 작업을 효율적으로 처리하기 위해 최적화되어 있어 벡터 및 행렬 연산을 병렬적으로 처리하고, 대규모의 행렬 곱셈 및 합성곱 작업을 빠르게 수행할 수 있습니다. 이러한 NPU 기반 인스턴스는 대규모 딥러닝 작업을 처리해야 하는 경우에 특히 유용합니다. 딥러닝 모델을 더 빠르게 학습하고 추론할 수 있으며, 딥러닝 애플리케이션의 성능과 처리량을 크게 향상할 수 있습니다.

적용 유형 : gf1i

gf1i

gf1i 인스턴스는 4세대 Intel 제온 스케일러블 프로세서로 구동되며, FuriosaAI WARBOY NPU 카드를 탑재해 딥 러닝 워크로드에 매우 적합합니다.

하드웨어 사양

최대 3.4GHz의 4세대 Intel 제온 스케일러블 프로세서(Xeon Gold 6430)
최대 50Gbps의 네트워크 대역폭
최대 96개의 vCPU 및 768GB 메모리를 지원하는 인스턴스 크기
최대 4개의 FuriosaAI WARBOY NPU
CPU 멀티스레딩 기능 활성화/비활성화 지원

사용 사례

객체 감지/얼굴 인식 등 고성능 딥러닝 모델 추론 가속화 작업
CNN(Convolutional Neural Network) 계열의 컴퓨터 비전 영역 딥러닝 모델의 추론 가속화 작업

세부 정보

인스턴스 크기	NPU	vCPU	메모리 (GiB)	네트워크 대역폭(Gbps)
`gf1i.6xlarge`	1	24	192	최대 12.5
`gf1i.12xlarge`	2	48	384	최대 25
`gf1i.24xlarge`	4	96	768	최대 50

gf1i​

하드웨어 사양​

사용 사례​

세부 정보​

gf1i

하드웨어 사양

사용 사례

세부 정보