
27일 네이버클라우드 이상준 운영총괄본부장(CIO)는 세종시 소재 AI 데이터센터 ‘각 세종’에서 열린 네이버클라우드 테크밋업에서 “AI 인프라의 경쟁력은 GPU를 얼마나 많이 확보하는가를 넘어 확보한 자원을 얼마나 안정적이고 효율적으로 운영하는지에 달려 있다”며 “네이버클라우드는 GPU 확보와 운영 기술 내재화의 균형을 통해 AI 인프라 경쟁력을 완성하고 있다”고 말했다.
GPUaaS는 자체 데이테센터의 GPU 서버를 기업이나 연구기관 등에 대여하는 구독형 서비스다. AI 서비스 수요가 지속적으로 늘며 관련 시장 규모 또한 맥킨지 추산으로 올해 250억달러(약 36조원)에서 2030년 700억달러(약 100조4000억원)로 성장할 전망이다.
네이버클라우드는 그래픽처리장치(GPU) 운영 효율을 극대화하고 AI 인프라를 스스로 설계·운영할 수 있는 차별화된 기술 역량 덕택에 해당 계획을 추진할 수 있다고 자신했다. 네이버는 2019년 엔비디아의 슈퍼컴퓨팅 인프라인 ‘슈퍼팟(SuperPod’)을 세계에서 가장 빠르게 상용화 한 기업으로 초고성능 GPU 클러스터를 직접 설계·운영한 경험을 보유하고 있다.
이 CIO는 “네이버의 데이터센터는 AI 워크로드 전체를 통합적으로 제어할 수 있는 풀스택 AI 인프라”라며 “이처럼 인프라를 하나의 시스템으로 통합적으로 설계·운영할 수 있는 역량은 국내는 물론 글로벌에서도 손꼽힌다”고 강조했다.
각 세종은 기존 IDC가 수행하던 저장·처리 기능을 넘어 AI 학습과 추론이 동시에 이뤄지는 고밀도 GPU 연산 공간으로 설계됐다. 이를 위해 전력과 냉각 효율, 무정지 운영까지 모두 고려해 AI 인프라가 24시간 안정적으로 작동할 수 있는 환경을 구축했다.
각 세종은 ‘각 춘천’ 운영으로 축적한 실데이터와 열환경 분석을 바탕으로 직접외기·간접외기·냉수를 병행하는 하이브리드 냉각 시스템을 적용했다. 이를 통해 GPU 밀도가 높아져도 안정적인 열 제어와 높은 에너지 효율을 유지할 수 있다.또한 액침냉각 컨테이너 인프라를 구축해 냉각 용액의 안정성, 에너지 효율, 운영 안정성 등을 검증 중이다.
각 세종은 장애 상황에서도 서비스가 멈추지 않도록 전력과 냉각, 서버 운용 체계를 완전히 분리하면서도 유기적으로 통합한 이중화 구조(Active–Active Architecture)로 설계됐다. GPU 서버의 고전력 특성에 맞게 UPS(무정전 전원 장치)와 배전 설비를 재배치해 장애 전파를 구조적으로 차단했다.
네이버는 수십만 대 서버 운영 경험을 바탕으로 장애 상황에서도 흔들리지 않는 표준화된 인프라 구조와 자동화된 운영 체계를 구축했다. 모든 서버는 도입 전 단계에서 성능·전력 효율·운용성을 검증해 표준 사양으로 구성되며 GPU 등 고성능 자원은 실시간 상태 감시와 자동 복구 기능을 통해 장애 발생 시에도 안정적인 서비스 연속성을 유지할 수 있다.
네이버클라우드는 이렇게 내부에 축적한 기술과 운영 역량을 기반으로 GPUaaS 모델을 통해 국내 주요 기업에 AI 인프라 서비스를 제공하고 있다. 이 CIO는 “네이버클라우드는 축적한 AI 인프라 운영 역량을 GPUaaS 모델로 발전시켜 국내 기업들이 손쉽게 AI를 활용할 수 있는 생태계를 만들 것”이라면서 “이를 통해 AI 인프라가 특정 기업의 자산을 넘어, 산업 전반의 성장 기반이 될 수 있도록 하겠다”고 포부를 밝혔다.



