발췌: CIO Korea <이코어 기고 | 발상의 전환! 부압 수랭 솔루션의 가치

(2019.01.21)
원문보기: http://www.ciokorea.com/column/115347


궁극적으로는 수랭이 해답

현실이 이렇다보니 고집적 시스템의 경우 랙을 절반 이상 비워둬야만 하는 상황이 발생하고 있다. 이러한 공간의 낭비는 결과적으로 데이터센터의 효율성 문제로 이어진다. 방대한 하드웨어 인프라를 구축해 이용하는 클라우드 서비스 벤더와 대기업, 연구 조직들이 앞다퉈 수랭 솔루션을 모색하게 된 배경이다.

사실 ‘물’은 냉각이 필요한 모든 분야에서 애용되는 물질이다. 열을 빼앗아오는 효율 측면에서 공기보다 4,000배 더 뛰어나며 열을 보유하는 효율 또한 가장 높고 또 저렴하기까지 하다. 전기와 무관한 모든 분야에 서 냉각을 위해 물을 사용하고 있다는 점에서도 이를 쉽게 알 수 있다.

아울러 물의 뛰어난 냉각 특성은 다양한 추가 혜택을 초래한다. 먼저 내구성이 달라진다. 일례로 소비자용 GPU와 산업용 GPU는 기술적으로 거의 다르지 않다. 같은 웨이퍼에서 같은 설계도로 생산된 것 중 효율과 내구성이 우수한 제품이 서버용으로 공급되는 식이다. 벤더가 소비자용 GPU에 대해 1년의 보증 기간을 설정하는 이유이기도 하다.

이는 이코어가 진행했던 실제 사례에서도 확인할 수 있다. 소비자용 GPU를 약 200개 도입해 사용하고 있는 국내 모 기관의 경우 1년에 약 20%를 교체한다. 반면 수천 개의 소비자용 GPU를 도입한 다른 모 기관의 경우 1년 동안 2% 이하의 교체율을 기록했다. 결정적인 차이점은 후자의 경우 이코어의 칠다인 솔루션을 통해 수랭 방식을 이용했다는 것이다. GPU 동작 온도가 100도 가까이 오르는 공랭 방식과 비교해 수랭 방식은 40~60도 이내로 유지할 수 있었기 때문이다.

수랭 방식의 부가적인 혜택은 또 있다. PUE, 즉 데이터센터의 전력사용효율이 드라마틱하게 개선되며 공간도 절약된다. 좀더 구체적으로 표현하자면 전력 소모가 45~50%까지 줄어들고 공간 효율성은 20% 정도 개선된다. 서버 자체의 소비 전력은 5~10% 정도 감소하는데 그치지만 항온항습기의 전력 소비가 80~90%까지 감소하기 때문이다. 데이터센터 PUE가 1.2 정도까지는 손쉽게 달성된다. 이는 비용 절감으로 곧바로 이어지는데, 데이터센터 규모와 소재지의 기후에 따라 수랭 솔루션의 ROI가 1년 만에 달성되기도 한다.

이 뿐만이 아니다. 수랭 방식은 ‘성능의 향상’을 기대할 수 있다. 오늘날 CPU와 GPU 대부분이 동작 온도에 따라 클럭 속도를 변화시키는 쓰로틀링 기능을 내장하고 있어서다. 실제로 공랭 방식에서도 프로세서가 공기 흡입구 인근에 위치한 서버는 좀더 빠르게 동작한다. 그러나 오늘날의 서버는 유지보수 편의성을 위해 디스크를 전면에 배치시키는 것이 일반적이다.

이코어의 국내 사례 데이터에 따르면, 공랭식일 경우 기온 24도 환경에서 CPU가 80도로 동작했다. 반면 수랭식에서는 최악의 조건인 수온 28도인 상황에서도 CPU 온도가 40도에 머물렀다. 현실적으로 24도 기온을 유지하는 데이터센터가 드물다는 점에서 클럭 쓰로틀링으로 인한 성능 차는 결코 무시할 만한 수준이 아니다. 값비싼 고성능 CPU와 GPU를 이용하고 있다면 더욱 그렇다.

한편 이는 소프트웨어 라이선스 비용과 관련성을 지닌다. 오늘날 기업용 소프트웨어는 CPU 소켓 수, 또는 코어 수로 라이선스 비용을 책정하는 경우가 흔하며, 이는 서버의 성능에 따라 수억 원에 이르는 라이선스 비용이 영향 받을 수 있다는 의미다. 이를 감안하면 수랭 솔루션의 ROI 시기는 더욱 앞당겨질 수 있다.

다음은 수랭 단점을 극복하는 역발상 ‘칠다인 네거티브 프레셔 리퀴드 쿨링 솔루션’에 대해 더 기술하고자 한다

 


* 블로그는 이코어(Ecore) 박병오 대표의 IDG인터뷰의 발표문을 기반으로 작성됐다.