전체 컴퓨팅 자원의 활용률을 모니터링하여 계획 세워 실행하여 신뢰성을 확보 가능

시스템 관리자는 전체 업무를 분산하고, 어플리케이션의 활용률을 제고 시키며, 자동 분석과 라이선스 관리.

사용자는 통일된 인터페이스 내에서 업무를 수행이 가능

시스템 장애와 무관하게 업무를 수행할 수 IBM Spectrum LSF

 

안녕하세요. 이코어 입니다.

 

(주)이코어는 한국 IBM 비지니스 파트너로서 IBM 제품 공급및 최적의 IBM 솔루션을 고객에 지원하고 있습니다.

(주)이코어에서는 블로그를 통해 제품 또는 솔루션의 정의 및 특성, 장단점, 또한 제품군의 동향을 이 블로그에 넣으면서 고객에 많은 정보를 전달하고자 합니다.​

이번 블로그에서는 IBM Spectrum LSF 의 특징 및 장점 에 대해 간략하게 소개해 드리고자 합니다.


 

 

IBM Spectrum LSF의 특징 및 장점 -2

IBM이 대단한 건 여기서 한 발자국 더 나간다는 점입니다. IBM은 LSF에 사용자 편의를 위한 기능을 추가하였습니다. 간단한 명령어를 통해 시스템에 대한 모니터링과 통계 수치 확인, 각종 리소스 추적 등이 가능한 기능을 도입합니다. 그 결과 LSF에서 제공하는 명령어를 통해 시간 대비 효율적인 업무 수행에 대한 분배와 관리, 그리고 신뢰성을 높이는 섬세한 조율이 가능해졌습니다. 생산성의 증가로 이어진 것입니다.

 

 

LSF가 업무를 수행하는 단계는 크게 두 단계의 동작으로 구성됩니다. 첫 번째는 각종 정보를 수집하는 단계입니다. 라이선스가 사용되는 수준이 여기에 해당하는데, 클러스터 내에 존재하는 모든 자원의 상태를 수집합니다. 업무를 분배하기 전 가장 우선되어야 하는 부분이기도 합니다. 서버의 CPU, GPU, 메모리, 어플리케이션 라이선스 등을 수집하여 사용 가능한 컴퓨팅 리소스를 확보합니다. 이 업무가 사전에 수행되어야 전체 잡을 배분할 수 있는 기본 정보를 확보할 수 있게 됩니다.

 

두번째 단계는 업무의 스케줄링입니다. 수집된 컴퓨팅 자원을 기반으로 잡을 할당하고, 그에 대한 일정을 조율합니다. 사용자가 요청한 업무 수행을 각 서버에 할당하여 리소스를 활용하도록 합니다. 각종 데몬이나 정책에 의해 조율이 가능하며, 환경설정 및 통계 툴을 사용하여 미세한 조정도 가능하게 합니다. 여기서 말하는 정책은 스케줄링에 대한 방법을 정의한 문서로, 기본 정책인 FCFS와 사용자 그룹간의 자원 활용을 정의한 Fair-Share, 메모리 사용에 관여하는 Memory Reservation, 라이선스 관리를 주로 수행하는 Resource Reservation, 작업의 순위를 재조정하는 Preemption 등이 있습니다.

 

소프트웨어 라이선스 관점에서 살펴보면 이런 이점은 더 명확합니다. LSF를 사용하지 않을 때에는 라이선스를 계속 확인해야합니다. 작업을 지시하는 사람이 정당한 지 확인절차가 필요하기 때문입니다. 이 부분은 결국 고가의 툴을 사용하거나, 시스템 할당에 어려움을 초래하게 됩니다. 이런 경우에서 LSF는 라이선스를 확인하지 않고 바로 작업을 할당할 수 있으며, 하드웨어 자원과 소프트웨어 자원을 모두 사용할 수 있는 기반을 제공합니다.

 

하드웨어를 사용하는 경우에는 또 다른 장점이 존재합니다. LSF를 사용하지 않는 경우 시스템 로드가 특정 서버에 편중됩니다. 중요 데이터를 저장하는 순간에 모이기 때문입니다. 이런 형태에서는 특정 사용자에게 컴퓨팅 리소스가 편중되는 현상이 발생하기도 합니다. 결국 이런 현상은 과부하로 인한 전체 효율성의 하락을 초래하게 됩니다. 그 결과 업무를 할당할 수도 없고, 장애 시에는 전체 업무가 중단되기도 하며, 시스템이 살아있는 시간에만 근무를 할 수 있는 등의 문제가 발생합니다.

 

이에 비해 LSF를 사용하는 경우라면 잡 스케줄러 기능을 활용하여 시스템의 전체적인 업무 관리가 가능해집니다. 즉, 하드웨어와 소프트웨어의 각종 정보를 공유하여 사용할 수 있게 되고, 밸런싱 기능으로 인해 시스템 과부하를 미연에 방지하게 됩니다. 또한 업무의 진행상황을 지속적으로 체크할 수 있게 되고, 우선순위 조율을 통해 미세한 작업 스케줄링 관리가 가능해집니다. 그리고 가장 중요한 장점은 시스템이 장애가 발생하는 경우 다른 시스템으로 업무를 이관할 수 있습니다. LSF가 업무를 분배하는 역할을 수행하고 있었기 때문에 가능한 것이지요.

 

이런 장점을 종합하면, 관리자는 투입 대비 성능에서 좋은 결과를 기대할 수 있습니다. 전체 컴퓨팅 자원의 활용 율을 모니터링하기 때문에 계획을 세울 수 있고, 신뢰성을 확보할 수 있습니다. 또한 시스템 관리자는 전체 업무를 분산하고, 어플리케이션의 활용률을 제고시킬 수 있으며, 자동으로 분석과 라이선스 관리가 가능하게 됩니다. 그 결과 사용자는 통일된 인터페이스 내에서 업무를 수행할 수 있으며, 시스템 장애와 무관하게 업무를 수행할 수 있게 됩니다.