IBM의 플랫폼 LSF(Load Sharing Facility)는 핵심 업무 컴퓨팅 환경에서 사용하기 위한 워크로드 관리 플랫폼, 잡 스케줄러(Job Scheduler)

안녕하세요. 이코어 입니다.

 

(주)이코어는 한국 IBM 비지니스 파트너로서 IBM 제품 공급 및 최적의 IBM 솔루션을 고객에 지원하고 있습니다.

(주)이코어에서는 블로그를 통해 제품 또는 솔루션의 정의 및 특성, 장단점, 또한 제품 군의 동향을 이 블로그에 넣으면서 고객에 많은 정보를 전달하고자 합니다.

 

​이번 블로그에서는 IBM의 플랫폼 LSF(Load Sharing Facility)는 핵심 업무 컴퓨팅 환경에서 사용하기 위한 워크로드 관리 플랫폼에 대해 간략하게 소개해 드리고자 합니다.


 

 

 

IBM Platform LSF란 -1

 

아마도, 이번에 저희가 소개해드릴 제품은 최근에 다루어지는 개념 중에 가장 힙한 주제가 되지 않을까 생각합니다. 왜냐하면 잡 스케줄러(Job Scheduler)에 관련된 제품이기 때문입니다. IBM의 플랫폼 LSF(Load Sharing Facility)는 핵심 업무 컴퓨팅 환경에서 사용하기 위한 워크로드 관리 플랫폼입니다.

 

IBM Spectrum LSF는 중요한 업무에 대한 HPC(High Performance Computing) 환경을 위한 통합 솔루션입니다. 클러스터 가상화와 워크로드 관리를 정의하는 소프트웨어라고 할 수 있지요. 아, 그런데 HPC에 대한 일반적인 오해가 있어서 바로잡고 가려고 합니다. 흔히들 알고 있는 수퍼컴퓨터는 모두 HPC 중 일부에 속합니다. 그렇기 때문에 HPC가 모두 수퍼컴퓨터는 아니지요. 앞으로 용어를 수퍼컴퓨터가 아닌 HPC로 통일해서 사용하기 위함이니, 너그러이 봐주시면 감사하겠습니다.

 

일단 HPC에 대해서 간략하게 살펴보겠습니다. HPC는 다양한 노드가 모인 하나의 거대한 컴퓨터입니다. 한 대의 컴퓨터가 아니라, 여러 개의 노드가 물리적으로는 구분되어 있으나, 논리적으로 하나의 개체를 형성하고 있는 일종의 군집상태이지요. 그렇기 때문에 업무를 일괄적으로 분배할 수는 없습니다. 일반적인 상황에서 업무를 할당하면 순차적으로 수행되기 때문에 큰 지장이 없습니다만, HPC환경에서 업무를 순차 배정하다 보면 업무 진행 속도와 현재 상태에 따라 비효율성이 발생할 여지가 큽니다. 이러한 부분을 관리하기 위해서는 잡 스케줄러가 반드시 필요합니다. 이해를 돕기 위해서 간략하게 표현하면 아래 그림과 같습니다.

 

 

 

여러 명의 사용자가 로그인을 담당하는 서버를 거쳐 스케줄러에서 전체 계산 노드의 코어에 업무를 할당합니다. 이 때 스케줄러는 사용정책에 따라 계산 노드를 분배할 수 있으며, 작업 효율화를 위한 업무 할당과 현재 진행상태에 대한 모니터링을 수행할 수 있게 됩니다. 코어라고 표시를 해 두었지만, 실제로 잡 스케줄링은 단순히 계산 영역이 아니라 하드웨어의 모든 가용 컴퓨팅 자원을 총괄합니다. 따라서 CPU, GPU, 메모리 등의 하드웨어 전체의 관리와 운용 기능을 제공합니다.