Spectrum Scale의 작동

안녕하세요. 이코어 입니다.

 

(주)이코어는 한국 IBM 비지니스 파트너로서 IBM 제품 공급 및 최적의 IBM 솔루션을 고객에 지원하고 있습니다.

(주)이코어에서는 블로그를 통해 제품 또는 솔루션의 정의 및 특성, 장단점, 또한 제품 군의 동향을 이 블로그에 넣으면서 고객에 많은 정보를 전달하고자 합니다.

이번 블로그에서는 계속해서 파일 시스템을 병렬 처리가 가능한 Spectrum Scale의 적용 방법에 대해 조금 더 알아 보도록 하겠습니다.

 


 

그렇다면 스펙트럼 스케일이 필요한 상황은 어떨까요? 클러스터 환경의 여러 노드에서 데이터를 병렬로 접근하고, 순차적으로 데이터 처리가 가능한 공유 파일 시스템은 크게 어플리케이션 관점에서의 필요성과 파일 시스템 관점에서 필요성으로 구분할 수 있습니다. 어플리케이션 관점에서 살펴보면, 응용 프로그램을 사용하기 위한 데이터를 여러 노드에서 접근하여 같은 데이터를 사용하는 경우가 대표적인 상황입니다. 그리고 파일을 보관하는 공통 저장소가 있어야 하거나, 장애가 발생하더라도 서비스의 무중단이 필요한 상황일 때에 스펙트럼 스케일이 힘을 발휘합니다. 그리고 고 가용성과 고속의 데이터 접근은 당연히 계속 필요합니다.

 

두번째로 파일 시스템 관점에서 생각해보면, 모든 파일에 대한 접근권한을 노드에 상관없이 제공해야 하는 경우가 대표적인 상황입니다. 그리고 노드나 스토리지, 어플리케이션이 추가될 때 선형적인 확장이 필요한 경우가 있고, 클러스터 환경에서 어플리케이션 개발 시 소스의 일관된 관리가 필요한 경우도 있습니다. 대용량의 파일 처리와 고속의 처리속도가 필요하고, 병렬 접근과 무중단 서비스를 제공하기 위한 파일시스템은 스펙트럼 스케일이 필요한 상황이라고 볼 수 있습니다.

 

이런 형태는 전통적인 클라이언트-서버 시스템과 차별 점이 생깁니다. 클라이언트가 네트워크에 접근하여 파일 서버와 데이터에 접근하는 방식에서는 네트워크가 모든 기능을 다 수행합니다. 접근 제어와 파일 분산 등을 포함하지요. 그리고 SAN을 사용하는 경우는 클라이언트 노드는 메타데이터 서버 라는 서버로 파일 request를 하고, SAN을 통해 파일에 접근합니다. 스펙트럼 스케일의 경우는 클라이언트 서버 시스템과 SAN 파일 시스템의 장점을 모두 흡수하여 사용할 수 있습니다. 우선 클라이언트의 접근 노드를 통하되, 패브릭 스위치 형태의 SAN을 사용하여 공유 파일 저장소에 연결합니다. 그 결과 SAN을 기반으로 사용하는 블록 I/O의 처리로 성능이 보장되었으며, 공유 SAN을 기반으로 노드들과 데이터를 물리적으로 직접 연결하였습니다. 직접 연결에 따른 높은 성능과 안정성을 확보한 것이지요. 그리고 별도의 POWERHA구축이 필요없이 파일 시스템을 공유할 수 있으며, 일부 노드 장애 시에도 중단 시간 없이 지속적인 서비스 활용이 가능해졌습니다. 파일 저장공간을 공유 형태로 사용하고, SAN기반의 처리 시스템을 사용함에 따라 서버의 확장이나 파일 저장공간 등의 디스크 확장이 더 수월해진 부분도 있습니다.

 

스펙트럼 스케일은 그리고 병렬 I/O 처리가 가능하도록 설계되어 있습니다. 시스템의 정체성이기도 합니다만, 이 부분은 매우 중요합니다. 멀티미디어 서버와 같이 하나의 서버에서 I/O가 부족한 경우 여러 대의 서버에서 하나의 파일을 읽고 수정할 수 있게 함으로써 대용량의 I/O 대역폭을 확보하였습니다. 그리고 스펙트럼 스케일은 파일 단위가 아니라 블록 단위의 락킹 구조를 지원합니다. 앞서 언급한 구글 닥스의 경우와 유사한 것으로, 파일을 점유하지 않기 때문에 하나의 파일을 여럿이 접근하여 변경할 수 있다는 장점이 생긴 것이지요.

 

스펙트럼 스케일 시스템의 장점은 파일 공유에서도 찾아볼 수 있습니다. 웹 서버나 파일서버의 경우 고가용성을 확보하고, 성능의 확장성을 염두에 두고 구성하기 때문에 여러 대의 서버로 구성하는 경우가 많습니다. 이 경우 각각의 저장소를 따로 둔다면 매번 해당 작업을 별도로 수행하여야 한다는 번거로움이 발생합니다. 이런 경우 스펙트럼 스케일을 사용하여 여러 대의 서버가 하나의 통합된 파일 시스템에 읽고 쓸 수 있는 환경을 구성하여 전체 클러스터 내의 데이터 관리가 가능해집니다. 메타 서버에 기록된 파일의 변경사항을 일정 시간이 지난 후 업데이트하는 방식입니다.

 

앞서 살펴본 바와 같이 스펙트럼 스케일은 병렬 파일 처리 시스템으로서의 장점과 다양한 환경에서의 사용이 가능합니다. 단언컨대, 파일시스템에서 상상할 수 있는 모든 기능을 제공할 수 있습니다. 목표에 따라 비용효율성을 확보할 수도 있고, 최고의 안정성을 확보할 수도 있으며, 가장 효율적인 사용환경을 구성할 수도 있습니다.

 

출처 : www.ibm.com

 

다음 블로그에서는 이런 기능을 제공하기 위해서 티어링과 같은 ILM의 기능과 AFM, 그리고 스냅샷 등의 기능에 대해서 알아보겠습니다.