[인터뷰] 세계는 슈퍼컴퓨터 전쟁…문영호 KISTI 부원장

- 슈퍼컴퓨터 5호기, 분자모델링, 전산유체역학, 기상/기후 모델링, 빅데이터 분석, 기계학습 등 다양한 분야 지원

super com
▲지난해부터 세계 1위에 오른 중국 선웨이 타이후즈광.

다가오는 4차 산업혁명의 지능정보사회에 대응할 수 있는 핵심인프라로 자리 잡을 KISTI(한국과학기술정보연구원)의 HPC(고성능 컴퓨팅, High-Performance Computing)인 '슈퍼컴퓨터 5호기'가 내년 6월부터 본격 가동된다.

세계 10위에 달하는 '슈퍼컴퓨터 5호기'는 기존 슈퍼컴퓨터 4호기보다 성능이 무려 70배나 향상됐다. 이는 세계 8위 수준의 미국 국립에너지과학연구센터(NERSC) 슈퍼컴퓨터 '코리(Cori)'와 세계 9위 수준의 일본 슈퍼컴퓨터 '오크포리스트 팩스(Oakforest PACS)' 등과 비슷한 성능이다.

먼저 슈퍼컴퓨터의 현황을 살펴보자. 슈퍼컴퓨터(Supercomputer )는 대규모의 연산을 초고속으로 수행하기 위해 만들어진 컴퓨터로 계산만을 위해 만들어진 컴퓨터다. 과거 슈퍼컴퓨터는 '크레이'등이 계산에 특화된 특수 아키텍처와 통신 메커니즘을 가지고 전용 CPU를 사용했다. 하지만 하나의 CPU에 성능을 높이는 것에 한계가 있어 CPU를 여러 개 사용하는 '병렬처리'로 사용했다. 그 뒤 코어수가 많을수록 더 계산 능력이 좋아질 거라는 생각에 CPU를 수십만개까지 늘렸다. 

그러나 코어의 수가 늘어나면서 발열과 엄청난 전기를 사용하게 됐다. 결국 특정 계산을 지원하는 보조 프로세서와 이미지 처리를 위해 개발된 GPU(Graphics Processing Unit) 그래픽 처리 장치를 범용적인 계산에 이용하는 GPGPU (General Purpose computing on GPU)나 SoC 병렬 주전산기 등으로 눈을 돌렸다. 연산은 GPU 같은 계산용 프로세서들이 하고 CPU는 계산을 통제·관리하는 구조다. 

2017년 랭킹 5위인 미국 타이탄의 경우 AMD Opteron 6274와 NVIDIA Tesla K20X를 사용해 엄청난 계산 성능을 뽑아내는 구조로 만들어졌다. 일례로 지난해 전세계에 이름을 알린 알파고 역시 GPU를 병렬 처리로 이용한 구조다. 다만, CPU가 아닌 프로세서들은 프로그래밍이 어려워 아직은 적용 분야가 머신러닝 같은 분야에 한정되어 있다. 또한, 이 구조는 비트코인과 같은 전자화폐를 채굴하는 데 많이 사용하고 있다.

한창 떠오르고 있는 클라우드 컴퓨팅 분야 중 계산 클라우드를 이용한 방법도 제시되고 있지만, 이를 슈퍼컴퓨터라 부르지 않는다. 이는 계산 클라우드가 기존 슈퍼컴퓨터와는 운영 방식이 다르기 때문이다. 슈퍼컴퓨터는 소수의 사용자가 매우 복잡한 연산을 처리하는 것을 주목적으로 하고 있다. 계산 클라우드는 많은 인원이 사용해 단순한 연산 데이터가 많이 모이는 빅데이터를 이루는 데 반해, 슈퍼컴퓨터의 경우에는 한가지 계산에서 처리하는 데이터가 크고 계산 부하가 매우 크다. 또 하나는 계산 클라우드 보안 문제로 외부에서 접속하는 것을 철저하게 차단하고 있는 연구 집단의 인식도 문제로 대두되고 있다.

gyoukou-100741660-large
▲ 세계 4위 일본 교우코우
슈퍼컴퓨터의 하드웨어 성능을 살펴보면, 페타플롭(Petaflop)은 초당 1000조번의 계산을 하는 것이다. 세계 1위 중국 선웨이 타이후즈광의 연산속도는 93페타플롭스이다. 즉, 개인용 PC CPU 한 개가 빨라봐야 300~400 기가플롭스 정도인데 선웨이 타이후즈광은 개인용 PC 20만대를 모아놓은 것과 똑같다. 더구나 선웨이 타이후즈광은 CPU(SW26010, Sunway)를 비롯해 모든 부품을 중국 자체적으로 만들었다.

전 세계 슈퍼컴퓨터 순위를 집계하는 '톱 500 프로젝트'는 최근 11월 13일에 발표한 순위에 따르면 중국산 슈퍼컴퓨터가 1·2위 석권했다. 중국의 선웨이에 타이후즈광이 1위를 차지한 데 이어 중국 톈허2호가 그 뒤를 이었다. 이어 스위스의 피즈 다이언트가 3위, 일본의 쿄우코우가 4위를 차지했다. 기존 3위였던 미국 타이탄은 5위로 내려갔다. 

중국의 IT 굴기에 자극받은 2015년 당시 미국 오바마 행정부는 엑사플롭스(Exaflops, 초당 100경 번 연산처리) 슈퍼컴 개발을 위한 '국가전략컴퓨팅계획(NSCI, National Strategic Computing Initiative)'을 발표했다. 이는 1위 재탈환을 목표로 인텔과 IBM, 엔비디아 등이 참여하는 슈퍼컴퓨터 프로젝트를 2021년까지 2억5천800만 달러(한화 약 2천900억원)을 투입해 엑사플롭스 연산속도를 구현할 슈퍼컴퓨터 개발한다는 계획이다. 내년 중에는 연산속도 125페타클롭스의 서밋을 가동할 예정이다. 이는 페타플롭스를 월등히 뛰어넘는 능력으로 앞으로 슈퍼컴퓨터 분야의 주도권을 미국이 가져가겠다는 의도다.

titan-large
▲ 세계 5위 미국 타이탄
하지만 슈퍼컴퓨터는 하드웨어만 중요한 게 아니다. 현재 하드웨어 성능은 중국이 앞서있지만, 소프트웨어 부문은 아직 미국에 뒤처진다. 슈퍼컴퓨터를 운용하기위한 운영체제(OS)는 1970년대 초 크레이(Cray)에 의한 슈퍼컴퓨터 시작 단계에서는 유닉스(UNIX)나 리눅스(Linux) 등 유닉스 시스템이 사용됐다. 이후 2000년대부터는 유닉스(Unix) 계열인 리눅스(Linux)를 대부분 사용 중이다.

프로그래밍 언어도 과학기술 계산 분야에서 포트란(Fortran) 이나 C/C ++ 을 오래전부터 사용되어 컴파일러 최적화 기술이 축적돼왔다. 이는 실행 효율성과 개발 효율성 측면에서 애플리케이션 수학 라이브러리 등의 소프트웨어 자산의 축적이 크기 때문에 현재에도 이용하고 있다.  

그러나 GPU 및 FPGA(Field Programmable Gate Array) 등 성능 가속기(accelerator)는 x86, ARM, PowerPC 프로세서를 포함하는 범용 CPU와 함께 하나의 시스템을 구성해 이종 컴퓨팅(heterogeneous computing) 환경을 제공한다. 슈퍼컴퓨팅에서 성능가속기의 사용이 늘어감에 따라 이종 컴퓨팅 환경에서 성능가속 컴퓨팅(accelerator computing)을 효과적으로 사용하려면 쉽지 않은 프로그래밍 장벽이 존재할 수밖에 없다. 

슈퍼컴퓨터 과학자들이 포트란(Fortran) 이나 C/C++ 등 언어로 프로그래밍을 한 경험은 많다고 해도, 성능이 향상된 하드웨어에 대한 지식이 부족하면 새로운 라이브러리 개발이 어려울 수밖에 없다. 따라서 새로운 프로그래밍 언어가 필요하다. 또한, 새로운 아키텍처에서는 기존에 사용하던 외부 라이브러리가 쓸 수 없게 될 가능성이 높다. 결국, 누군가 필요한 라이브러리를 개발해줄 때까지 기다려야 하는 셈이다.

이에 IBM과 썬마이크로 시스템즈(Sun Microsystems) 등이 애플리케이션 성능과 처리량을 최대화하고 HPC(High Performance Computing) 시스템을 위한 새로운 프로그래밍 언어를 개발하고 있다. 썬마이크로 시스템즈는 과학기술 계산용 프로그래밍 언어 포트리스(Fortress)를, IBM은 X10을 공개한 바 있다.

전 세계 슈퍼컴퓨터 순위는 집계한 'TOP 500 프로젝트'는 1993년에 발족한 독일과 미국의 슈퍼컴퓨터 전문가들인 만하임 대학, 테네시 대학, 로렌스 버클리 미 국립 연구소의 연구진들이 각국의 슈퍼컴퓨터 보유 대수와 연산속도 등을 집계해 매년 6월 ISC(International Supercomputing Conference)와 11월 SC(Supercomputing Conference) 개최에 맞춰 발표되고 있다. 

2017년 11월 제 50 회 Top 10top500

용도별로는 대용량 병렬처리를 요구하는 모든 분야다. ▲군사 분야에서는 다수의 목표물에 대한 동시교전 능력과 무기관제, 탄도계산 등을 위해 함마다 슈퍼컴퓨터가 들어간다, 3D 렌더링, 시뮬레이션(핵무기, 워게임). ▲과학연산 분야는 지구과학(우주, 지구 대규모 시뮬레이션 및 천문 신호 처리), 생물학 (단백질, DNA 등 고분자 분석, 세포 시뮬레이션, 생태 시뮬레이션), 화학(고분자 분석, 화학물질 가상 합성), 물리학 (대규모 물리연산인 전산유체역학(CFD) 등), 수학(대규모 연산, 경우의 수, 암호 해독 등) ▲날씨예측(위에 기술한 지구과학, 물리학, 수학 등 모든 분야를 망라한 미분방정식(나비에-스토크스 방정식 등)을 천 만개 이상의 격자점에서 계산한다. ▲주가예측. ▲기술시연 등이다.

슈퍼컴퓨터는 보통 과학기술 연구 또는 기상예측 등에 많이 이용되기 때문에 슈퍼컴퓨터의 성능이 곧 국가의 경제력이나 기술력 수준의 척도로 볼 수 있다.

super com5
▲ 한국에 구축 중인 슈퍼컴퓨터 5호기
예를 들어 기상청에서 2009년에 도입한 슈퍼컴퓨터 3호기 해온, 해담, 해빛, 해남 시스템 가격은 500억원이 넘고 연간 유지비용이 30억 원에 달한다. 이 슈퍼컴퓨터를 설치하기 위해서 전산실을 아예 새로 지어야 한다. 거기에다 전기설비, 냉각시스템, 방진, 항온항습장치 등 공조설비에도 상당한 비용이 투입된다. 전기 또한 엄청나게 사용한다. 전기를 많이 쓴다는 것은 운용 유지비가 비싸다는 말과 같다. 

현재 세계 10위 일본 이화학 연구소 슈퍼컴퓨터 ‘경(京)’의 하루 전기 사용료가 약 3억원에 이른다. 슈퍼컴퓨터 ‘경’은 재료와 에너지, 제조, 재난방지, 생명과학, 우주 연구 등에 활용되고 있다.  

문제는 또 있다. 슈퍼컴퓨터 하드웨어 성능 향상이 상당히 빠르게 진행되고 있다. 실제로 우리나라 기상청에서 2004년에 500억을 들여서 TOP 16위에 드는 슈퍼컴퓨터를 도입했지만 8년이 지난 후에는 하드웨어 성능이 떨어져 고철값을 받고 팔아야 하는 처지가 됐다.

또한, 슈퍼컴퓨터 패러다임이 CPU에서 GPGPU, 심지어 FPGA까지 동원되기 시작하면서 성능과 전력 효율이 높아져 기존 슈퍼컴퓨터 솔루션이 무의미해지기 시작했다. 이에 구글이나 아마존, MS 등이 잘 설계된 분산 시스템 위에서 저렴한 컴퓨터 여러 대를 묶어 컴퓨팅하는 전략인 클라우드 컴퓨팅 서비스를 취하고 있다. 이는 대체로 가성비가 좋고 인프라 역시 재사용하기 쉽다는 장점 때문이다. 또한, 규모의 경제를 취하기 때문에 데이터 센터를 이전보다 훨씬 효율적으로 운영할 수 있는 장점이 있다. 

지금까지 전 세계 슈퍼컴퓨터의 동향과 전망을 살펴보았다. 지금부터 KISTI(한국과학기술정보연구원)의 HPC '슈퍼컴퓨터 5호기'에 대해 알아보자.


super com2

문영호 KISTI(한국과학기술정보연구원) 부원장(원장 직무대행) 인터뷰

슈퍼컴퓨터 5호기는 지난 11월 19일에는 '파일럿시스템' 구축을 완료하고 현재 '메인시스템' 기반시설 공사는 12월에 완료한다. 2018년 5월 베타서비스를 거쳐 6월부터 본격 가동될 계획이다.

특히 지능정보사회의 핵심기술인 '인공지능(AI)'과 빅데이터 분석 등을 비롯해 분자모델링, 전산유체역학, 기상·기후 모델링 등 다양한 분야에서 활용될 슈퍼컴퓨터 5호기의 구축 현황과 관련 활용 계획을 KISTI(한국과학기술정보연구원) 문영호 부원장(원장 직무대행)을 만나 직접 들어봤다.

IMG_1319
▲KISTI 문영호 부원장(원장 직무대행)
  

슈퍼컴퓨터 5호기 구축은 순조롭게 진행되고 있는지 상황 설명해 달라.
현재 전기시설, 공조시설 등 기반시설이 진행되고 있으며 그 이후에 메인시스템이 설치될 것이다. 국가슈퍼컴퓨팅센터로서의 역할을 수행하기 위하여 2018년도 6월 차질 없이 서비스할 수 있도록 만반의 체계적으로 진행되고 있다. 

세계 10위에 달하는 슈퍼컴퓨터 5호기의 성능은 어느 정도인지 자세히 말해 달라.
5호기는 매니코어프로세서로서 '인텔 제온 파이 나이츠랜딩(Knights Landing) 프로세서'가 탑재된다. 또 기존 슈퍼컴퓨터 4호기와 연계할 수 있도록 최신 멀티코어프로세서인 '인텔 제온 스카이레이크(Skylake) 프로세서'를 장착한 중앙처리장치(CPU) 노드로 구성된다. 이론 성능은 25.9페타로 현재 기준으로는 세계 7위권이지만 내년 6월경에는 세계 10위권 이내가 될 것으로 판단된다.

'4차산업혁명' 시대의 핵심 인프라 역할을 하게 될 텐데 국내에서는 구체적으로 어떤 분야에 활용될 전망인가.
우선적으로 분자모델링, 전산유체역학, 기상·기후 모델링 등과 같은 거대과학문제를 해결하는데 활용되는데 이 외에도 지능정보사회의 핵심인 '인공지능(AI)'과 '계산과학공학' 등에도 활용될 예정이다.  

향후는 다양한 분야에서 빅데이터와 멀티데이터가 생성․공유․활용하면서 KISTI가 모든 문제를 지원하고 서비스하기는 쉽지 않을 것 같고, 또 일부 데이터의 공개를 꺼려하는 연구자도 있을 것으로 보는데 이에 대한 해결책은 있는가.
슈퍼컴서비스 외에 빅데이터 분석, 그리고 초고속연구망이 동시에 해결되어야 한다. 따라서 KISTI는 개별 연구기관이나 조직에서 처리할 수 없는 거대과학문제를 슈퍼컴5호기를 통해서 지원하게 된다. 

그러나 앞으로 데이터는 기하급수적으로 증가하게 되고 모든 분야에서 데이터기반의 연구가 활성화될 것으로 보인다. 따라서 각 기관 및 분야별 커뮤니티를 활성화시키고 필요하면 개별적 데이터센터를 구축하는 것을 지원할 예정이다. 일종의 빅데이터 프랜차이즈 개념이라 할 수 있다. 

빅데이터 센터의 고성능컴퓨팅 운영, 초고속망 지원, 빅데이터 분석기술 등을 지원하여 기관이나 커뮤니티별로 별도의 데이터 센터 운영에 대한 기술지원과 컨설팅을 제공하면 된다. 즉 거대 문제와 거대 데이터를 KISTI를 직접 이용하고 개별 기관의 수많은 데이터는 자체적인 빅데이터 센터에서 운영할 수 있도록 할 것이다. 앞으로 5년 내에 1000개 이상의 커뮤니티센터를 구축할 수 있을 것으로 본다. 물론 이러한 데이터를 서로 공유할 수 있는 체제도 구축할 예정이다.  

매우 효율적인 방법 같다. 엣지 컴퓨팅과 같은 구조로 이해하면 될 것 같다. 그렇다면 꼭 연구기관이 아닌 일반 연구자들에게도 활용할 수 있을 것으로 보인다.
일종의 통합 및 분산형의 하이브리드 슈퍼컴․빅데이터 센터의 개념이라 할 수 있다. 이러한 체제가 활성화되면서 연구기관뿐만 아니라 산업계나 국가사회적 문제해결 등에도 다양하게 활용될 수 있을 것이다. KISTI는 이를 위한 인프라기술개발을 통해서 보다 효율적인 데이터 시뮬레이션의 확산에 기여할 예정이다. 이제는 슈퍼컴이 특정 전문가의 영역을 벗어나서 국민 누구나 필요하면 사용할 수 있는 체제로 나가야 할 것이다.

이번 KISTI의 5호기 도입에 대해 두 가지 의견이 있다. 가격에 대비해 효율적인 도입이라는 의견과 일부에서는 비싼 가격에 샀다는 견해도 있다. 
크레이사의 제안에 많은 고민을 하고 타당성 검토를 충분히 하고 결정했다. 먼저 우리나라 연구기관에서 연구하는 분야에 맞는 데이터의 양과 질을 면밀히 조사하고, 새로 도입하는 5호기가 적합하다고 판단했다. 또 무엇보다 예산의 한계가 있었다. 물론 하드웨어는 시간이 지남에 따라 업그레이드를 해야 성능을 높여 효율적인 결과를 낼 수 있다. 정부가 이 부분 또한 적극적으로 검토하고 있는 것으로 알고 있다.

다양한 연구성과를 내기위해서는 미들웨어 개발 등 KISTI 슈퍼컴퓨팅본부 연구진의 구성과 역할이 매우 중요한데 현재 조직의 운용 역량을 높이기 위한 계획은 무엇인가.
연구원의 주인은 연구원이다. 새로운 기술변화시대에는 연구원의 자질을 높이는 교육도 중요하다. 앞으로 인공지능, 빅데이터 등의 디지털기술을 내재화하는 노력이 필요하다. 그리고 연구원 모두가 자발적으로 연구하고 싶은 분야에서 연구하도록 하는 것이다. KISTI는 정부출연연구원으로서의 기능과 미션을 수행하기 위한 인프라 구축과 서비스 및 연구개발에 연구자들이 자발적으로 연구분야에 참여하는 체제가 중요하다.

지난 10년간 사용된 4호기보다 연산능력이 70배가량 높은 5호기가 구축되면 다가오는 4차 산업혁명의 핵심인프라로 자리 잡을 것으로 기대된다. 
1차-3차산업이 인류의 노동을 대체한 것이라면 4차산업혁명의 핵심은 인간의 지능대체라는 전혀 새로운 변화가 진행되고 있다. KISTI는 슈퍼컴퓨팅, 빅데이터, 인공지능 등의 분야에 많은 연구실적을 쌓아오고 있다. 4차산업혁명을 준비하는데 데이터과학과 데이터기술에 대한 중심적인 역할을 수행할 것이다. 슈퍼컴퓨터, 연구망, 빅데이터 분석의 원재료는 모두 데이터라 할 수 있다. KISTI는 데이터 중심연구기관으로 4차산업혁명의 성공을 위한 핵심적인 기능을 수행할 것이다. 특히 슈퍼컴퓨터의 미래에 큰 변화를 가져올 수 있는  와일드카드(wild card)를 제시할 양자컴퓨터나 광컴퓨터를 주목하고 있다.

참고자료: 
https://ja.wikipedia.org/wiki/TOP500#2017.E5.B9.B411.E6.9C.88
https://ja.wikipedia.org/wiki/%E4%B8%AD%E5%9B%BD%E3%81%AE%E3%82%B9%E3%83%BC%E3%83%91%E3%83%BC%E3%82%B3%E3%83%B3%E3%83%94%E3%83%A5%E3%83%BC%E3%82%BF
https://namu.wiki/w/%EC%8A%88%ED%8D%BC%EC%BB%B4%ED%93%A8%ED%84%B0
https://ja.wikipedia.org/wiki/%E3%82%B9%E3%83%BC%E3%83%91%E3%83%BC%E3%82%B3%E3%83%B3%E3%83%94%E3%83%A5%E3%83%BC%E3%82%BF#.E6.A7.8B.E6.88.90.E8.A6.81.E7.B4.A0

[김들풀 기자  itnews@itnews.or.kr]