Search

'프리 엑사'에 해당되는 글 1건

  1. 2017.10.27 중국 수퍼 컴퓨터 성능 배가 전략, 핵심 프로세서 자체 개발

※ 아래 글은 정보통신기술진흥센터(IITP)가 발간하는 주간기술동향 1819호(2017. 10. 25. 발행)에 기고한 원고입니다.


▶ IITP에서 PDF 포맷으로 퍼블리싱한 파일을 첨부합니다. 가독성이 좋으니 참고하시기 바랍니다.

중국 수퍼 컴퓨터 성능 배가 전략, 핵심 프로세서 자체 개발.pdf



ž 중국의 수퍼 컴퓨터 개발이 가속화 되고 있는데, 현재 세계 2위인 티엔허 수퍼 컴퓨터가 올해 내로 연산 능력을 2 배로 높인 후속기종으로 개편될 예정


Ø 2013 6월부터 2015 11월까지 세계 수퍼 컴퓨터 연산 성능 순위 톱 500에서 선두를 유지했고 현재 세계 2위인 중국의 수퍼 컴퓨터 티엔허 2(天河二, Tianhe-2)’후계기종 티엔허-2A에 대한 자세한 기술 사양이 지난 9월말에 공개되었음


Ø 6개월마다 톱 500 수퍼 컴퓨터 목록을 작성하는 미국 테네시 대학의 잭 던갤러 교수에 따르면 티엔허-2A는 중국이 자체 개발한 연산 가속기를 탑재하고 있으며, 현재 기종보다 2배의 연산 성능을 실현할 수 있다고 함


Ø 티엔허-2A는 중국 국방과학기술대학(NUDT)이 계속해서 개발 중이며, 9월말 현재 시스템의 25% 정도가 완성된 상태로 오는 11월까지는 풀 가동이 가능할 전망임


Ø 한편 현재 세계 수퍼 컴퓨터 톱 500 순위에서 1위를 차지하고 있는 것은 중국의 또 다른 수퍼 컴퓨터인 순웨이 타이후라이트(神威太湖之光, SunWey Taihulight)


ž 기술적 측면에서 티엔허-2A의 목표는 핵심 기술을 미국에 의존하지 않는 것인데, 이는 수퍼 컴퓨터용 가속기 프로세스 수출을 규제하는 미국 정부의 정책에 대응하기 위한 것임


Ø 수퍼 컴퓨터용 가속기에서는 현재 엔비디아의 GPU(그래픽 처리 프로세서) 테슬라(Tesla) 시리즈가 시장 점유율의 절반 이상을 차지하고 있음


Ø 엔비디아는 2017년 하반기부터 최신의 볼타(Volta) 세대 GPU테슬라 V100의 출하를 시작했는데, 2017 11월에 발표될 성능 순위 톱 500 외에도 절전 순위인 그린(Green) 500 이름을 올릴 수퍼 컴퓨터의 다수가 이 테슬라 V100을 탑재할 것으로 예상됨


Ø 테슬라 다음으로 가속기 부문 시장 점유율이 높은 것은 인텔의 가속기 제온 파이(Xeon Phi) 시리즈여서 가속기 기술은 미국 의존도가 높다고 할 수 있음


Ø 그런데 엔비디아와 인텔의 가속기는 핵 개발에 이용할 것을 우려한 미국 정부의 수출 규제 품목으로 관리하고 있기 때문에 중국의 수퍼 컴퓨터 개발에 대량 조달하는 것이 어려워지고 있음



Ø 이에 따라 중국 NUDT은 티엔허-2에 채택된 인텔의 제온 파이 나이츠 코너(Xeon Phi Knights Corner)를 대신해 티엔허-2A에는 자체 개발한 가속기 매트릭스(Matrix)-2000을 탑재하였음


<자료> The University of Tennessee


[그림 1] 중국 자체 개발 가속기 매트릭스


Ø 매트릭스-2000은 범용 GPU가 아니라 범용 DSP(데이터 신호 처리)로 불리는 칩으로 128개의 연산 코어를 1.2GHz로 병렬 동작시키는데, 여느 GPU 수퍼 컴퓨터에 비해 실행 효율이 낮은 것으로 평가되지만 중국은 이를 소프트웨어 개발 능력으로 커버하고 있음


Ø 수퍼 컴퓨터 톱 500에서 1위를 차지하고 있는 순웨이 타이후라이트 역시 자체 개발한 프로세서인 순웨이(SW) 26010을 탑재하고 있음


ž 중국의 또 다른 목표는 1 엑사 플롭스(FLOPS)급 수퍼 컴퓨터를 세계 최초로 구현하는 것인데, 이를 위해 3개의 프로젝트를 동시에 가동하고 있음


Ø 가장 먼저 100 페타 플롭스급, 프리 엑사(Pre Exa, 엑사 플롭스 직전)에 도달 한 것은 앞서서 언급한 순웨이 타이후라이트로 올해 6월 발표된 톱 500 순위에서 실행 연산 성능 93 페타 플롭스를 기록하며 선두에 올랐음


Ø 타이후라이트가 탑재하고 있는 자체 개발 프로세서 SW 26010은 프로세서의 제조 공정과 모리 대역이 2세대 이전의 사양인데, 2018년 이후 양산이 시작되는 최신 7 nm(나노미터) 공정으로 제조되는 반도체를 사용한다면 동일한 아키텍처로 1 엑사 플롭스 근처에 도달 할 수 있음


Ø 두 번째로 프리 엑사에 도달할 것으로 예상되는 티엔허 시리즈도 성장의 여지가 있는데, 앞으로 매트릭스-2000과 같은 가속기뿐만 아니라 CPU ARM v8 기반의 자체 프로세서로 교체할 것이라는 예상이 나오고 있음


Ø 마지막으로 중국을 대표하는 수퍼 컴퓨터 업체인 수곤(Sugon, 中科曙光)이 엑사급 기기를 목표로 수퍼 컴퓨터를 개발중인 것으로 알려졌음


Ø AMD 2016 4월 중국 과학원의 계열사에서 채택하는 서버용 프로세서를 공동 개발하기로 합의한 바 있는데, 중국 과학원 계열인 수곤이 채택하는 프로세서도 AMD에서 x86 기술의 라이선스를 받은 독특한 설계가 될 것이라는 전망도 있음


Ø 중국 외에 현재 엑사급 개발을 목표로 하는 다른 프로젝트로는 미국 에너지부와 인텔, 클레이가 주도하는 오로라(Aurora)와 일본의 후지쯔와 이화학 연구소와 후지쯔가 주도하는 포스트 교토 등이 있는데, 이들은 모두 2021년 가동을 목표로 하고 있음


Ø 그러나 투입 예산이나 인원 등을 비교해 볼 때 순웨이 타이후라이트를 비롯한 중국의 프로젝트들이 현재 엑사급 수퍼 컴퓨터 개발에 보다 유리한 위치에 있는 것은 틀림 없어 보임


Ø 중국 내에서 3 종류의 완전히 서로 다른 아키텍처들로 개발을 겨루는 모양새이기 때문에, 비록 하나가 실패하더라도 미국 제품을 핵심 기술요소로 사용하지 않는 확실한 엑사급 수퍼 컴퓨터를 개발할 것으로 보이는데, 이런 점에서 중국의 만만찮은 수퍼컴퓨터 전략을 엿볼 수 있음


ž 중국의 수퍼 컴퓨터 개발 투자 증대는 미국을 비롯한 다른 나라의 분발을 자극하는 면도 있어서, 향후 엑사급 이상의 수퍼 컴퓨터 개발 경쟁은 다시 한번 가열될 것으로 예상됨


<자료> BBC.com


[그림 2] 수퍼컴퓨터 1위 중국 타이후라이트


Ø 2017 11월에 발표될 톱 500 순위에서는 2016 6월 이후 1위를 지키고 있는 타이후라이트와 이에 버금가는 연산 성능을 제공할 전망인 티엔허-2A에 대해 미국 오크 릿지(Oak Ridge) 국립 연구소가 개발 중인 서밋(Summit)가 도전장을 내밀 전망임


Ø 서밋은 IBM의 최신 프로세서 POWER 9 2개와 엔비디아의 볼타 세대 GPU 6개 탑재한 노드를 최대 4,600개 쌓아 구성하므로, 풀 가동한다면 이론 연산 성능은 약 200 페타 플롭스로 실행 연산 성능이 타이후라이트를 넘어설 것은 확실함


Ø , 서밋의 생산은 2018년으로 예정되어 있어, 이번 11월의 순위 심사에서는 구축된 일부 시스템만 선보일 가능성이 있어 실행 연산 성능이 실제 어느 정도가 될 지는 가늠하기 어려움


Ø 한편 일본이 이번 11월의 톱 500에서 상위 랭크를 기대할 수 있는 것은 지구 시뮬레이터를 보유한 일본 해양연구개발기구(JAMSTEC)에서 설치가 진행되고 있는 교코(GyoKo, 暁光)로 일본 자국 기업이 개발한 가속기를 탑재하고 있음


Ø 2018년부터 7nm 공정에서 가속기 생산이 시작되고 나면, 중국, 미국, 일본 등의 수퍼 컴퓨터 연산 성능 선두 경쟁을 다시 한번 가열될 것으로 예상됨