멀티 LLM(대형 언어 모델)을 동시에 실행하려면 상당한 컴퓨팅 성능과 메모리가 필요합니다. GPU 병렬 처리는 계산 부하를 여러 GPU에 분산함으로써, 다음과 같은 작업이 가능하게 합니다. - 여러 작업을 동시에 처리하여 처리 속도 향상 - 과도한 하드웨어 요구 사항 없이 LLM의 높은 요구 사항을 충족하기 위한 효율적인 리소스 자동 할당 - 병목 현상 없이 작업을 관리할 수 있는 확장성 확보 효과적인 GPU 병렬 처리가 없으면 기업을 LLM 인프라를 확장하는 데 어려움을 겪게 되며, 종종 전문 공급업체에 의존해야 하므로 비용이 많이 들 수 있습니다. 이번 Cover Story에서는 GPU 병렬 처리 능력이 부족할 경우 발생할 수 있는 문제점을 알아보고, 이를 해결할 수 있는 방안에 대해 탐구해보고자 합니다.
양자 분야의 세계적 석학들과 기업인인 IBM 퀀텀 수석 연구원 겸 부사장, 케임브리지대 교수, IBM 연구소 연구위원, MIT 교수 등이 우리나라를 찾을 예정이에요. 올해 '세계 양자과학기술의 해(IYQ)'를 맞은 시점에서 한국이 양자컴퓨팅 영역에서의 경쟁력을 육성하는 발판이 될 것으로 기대돼요.
글로벌 빅테크들은 양자컴퓨터 칩을 공개하며, 경쟁이 치열하게 이어나가고 있어요. 구글은 지난해 말 양자칩 '윌로우'를 공개하고 연구 결과를 국제 학술지 네이처에 공개해 큰 주목을 받은 바 있는데요. 구글에 이어 마이크로소프트(MS)도 양자 컴퓨팅 칩 '마요나라 1'을 공개했고, IBM은 오는 2029년까지 오류 수정이 가능한 양자 컴퓨터 개발을 목표로 하고 있어요.
GPU 가격 급등으로 인한 예산 부족 문제로 다섯 차례나 유찰됐던 슈퍼컴퓨터 6호기 사업이 드디어 본궤도에 올랐어요. 지난해 예비타당성 적정성 재검토를 거쳐 예산을 4483억원으로 늘렸고, 사업 개찰을 진행한 결과 크레이(HP)와 레노버 2개 기업이 참여하면서 경쟁 입찰에 참여했어요.
슈퍼컴퓨터 6호기는 정부가 추진하는 인공지능(AI) 컴퓨팅 인프라 구축 계획에서의 핵심 장비인데요. 현재 우리나라는 첨단 GPU를 2000장 보유하고 있고, 8800장을 추가 도입할 예정이라고 해요. KISTI 관계자는 "4월 말까지 한 업체를 선정해 계약을 체결하고 올해 말까지 장비를 설치해 내년 상반기에는 서비스할 예정"이라고 말했어요.
정부가 국가AI컴퓨팅센터 등의 인프라 확충을 계기로 독자적 AI 모델 경쟁력 확보에 나서요. 특히 AI 국가대표 프로젝트인 '월드 베스트 LLM'(가칭·WBL)을 추진, 인공지능 정예팀을 선발해 단시간에 세계 최고 수준의 LLM을 개발할 수 있도록 필요한 데이터와 그래픽처리장치(GPU) 등 핵심 인프라를 전폭적으로 지원한다고 해요.
정부는 AI 컴퓨팅 인프라를 통해 우리 AI 인재가 개발한 우리만의 독자적인 AI 모델로 국가 AI 전환(AX)을 가속화하는 것이 목표예요. 이를 위해 우리의 독자적 특화 데이터를 학습한 생성형 AI를 의료, 법률 등 다양한 분야에 접목하는 부처 협력형 선도 프로젝트가 추진될 예정이에요.
어떠한 사업 영역에 'as a Service'를 붙여서 표현하는 모든 서비스를 XaaS(자스)라고 말하는데, 이는 Everything as a service 혹은 Anything as a service를 뜻해요.. 과학기술정보통신부는 정보통신산업진흥원(NIPA)과 모든 산업의 디지털 서비스화를 촉진하고자 'XaaS 선도 프로젝트' 사업 신규 과제 공모를 실시한다고 밝혔어요. 해당 프로젝트는 소프트웨어(SW) 전문기업과 다양한 수요 기업·기관이 컨소시엄을 통해 산업별로 최적화된 대표 디지털 서비스를 개발·육성함으로써 SW 기업은 지속가능한 수익모델을 창출하고, 주요 산업은 새 성장 동력을 마련하는 것이 목표예요.