본문 바로가기

디지털 중국

바이두 양자 컴퓨팅 플랫폼 Paddle Quantum 파헤치기

반응형

오늘은 바이두 리서치 블로그에 업로드된 포스팅을 전문 번역해서 소개하려고 합니다. 주제는 바이두의 양자 컴퓨팅 플랫폼 Paddle Quantum입니다. 양자 컴퓨팅 분야는 많이 낯설어서 내용을 완벽하게 이해하지 못했습니다만... 익숙하지 않은만큼 구글링을 통해 좋은 공부를 한 것 같습니다. 바이두 리서치 블로그도 좋은 내용이 올라오면 종종 공유하겠습니다~

 


 

인류 역사상 가장 근본적인 과학 혁신 중 하나인 계산 이론과 양자 역학은 어느 순간에도 서로 공동 연구된 적이 없었습니다. 하지만 이것들의 시너지를 이루겠다는 아이디어는 결국 양자 컴퓨팅의 탄생으로 이어졌습니다. 양자 컴퓨팅은 정보 처리 작업에서의 중첩, 얽힘 및 간섭과 같은 놀라운 양자 역학적 특징의 응용이 가능합니다. 따라서 이진 기반(binary based)의 일반적인 컴퓨터가 아닌 인공지능(이하 AI) 기반 프로그램의 역량을 증대할 수 있는 잠재력이 더 큽니다. 특히나 딥러닝 알고리즘과 같은 첨단 기술은 양자 연구 개발에서 점점 더 중요한 역할을 하고 있습니다. 

2018년 3월, 바이두가 양자 컴퓨팅 기관 설립을 발표하면서 설정했던 주요 목표 중 하나는 양자 컴퓨팅과 AI를 연결하는 것입니다. 이에 맞춰, 과학자와 개발자가 양자 신경망 모델을 신속하게 구축 및 훈련하고, 고급 양자 컴퓨팅 응용 프로그램을 제공할 수 있는 양자 머신러닝 개발툴인 패들 퀀텀을 발표했습니다. 

패들 퀀텀은 바이두의 딥러닝 플랫폼 패들패들을 기반으로 개발되었으며, 이는 중국에서 양자 머신러닝을 지원하는 최초의 유일무이한 딥러닝 플랫폼이 되었습니다. 

바이두 딥러닝 개발자 컨퍼런스 웨이브 서브밋 2020에서 바이두 양자 컴퓨팅 기관의 책임자 두안런야오(Duan Runyao)는 다음과 같이 말했습니다. “현재 양자 분야의 연구원들은 패들 퀀텀을 사용하여 양자 AI를 개발할 수 있으며, 우리의 딥러닝 매니아는 양자 컴퓨팅 학습을 위한 지름길을 걷는 셈이다.”

패들 퀀텀의 출시와 더불어 패들패들의 업그레이드를 진행하여 총 27개의 향상된 기능과 7개의 새로운 툴을 발표했으며, 약 190만 명 이상의 개발자들이 이를 적극 활용하고 있습니다. 2020년 5월 현재, 8만 4천 개 이상의 기업에서 패들패들을 사용하여 23만 개가 넘는 모델을 만들었습니다.

바이두 CTO 왕하이펑(Wang Haifeng)은 다음과 같이 언급했습니다. “산업 지능(industrial intelligence) 부상과 AI 기반 인프라 가속화가 진행되는 이 순간이 바로 패들패들 개발을 위한 전례 없는 기회다. 우리는 계속해서 오픈 소스 정신을 가지고, 기술 혁신을 주도하며 개발자와 협력하여 딥러닝 및 AI 기술을 발전시키고 산업 지능 프로세스를 이뤄낼 것이다.”

패들 퀀텀 딥다이브

패들 퀀텀은 양자 개발 툴, 양자 화학 라이브러리, 최적화 툴을 포함한 양자 머신러닝 종합툴로 구성됩니다. 또한, 양자 머신러닝, 양자 화학 시뮬레이션, 양자 조합 최적화의 3가지 양자 응용 프로그램을 지원합니다. 개발자는 패들 퀀텀의 ‘사용하기 쉬운’ 기능을 통해 간단한 양자 신경망을 구축하거나 단계별 양자 머신러닝 사례에 따라 모델을 만들 수 있습니다.

패들 퀀텀은 다목적성 및 확장성을 보장하는 개발 환경을 제공합니다. 게다가, 양자 회로 모델 및 일반 양자 컴퓨팅 연구를 지원할 수 있도록  패들패들에 복잡한 변수 정의 및 행렬 곱셈을 포함한 여러 가지 기본 기능을 체계적으로 추가했습니다. 

많은 양자 컴퓨팅 응용 프로그램은 조합 최적화 문제와 양자 화학 시뮬레이션을 해결하는 데 중점을 둡니다. 패들 퀀텀 역시 개발자가 직접 실험하여 중요한 문제를 해결할 수 있도록 여러 툴을 제공합니다. 

또한, 양자 계산의 필수 작업인 기브스 상태(Gibbs state, 시스템의 향후 진화에서도 불변으로 남는 평형 확률 분포) 준비와 같은 응용 프로그램의 기반이 되는 새로운 양자 머신러닝 모델도 소개했습니다. 

다음은 패들 퀀텀의 알고리즘을 사용하여 어려운 문제를 해결하는 방법의 예입니다. 최대 절단 문제(Max-Cut problem)는 그래프에서 최대 절단(maximum cut)을 찾는 것을 목표로 하는 고전적인 그래프 분할 문제입니다. 이는 일반적인 컴퓨터를 사용하면 특별히 효과적인 해결책이 없는 전형적인 NP-난해(Non-deterministic Polynomial problem-hard) 문제입니다. 흥미롭게도, 2014년에 MIT 연구원인 Sam Gutmann, Jeffrey Goldstone, Edward Farhi는 “QAOA(Quantum Approximate Optimization Algorithm)”를 사용하여 최대 절단 문제를 해결할 수 있다는 것을 발견했습니다. 향후 몇 년간 이용 가능한 기술을 갖춘 QAQA는 가장 잘 알려진 기존의 알고리즘보다 성능이 뛰어나고 중간 사이즈의 양자 컴퓨터에서도 실행할 수 있습니다.

그림: 4 꼭짓점 그래프에서 최대 절단 문제 사례. 목표는 꼭짓점 세트를 두 그룹으로 분할하여 그 사이의 거리 가중치(edge)가 가능한 한 크게 하도록 만드는 것입니다.

패들 퀀텀은 QAOA 알고리즘의 새로운 구현을 제공합니다. 패들 퀀텀을 사용하면 최대 절단 문제를 양자 신경망으로 변환하여 최적의 모델을 훈련할 수 있습니다. 이후 일반적인 모델 시뮬레이션으로 솔루션을 찾거나 양자 컴퓨터에서 직접 모델을 실행할 수 있습니다. 또한, 양자 컴퓨팅 네트워크의 계층 수를 50% 줄이면서 현재 나와있는 다른 방법들보다 유연하게 배포할 수 있습니다. 

패들패들 업데이트

최근 패들패들에서 발표된 일련의 강력한 도구와 향상된 기능을 소개합니다. 지난 6개월 동안 패들패들은 39개의 새로운 알고리즘을 라이브러리에 추가했으며, 총 146개의 알고리즘과 200개 이상의 사전 훈련(pre-trained)된 모델이 있습니다.

Paddle.js는 개발자가 바이두앱, 위챗 등과 같은 앱의 브라우저나 미니프로그램에서 AI를 직접 사용할 수 있도록 해주는 자바스크립트 딥러닝 라이브러리입니다. 온 디바이스 계산이 가능하기 때문에 대기 시간이 짧고 개인 정보 보호가 가능합니다.  

PaddleClas는 이미지 분류를 위한 엔드 투 앤드(end-to-end) 개발툴입니다. 23가지 유형의 분류 네트워크(ResNet, ResNet_vd, Res2Net, HRNet, MobileNetV3), 117개의 사전 훈련된 모델, 100,000개가 넘는 클래스를 가진 55만 개의 이미지를 통해 훈련된 사전 재훈련(pre-retrained) ResNet50_vd 모델을 제공하고 있습니다.

Parakeet는 WaveFlow, ClariNet, WaveNet, Deep Voice 3, Transformer TTS 및 FastSpeech를 포함한 다양한 최첨단 모델을 갖춘 TTS(text-to-speech)툴입니다. 바이두 리서치(Baidu Research)에서 제안한 최신의 WaveFlow 모델은 빠르고 효율적이며 고품질의 오디오 합성을 제공할 수  있습니다.

PLSC(Paddle Large Scale Classification Tools)를 사용하면 분산 그래픽 카드에서 모델 병렬 처리를 통해 대규모 이미지 분류 모델 훈련을 수행할 수 있습니다.

Paddle X는  데이터 사전 처리에서 모델 추론에 이르는 전체 프로세스 주기를 위한 통합 개발툴입니다. 

PaddleCloud는 개발자가 한 번의 클릭으로 딥러닝 작업을 시작하고 클라우드의 컴퓨팅 리소스에 빠르게 접근할 수 있는 툴입니다. 패들패들을 사용하여 빠른 모델 배포 및 확장이 가능합니다. 

EasyData는 데이터 수집, 데이터 레이블, 데이터 정제 및 데이터 향상을 위한 EasyDL내에 내장된 새로운 지능형 데이터 서비스입니다. EasyDL은 드래그 앤 드롭(drag-and-drop) 인터페이스를 통해 맞춤형 모델을 훈련하고 구축하기 위한 바이두의 AI 플랫폼입니다.

참고 원문: http://research.baidu.com/Blog/index-view?id=137

728x90
반응형