본문 바로가기

디지털 중국

바이두(Baidu)의 2021년을 책임질 AI 기술 5가지

반응형

2020년은 전 세계 시민, 기업, 정부에게 있어 다사다난한 한 해였습니다. 코로나19가 계속 확산됨에 따라, 건강 및 방역 관련 방안과 대책이 끊임없이 발표되었죠. 그중 빛을 발한 것이 바로 AI 기술 및 애플리케이션이었습니다. 사람 간 접촉을 최소화하면서 사람들의 안전을 책임지고, 경제 회복력을 촉진하는 데도 중요한 역할을 했기 때문입니다. 자율 주행 및 자연어 처리에서 양자 컴퓨팅에 이르기까지 핵심 AI 기술 역량을 강화하기 위한 R&D 역시 더욱 활발해졌습니다.

본 글에서는 2020년에 활약했던 수많은 AI 기업 중 바이두(百度)의 활약을 소개하려고 합니다. 바이두는 많은 중요한 AI 기술을 개발하고 실제 여러 분야에 적용하는 선구자 역할을 했습니다. 코로나19에 효과적으로 대처하면서도 미래의 사회와 경제 모습을 변화시킬 5가지 중요한 기술 발전을 살펴보겠습니다.

 


 

2021년과 그 이후를 책임질 5가지 AI 기술

AI와 백신 개발

새로운 백신을 개발하는 데는 보통 수 년, 아니 수십 년이 걸립니다. 하지만 2020년 3월, 첫 번째 확진 사례가 보고된 지 불과 석 달 만에 코로나19 치료를 위한 백신에 대해 이미 임상 시험이 진행되고 있었습니다. 이런 전례 없는 백신 개발 속도는 연구원들이 코로나19와 관련된 방대한 양의 데이터를 분석하는 데 도움을 준 AI 모델 덕분이었죠.

바이러스 표면의 단백질은 수만 개의 하위 성분으로 구성되어 있습니다. 머신러닝 모델은 이러한 거대한 데이터를 분류하고, 어떤 하위 구성요소가 가장 면역성이 높은지(즉, 면역 반응을 생성할 수 있는지) 예측합니다. 연구자는 이를 통해 적절한 백신을 설계할 수 있는 것입니다.

2020년 2월, 바이두는 백신 개발 연구원들을 위한 리니어폴드(LinearFold) AI 알고리즘을 발표했습니다. 리니어폴드는 바이러스의 리보핵산(ribonucleic acid, 이하 RNA) 시퀀스의 2차 구조를 예측하는 것으로 기존 RNA 폴드 알고리즘보다 훨씬 더 빠르게 작동합니다. 실제로 리니어폴드는 Sars-CoV-2 RNA 시퀀스의 2차 구조를 다른 방법보다 120배 빠른 27초 만에 예측했습니다.

리니어폴드의 RNA 시퀀스 구조 예측 속도가 의미하는 바는 매우 큽니다. 코로나19 백신의 핵심이 mRNA 백신 개발이었다는 점을 생각해보면 이해하기 쉽습니다. mRNA는 사람의 면역 반응을 유발하기 위해 바이러스를 소량 투여하는 기존 접근 방식 대신, 세포들에게 면역 반응을 유도하는 단백질을 생성하는 방법을 가르칩니다. 이때 변화되는 RNA 시퀀스 구조를 빠르게 예측한다면 백신 개발과 승인에 필요한 시간을 크게 단축시킬 수 있는 것이죠.

바이두는 이러한 mRNA 백신 개발을 지원하기 위해 AI 알고리즘 리니어 디자인(LinearDeisgn)을 출시하여 mRNA 시퀀스 설계를 최적화했습니다. 이로써 스스로 분해되는 경향을 가진 불안정하고 비생산적인 mRNA 시퀀스 문제를 해결할 수 있다고 합니다. 리니어폴드와 리니어 디자인 모두 오픈 소스 형태로 전 세계 연구원들이 자유롭게 사용할 수 있습니다. 

이외에도 바이두는 정부기관과 협력하여 코로나19 확산 방지 및 예방에 기술적 도움을 제공했습니다. 2020년 6월, 베이징의 신파디(新发地) 시장에서 코로나19가 발생하자 바이두 AI 기술은 바이러스 변종 게놈 시퀀스를 10시간 이내에 파악했고, 그 결과 확산을 방지할 수 있었습니다. 12월에는 백신 디자인, 약물 발견, 정밀 의학의 개발을 촉진하는 머신러닝 기반의 바이오 컴퓨팅 프레임워크 패들 헬릭스(Paddle Helix)를 공개하기도 했습니다.

완벽한 자율 주행 및 로보택시 서비스

2020년에도 아마존, 구글 웨이모, 디디추싱(滴滴出行) 등 많은 기업들이 자율 주행 자동차를 테스트하고, 여러 도시에서 로보택시 서비스를 시범 운영했습니다. 자율 주행의 확장과 상용화를 위해 사람 운전자 없이 탑승 가능한 완전 자율 주행 기술을 목표로 하고 있죠.

바이두는 창샤(长沙), 칸저우(康州), 베이징에 아폴로 고(Apollo Go)라는 로보택시 서비스를 시작했으며, 중국 내 여러 도시에서 로보택시 서비스 시범 운영을 시작한 유일한 기업입니다. 복잡한 도로 조건에서 차량을 안전하게 제어하고, 사람 운전자의 개입 없이도 도로에서 발생하는 문제를 해결할 수 있는 AI 시스템을 개발하고 있습니다.

연례 기술 컨퍼런스인 바이두 월드 2020(百度世界大会)에서는 차량 내 운전자 없이 AI 시스템이 독립적으로 판단하여 운전하는 완전 자동화된 운전 능력을 보여주었습니다. 예외적인 비상사태 관련해서는 원격 사람 조작자가 차량을 제어하는 5G 원격 운전 서비스가 소개되었습니다. 

<출처: 바이두>

자연어 처리 기술

자연어 처리 기술은 점점 고도화되어 사람의 감정 및 의도와 같은 측면도 충분히 파악할 수 있게 되었습니다. 사람의 말하기 및 쓰기 패턴과 일치하는 언어를 생성하고, 심지어 언어를 통해 이미지를 이해하기도 합니다. OpenAI 역시 최근에 언어 모델인 GPT-3를 통해 이미지를 생성하고 이해하는 DALL·E 및 CLIP을 소개했죠. 이런 자연어 처리 기술은 정확한 검색 결과, 정교한 챗봇 및 가상 어시스턴트 서비스를 제공하여 사용자 환경을 개선하면서 결과적으로는 비즈니스 밸류를 창출하고 있습니다.

바이두는 ERNIE-GEN이라고 불리는, 언어 생성을 위한 새로운 멀티플로우 시퀀스 프레임워크를 출시했습니다. 이는 의미적으로 완전한 텍스트 블록을 예측하도록 훈련시킴으로써 대화 참여, 질문 생성, 추상적 요약을 포함한 다양한 언어 생성 작업을 수행합니다.

또한 시각적 언어 모델 ERNIE-ViL도 주목할만 합니다. 워싱턴 대학교와 앨런(Allen) AI 연구소가 구축한 29만 개의 질문 데이터셋으로 시각적 이해력을 테스트하는 VCR(Visual Commonsense Reasoning) 챌린지에서 1위를 차지했죠. 이외에도 5가지 시각적 언어 태스크에서 SOTA 성능을 달성하기도 했습니다. 

양자 컴퓨팅

양자 컴퓨팅은 2020년 중국의 지우장(九章) 양자 컴퓨터 개발을 포함해 크게 발전했습니다. 지우장 양자 컴퓨터는 일반 슈퍼 컴퓨터보다 100조 배, 구글의 시카모어(Sycamore)보다 100억 배 더 빠르게 연산을 수행한다고 합니다. 양자 컴퓨팅은 바이너리 기반 클래식 컴퓨터에 비해 AI 애플리케이션을 훨씬 효과적으로 처리할 수 있죠.

바이두 역시 AI 및 양자 컴퓨팅과 관련된 많은 기술을 개발했습니다. 2020년 5월, 양자 머신러닝 툴킷 패들 퀀텀(Paddle Quantum)을 오픈 소스로 출시했고, 이로써 양자 뉴럴 네트워크 모델을 신속하게 구축하고 훈련하며, 고급 양자 컴퓨팅 애플리케이션을 제공할 수 있습니다. 9월에는 큐컴퓨트(QCompute)와 같은 양자 개발 키트를 제공하고, 양자 프로그래밍 사이클을 단축하는 퀀텀 리프(Quantum Leaf)를 출시하며 클라우드 기반 양자 컴퓨팅을 본격적으로 연구하기 시작했습니다.

<출처: 바이두>

AI칩

AI 하드웨어 분야는 특정 도메인 태스크에 커스터마이징된 여러 종류의 AI 칩이 개발되면서 크게 발전하고 있습니다. 보통의 프로세서도 AI 작업을 지원할 수 있지만, AI 전용 프로세서는 특정 시스템을 통해 딥러닝과 같은 작업을 최적화할 수 있습니다. 알리바바의 AI 프로세서 한광800(含光800), 화웨이의 AI 프로세서 어센드910(昇腾910) 등도 AI 전용 프로세서에 해당됩니다. 

현재 많은 사람들이 다양한 AI 애플리케이션을 이용함에 따라, 데이터 센터 네트워크를 운영하는 IDC(Internet Data Center) 및 CSP(Cloud Service Provider) 기업에게 트래픽 관리, 원활한 서비스 및 AI 맞춤형 서비스 제공은 더욱 중요해졌습니다. 이를 위해선 기술력 향상 및 비용 절감이 필수이며, 이 2가지가 보장된다면 상용 클라우드 서비스를 제공할 때 더 많은 가치를 창출할 수 있는 것이죠. 

<출처: 바이두>

바이두는 작년 차세대 AI 프로세서인 쿤룬2(昆仑2)를 소개했으며, 2021년 초에 양산할 것으로 보입니다. 해당 칩은 7나노미터(nm) 처리 기술을 사용하며, 최대 연산 능력이 이전 세대인 쿤룬1의 3배가 넘는다고 합니다. 쿤룬 칩은 고성능, 저비용, 높은 유연성이 특징이며, 다양한 AI 애플리케이션 및 시나리오를 지원합니다. 지금까지 2만 개 이상의 쿤룬1이 바이두의 검색 엔진 및 클라우드 파트너 지원 작업에 사용되고 있습니다.

종합 기술 플랫폼 바이두

바이두는 매년 초 지난 한 해 동안 이루었던 행보 및 활약을 소개합니다. 바이두 리서치 블로그에 아티클을 업로드하거나 바이두 월드 컨퍼런스에서 발표를 하면서 말이죠. 다양한 핵심 기술 분야에 관심을 가지고 전문 인재를 양성하며 구글, 아마존, MS 등 미국의 거대 기술 기업들과 경쟁하고 있음을 알 수 있습니다. 

그중에서도 주목할만한 분야는 바이두가 오래전부터 계속 연구해온 자율 주행 자동차와 자연어 처리입니다. 자율 주행 플랫폼 아폴로를 기반으로 L4 자율 주행 버스 운행 및 로보택시 서비스를 시범 운영하고 있습니다. 최근에는 중국의 지리(吉利) 자동차와 함께 전기차 사업에도 진출하여 AI 및 자율 주행 기술을 적용한 전기차를 직접 생산할 계획입니다. 2019년 발표한 자연어 처리 프레임워크 ERNIE는 자연어 처리 모델의 성능을 평가하기 위해 사용되는 GLUE 벤치마크에서 구글과 MS를 제치고 1위를 차지하기도 했습니다.  

사실 바이두는 서비스 방면에서 성과가 좋지 않았습니다. 웨이보, 샤오홍슈 등 SNS 플랫폼에 밀려 검색 트래픽이 계속 감소했고, 틱톡을 따라 출시한 자체 쇼트클립 플랫폼은 저조한 유저 수를 기록했죠. 하지만 기술 분야에선 트렌드에 따라 꾸준히 투자하며 집중하고 있는 모습이 보입니다. 특히, 자율 주행 자동차와 자연어 처리 기술력은 중국뿐만 아니라 세계적으로도 유명하죠.

이런 모습을 보면 기술 트렌드도 자연스럽게 읽히고 바이두가 밀고 있는 기술 분야도 잘 파악할 수 있습니다. AI 칩이나 양자 컴퓨팅 역시 미래에 중요한 분야가 될 것이지만, 꾸준히 연구하는 자율 주행 자동차와 자연어 처리 분야가 더욱 기대됩니다. 

참고 원문: Articles by Baidu | MIT Technology Review

728x90
반응형