본문 바로가기

디지털 중국

우다오(悟道)2.0 발표, 쯔위엔연구원 가상 디지털 인간 화즈빙

반응형

오랜만에 글을 씁니다. 오늘 찾아본 소식은 약 1달이 지난 오래된(?) 소식이지만 이전 3월에 작성했던 글과 연계되는 것이라 흥미로웠습니다. 당시 쯔위엔연구원(BAAI, Beijing Academy of Artificial Intelligence)이 개발한 대규모 AI 모델 "우따오1.0"을 소개했었습니다. 약 3개월이 지난 지금 우따오2.0이 발표되었고, 파라미터 수는 증가하고 응용(application) 양상은 명확해졌습니다.

개인적으로 대학 졸업과 취업 준비를 한 3개월 동안 다른 한편에선 AI 연구가 더욱 활발해지고 그 속도 역시 너무나 빠르다는 점에서 충격적이면서도 인상 깊었던 내용이었습니다.


쯔위엔(智源), 세계 최대 사전학습 모델 “우따오(悟道)2.0” 발표, 쯔푸(智谱)AI 등 여러 기관과 공동 개발

지난 3월 22일, 중국의 대규모 AI 모델인 우따오1.0이 소개되었습니다. 바이두, 샤오미, 바이트댄스, 매그비 등 다양한 IT 기업과 연구기관들이 모여 연구를 진행하는 곳인 쯔위엔연구원에서 개발한 모델이었죠. 그로부터 3개월 지나지 않은 6월 3일, 2021 베이징 쯔위엔 컨퍼런스(北京智源大会)가 개최되었고, 우따오2.0 모델이 등장했습니다.

우따오2.0 특징: 최대, 표준, 통용, 국산

쯔위엔 연구를 이끄는 칭화대학교 교수 탕제(唐杰)는 우따오 모델의 목적이 세계 최고의 수준의 AGI(Artificial General Intelligence) 개발이라고 했습니다. AI가 정말 사람처럼 생각하고 행동하도록 만들겠다는 뜻입니다.

먼저, 우따오는 4.9TB의 고품질 텍스트, 이미지 데이터를 학습했다고 합니다. GPT-3의 학습 데이터셋이 570GB라는 점에서 규모를 가늠해볼 수 있습니다. 물론 GPT-3 역시 원본 데이터셋은 45TB로, 연구원들이 이 중에서 570GB의 고품질 데이터를 추출했지만 말이죠.

또한 우따오의 파라미터 수는 1조 7500억 개에 달하며, 이는 파라미터가 1조 6000억 개인 구글의 Switch Transformer 사전학습 모델을 뛰어넘은 것입니다. 동시에 OpenAI가 개발한 GTP-3의 파라미터(1750억 개)의 10배에 달하는 셈이죠. 또 하나 눈여겨볼 점은 우따오 모델은 중국이 독자적으로 연구생산한 GPU 플랫폼을 기반으로 했다는 것입니다.

쯔위엔 연구원들이 대규모 사전학습 모델을 개발하는 이유는 무엇일까요? 바로 구글의 MoE(Mixture-of-Expert training system) 기술의 한계인 병목현상을 해결하고, 조(兆) 단위의 모델을 실현하기 위해서입니다. MoE의 아이디어는 큰 모델 안에서 목적에 맞춰 서로 다른 모델을 훈련하는 것입니다. 쯔위엔이 개발한 FastMoE는 파이토치(PyTorch) 프레임까지 지원하는 최초의 MoE 시스템으로 가용성, 유연성, 훈련속도 측면에서 강점을 보입니다. 구글의 MoE와 다르게 오픈소스 형태이고, 특정 하드웨어를 필요로 하지 않습니다.

이미 ImageNet, LAMA, LAMBADA, SuperGLUE, MSCOCO 등 여러 벤치마크 테스크에서 좋은 성적을 냈고, 9개 항목에서 SOTA 성능을 기록했습니다. 탕제에 의하면 우따오2.0 사전학습 프레임워크는 5가지 고효율 특징이 있습니다.

1. 고효율 코딩
2. 고효율 모델
3. 고효율 학습
4. 고효율 파인튜닝
5. 고효율 추리

이를 바탕으로 한 우따오2.0은 중국어 텍스트 데이터, 멀티모달 데이터, 대화음성 데이터까지 모두를 통합한 거대 데이터 모음집이라 할 수 있습니다.

쯔푸AI, 샤오빙(小冰)과 합작 개발한 화쯔빙(华智冰)

화쯔빙은 가상 학생으로 칭화대 컴퓨터학과 지식공학실험실(知识工程实验室)에 입학했고, 학생증과 학교 이메일 계정도 발급받으며 정식으로 인정받았습니다. 쯔푸AI 데이터베이스를 바탕으로 샤오빙의 인지, 추리 기술력을 합친 최초의 완전한 가상 디지털 인간입니다.

<출처: 화쯔빙 웨이보>

쯔푸AI는 칭화대 연구팀이 지난 10여 년간 쌓은 지적 지능에 대한 지식을 통해 고품질의 대규모 지식 그래프를 구축했습니다. 샤오빙 연구팀은 음성, 이미지 등 사람과 상호작용하는 분야에 필요한 각종 AI 기술을 제공하며, 나아가 그림, 시, 노래 등 창조 능력에서도 최고 수준을 보이고 있습니다.
아래는 화쯔빙이 그린 그림과 작성한 시 문구입니다.

<출처: 화쯔빙 웨이보>

2편의 시 중 오른쪽에 있는 시를 해석한다면 아래와 같을 것입니다.

무척이나 신선한 봄이구나
영혼만 물들지 않는다면
그것이 극락이요, 활기찬 생명의 현장이다
거센 바람이 분다 하더라도
태양과 장미 모두
활짝 필 것이다

아래 화쯔빙이 자기소개한 영상을 참고해보세요^^

<출처: 비리비리>

화쯔빙은 칭화대학교를 다니면서 지도 교수인 탕제의 가이드에 따라 더욱 업그레이드될 예정입니다. 하나의 작업으로 웹 페이지 섹션이나 프로젝트 아키텍트를 자동으로 설계하고, 내부 코드를 업데이트하여 정상적으로 실행할 수 있을 정도로 말입니다. 이는 화쯔빙이 할 수 있는 일부일 뿐, 앞으로의 활용 분야는 무궁무진할 것으로 예상되고 있습니다.

원문 출처: https://baijiahao.baidu.com/s?id=1701504980887068740&wfr=spider&for=pc

728x90
반응형