본문 바로가기

기타 디지털 소식

GPT-3 관련 서비스는 얼마나 될까? feat, AI 스타트업

반응형

소요에서 관련 글 확인하기

GPT-3를 사용하여 프로젝트를 진행하거나, 애플리케이션을 개발하고 서비스하는 스타트업들이 늘어나고 있습니다. 이렇게 GPT-3로 인해 다양한 비즈니스 모델이 나오고, 스타트업 생태계가 활발해진 것처럼 보입니다. 하지만 이번에 번역한 내용은 GPT-3로 인한 기대감과 달리 실상은 그렇게 낙관적이지 않음을 지적하고 있습니다.

GPT-3는 오히려 기존 AI 기업들이 더 활발하게 사용하고, 플랫폼을 업그레이드하는 데 이용하는 듯합니다. GPT-3에게 제공할 수 있는 데이터가 많으니까 말이죠. 또한, 스타트업에서 좋은 비즈니스 모델이 나왔다고 하더라도 누구나 이용 가능한 GPT-3의 특성상 금방 카피(copy)할 수 있다는 문제도 있습니다.

오늘 소개해드릴 기사는 위와 같은 문제를 잘 직시하고 약간은 냉정하게 현실을 바라보고 있습니다. GPT-3가 대단한 기술은 맞지만 스타트업 생태계를 다시 살릴 수 있는 의미가 큰 도구는 아니라는 것입니다. 누구나 사용 가능한 만큼 누구나 생각하는 비즈니스 모델이 비슷하고, 혁신적인 비즈니스 모델을 창출했다 해도 거대 기업이 시시 탐탐 노리고 있는 상황입니다. 천천히 읽어보시면 좋을 듯합니다^^

 


 

GPT-3 제품을 만드는 데 필요한 것

지난해 OpenAI가 GPT-3를 공개하면서 많은 관심을 받았다. 사람들은 GPT-3를 통해 이메일과 기사를 자동으로 작성하고 텍스트를 요약하며, 시를 짓고, 웹 사이트 레이아웃을 만들며, 파이썬에서 딥러닝을 위한 코드를 생성했다. 이렇게 GPT-3를 기반으로 한 다양한 유형의 새로운 비즈니스들이 나타날 것이라는 기대로 가득 찼다.

<출처: 한국일보>

GPT-3는 8개월이 지난 후에도 AI 연구 분야에서 도전적인 실험의 대상이 되고 있다. 하지만 GPT-3가 AI 기반 애플리케이션 개발을 민주화하는 플랫폼이 될지는 미지수다.

물론, GPT-3와 같이 파괴적인 기술이 지속 가능한 시장을 창출하기 위해선 더 많은 시간이 필요하다. 하지만 지금까지의 발전 양상을 살펴보면, 아쉽게도 GPT-3의 혜택을 받고 있는 측은 새롭게 비즈니스를 시작하는 스타트업이 아니라 이미 AI 분야에서 많은 영향력을 행사하고 있는 기업인 듯하다.

과학적 관점에서 본 GPT-3

사실 자연어처리 분야에서 GPT-3는 획기적인 돌파구라고 할 수 없다. 순수하게 딥러닝에 기반을 둔 다른 언어 모델들처럼, 상식이나 추상적인 지식을 다루는 데 능숙하지 않다. 그럼에도 불구하고 주목할 만한 기술이며, 훨씬 더 큰 신경망을 만들고 이전보다 더 많은 데이터를 입력함으로써 NLP 기술 변화를 가져올 수 있다. 참고로 GPT-3 규모는 이전 버전보다 100배 이상 커졌고, 적어도 10배 이상 많은 데이터를 학습했다.

GPT-3는 제로샷 및 퓨샷 학습을 수행할 수 있는 언어 모델이다. 다시 말해, 코드 추가 작성, 재학습을 위한 시간 및 값비싼 리소스 사용, 아키텍처 변경 등을 하지 않고도 많은 애플리케이션에 적용할 수 있다. 따라서 출력되길 원하는 타겟의 한두 가지 샘플을 AI 모델에게 보여주기만 하면 된다. 이후 AI는 놀라운 정확도로 새로운 입력에 대한 작업을 수행하기 시작할 것이다.

사람들은 개발자가 딥러닝에 대한 광범위한 지식 없이도 AI 기반 애플리케이션을 만들 수 있다고 생각하기 시작했다. 이는 GPT-3를 기반으로 비즈니스를 시작하는 새로운 세대의 기업들이 탄생할 것이라는 기대감으로 이어졌다. 하지만 AI 비즈니스는 그렇게 이루어지지 않는다.

비즈니스 관점에서 본 GPT-3

OpenAI가 GPT-3 상용화를 결정한 이유는 아마도 꾸준한 자금 지원이 필요했기 때문이다. AI 리서치 랩은 AI 모델을 학습시키고 연구자들의 월급을 지급하기 위해 많은 돈을 써야 한다. 설립자들과 후원자들의 기부금만으로 운영을 지속할 수 없어, 안정적인 수입원이 필요했을 것이다. GPT-3를 상용화하면 이를 사용하는 기업으로부터 수입이 발생하지 않겠는가.  

GPT-3를 클라우드 서비스로 제공함으로써 얻을 수 있는 이점 중 하나는 AI 모델을 실행하는 데 따른 기술적, 재정적 어려움을 해결한다는 것이다. 개발자는 GPT-3를 실행할 수 있는 서버 클러스터를 별도로 설치하지 않고도 API를 통해 바로 사용 가능하며, 사용한 만큼 비용을 지불하면 된다.

하지만 GPT-3 서비스가 언어 모델 사용의 복잡성을 줄여준다고 해도, 비즈니스 제품의 성공 여부와 관련된 아래의 과제를 해결하지는 못한다.

1. 사람들이 어려움을 겪고 있는 실제 문제를 해결하고 있음을 증명해라
2. 시장 내 다른 경쟁자보다 최소 10배 이상 더 잘 해결하고 있음을 증명해라
3. 규모에 맞게 서비스를 제공할 수 있음을 증명해라
4. 고객 1명을 유치하는 비용이 전체 고객에서 얻는 평균 수익보다 낮도록 하는 수익성 로드맵을 수립해라
5. 경쟁업체가 따라 할 수 없는 비즈니스 모델을 수립해라

마지막 요점이 중요하다. 아마존을 예로 들어보자. 아마존의 비즈니스를 따라 하는 것은 불가능하지 않다. 그렇다면 왜 다른 어떤 경쟁자도 이 거대 전자상거래 기업을 파괴하지 못했을까? 아마존은 네트워크 효과를 통해 플랫폼을 중심으로 막대한 거래 공간을 구축했다. 소비자는 아마존에 판매자가 있기 때문에 아마존에서 소비 활동을 한다. 판매자는 아마존에 구매자가 있기 때문에 아마존에서 판매 활동을 한다. 아무리 훌륭히 아마존을 따라 하더라도, 중요한 구매자 및 판매자 집단을 플랫폼에 불러들이지 못한다면 “모든 것을 파는 상점”, 아마존과의 경쟁에서 우위를 차지할 수  없다.

GPT-3를 기반으로 한 수익성 높은 애플리케이션 구축

머신러닝 기반 제품 출시에서 갖추어야 할 경쟁 요소에는 네트워크 효과, 기능뿐만 아니라 AI 팩토리(factory)도 포함된다.

1. AI 모델을 교육하는 데 필요한 데이터를 통합하는 탄탄한 인프라를 갖추어라
2. 제품 사용자 행동을 지속적으로 학습하고 알고리즘을 미세 조정(fine-tuning)할 수 있도록 새로운 양질의 데이터를 수집할 수 있는 수단을 갖추어라

아마존은 고객의 구매 행위와 관련된 많은 데이터를 보유하고 있다. 이를 통해 고객에게 관련 상품을 추천하거나 공급망을 보다 효율적으로 만드는 머신러닝 알고리즘을 개발하게 된다. 이로써 판매를 개선하고, 배송 및 배송을 최적화하며, 운영 비용을 절감하여 다른 전자상거래 플랫폼보다 앞서나갈 수 있다. 결과적으로 더 많은 사람들이 아마존을 이용하게 되기 때문이다. 

고객들은 계속해서 많은 데이터를 생성하고, 아마존은 훨씬 더 많은 학습, 알고리즘 개선 및 새로운 AI 기능 개발 등을 시도할 수 있는 기회를 갖는다. 이 사이클을 유지하는 한 아마존은 전자상거래 시장을 계속 장악할 것이다. 아마존과 경쟁하려는 기업은 아마존 비즈니스 모델을 따라 하는 것을 넘어 아마존의 거대한 데이터 장벽을 극복해야 한다.

여기서 GPT-3를 짚고 넘어가야 한다. 언어 모델은 그 자체가 AI 팩토리다. 클라우드 API 서비스로 제공되는 제로샷 학습 시스템은 새로운 것을 배우기 위함이 아니다. 모든 기능을 사용할 수 있지만, 근간이 되는 AI 모델은 바꿀 수 없다. 이후 OpenAI가 GPT-3를 업그레이드하면, 해당 모델은 곧바로 모든 API 클라이언트가 동시에 이용할 수 있게 된다. 하지만  근본적인 모델을 수정하고 개선하는 주체는 OpenAI다. 

언어 모델은 AI 기술에 대한 접근 장벽을 낮추었다. GPT-3를 통해 구축하는 애플리케이션은 다른 개발자가 쉽게 따라 할 수 있다. 따라서 별도의 전략 없이 GPT-3에만 의지하여 전체 제품 및 비즈니스 모델을 구축하면 시장에서 입지를 공고히 할 수 없다. 반대로, 이미 상당한 시장 점유율을 가지고 있는 비즈니스의 경우, GPT-3는 또 다른 매력을 더해주는 좋은 요소가 될 수 있다.

GPT-3 스타트업

GPT-3 베타 버전 출시 이후, 이를 사용하여 다양한 애플리케이션을 만들고자 하는 수많은 스타트업들이 등장했다. 체리 벤처스(Cherry Ventures)의 투자자인 알렉스 스키밋(Alex Schmitt)은 자동화된 웹 및 광고 복제에서 이력서 작성 및 웹 사이트 생성에 이르는 여러 제품을 포함한 GPT-3 프로젝트 리스트를 만들었다.

airtable.com/shrndwzEx01al2jHM/tblYMAiGeDLXe35jC

 

Airtable | Everyone's app platform

Airtable is a low-code platform for building collaborative apps. Customize your workflow, collaborate, and achieve ambitious outcomes. Get started for free.

airtable.com

이러한 애플리케이션 중 일부는 실제 문제를 해결하는 것처럼 보이지만, 대부분은 지속 가능한 비즈니스 모델을 가지고 있지 않다.

예를 들어, 한 기업은 “최초의 GPT-3 이력서 생성기”란 타이틀을 가지고 사용자가 입력하는 대로 이력서 내용을 자동으로 완성하는 애플리케이션을 홍보한다. 이는 유용한 애플리케이션이지만, 지속 가능한 비즈니스가 될 수 있는지는 의문이다.

참고로 클라우드 기반 애플리케이션의 주요 수익원 중 하나는 사용자가 지속적으로 지불하는 비용이다. GPT-3 이력서 생성기 서비스 기업 역시 몇 가지 월별 가격 체계를 준비했다. 하지만 중요한 점은 사람들이 매달 이력서를 쓰지 않는다는 것이다. 대부분 가입 후 첫 달 안에 서비스 이용을 중지할 것이며, 결과적으로 매우 높은 이탈률이 예상된다.

만약 해당 서비스가 게임 체인저라면, GPT-3 독점 라이센스를 보유한, 링크드인(LinkedIn)까지 소유한 마이크로소프트가 가만히 있지 않았을 것이다. 저렴한 비용 혹은 무료로 오피스(Office) 제품군에 추가해 서비스를 제공하지 않았을까? 

또 다른 예로 GPT-3를 통해 광고, 설명, 메타데이터, 랜딩 페이지, 블로그 게시물 등을 초 단위로 작성하는 기업 카피스미스(Copysmith)가 있다. 이는 확실히 GPT-3가 좋은 결과를 보여주는 분야다. 하지만 복잡한 주제에 대한 심층 분석이나 논평 작성 등의 작업에서 GPT-3는 좋은 도구가 될 수 없다. 물론, 웹 카피라이팅과 같은 비교적 간단한 작업에는 확실히 도움이 될 것이다.

카피스미스 이용 방법은 간단하다. 기업 이름, 타겟 고객, 간단한 설명과 같은 정보만 입력하면 자동으로 광고 문구, 제품 설명 등을 생성해 준다. 

GPT-3가 생성하는 텍스트는 완벽하지 않고 여전히 수정 및 보완이 필요하지만, 생산성 향상과 비용 절감 측면에서 주목할 필요가 있다. 툴만 적절히 사용하기만 하면 콘텐츠 작성자 여러 명이 해야 하는 작업을 단번에 완성할 수 있으며, 인건비도 절약할 수 있다. 카피스미스는 월별 19달러, 60달러 및 500달러 플랜을 준비했고, 각각 약 500건, 2,500건, 20,000건의 콘텐츠를 제공한다. 따라서 개별 기업은 물론 여러 고객에게 서비스를 제공하는 대형 콘텐츠 제작사에게도 매력적이다.

하지만 GPT-3의 진입장벽이 낮은 상황에서 다른 회사들도 곧 카피스미스 모델을 따라 할 것이다. 이미 헤드라임(Headlime)은 비슷한 기능을 제공하고 있는 상황이다. 대규모 콘텐츠 제작사의 경우, 조금만 투자하면 쉽게 사내용 툴을 만들 수도 있다.

사람들의 주목을 끈 기업이 하나 더 있다. 아더사이드AI(OthersideAI)는 GPT-3를 사용하여 이메일  메시지를 자동으로 생성한다. 중요 항목만 입력하면 AI가 처음부터 끝까지 이메일 내용을 작성하는 것이다. 또한 과거 이메일을 바탕으로 개인 이메일 작성 스타일을 학습해 사용자 맞춤형 이메일을 작성한다. 가격 체계는 아직 준비된 바가 없으며, 현재 프라이빗 배타 서비스를 제공하고 있다.

아더사이드AI는 애플리케이션을 만들기 위해 260만 달러의 기금을 모았으며, 그만큼 사람들의 기대를 받고 있다. 흥미로운 점은 아더사이드AI 역시 단순히 GPT-3 위에 UI를 추가하는 것 이외에 다른 비즈니스 전략이 필요함을 알고 있다는 것이다. 1월 22일, 트위터에 아래의 글이 올라왔다.

“더욱 다양한 이메일을 쓰도록 이메일 생성기를 학습시키는 데에는 여러분들의 도움이 필요합니다.”

정확히 말하면, GPT-3는 폐쇄형 모델이라 학습시킬 수 없다. GPT-3 API는 사용 가능하지만 해당 언어 모델의 진짜 모습은 파악하기 어렵다. 물론, 하나 이상의 데이터 샘플과 응답을 학습시키면 성능을 향상시킬 수 있다. 언어 모델은 이러한 새로운 샘플을 사전에 인코딩된 방대한 말뭉치에 매핑하고 적용하여 적절한 결과값을 생성한다. 아더사이드AI는 아마도 이를 차별화 요소로 생각하고 있을 것이다.

실제로 많은 수의 이메일 말뭉치를 수집하면서 경쟁력을 강화하고 있다. 수집된 데이터를 여러 가지 방법으로 가공하고 처리하면 GPT-3의 성능을 기본 이상으로 개선할 수 있다. 예를 들어, 사용자 입력과 가장 관련성이 높은 이메일 샘플을 매치하는 간단한 머신러닝 모델을 만든 후, 입력과 결과값을 GPT-3에 학습시켜 새 이메일을 생성하는 방법도 있다. 이 전략이 효과가 있을 수 있지만, 사용자 개인 데이터 처리 문제로 인해 난처해질 가능성이 있다.

아더사이드AI는 다른 이메일 애플리케이션에 통합될 수 있다는 점에서 유리하다. 하지만 지메일(Gmail)이나 마이크로소프트 아웃룩(Outlook)과 같은 제품들이 미래에 유사한 기능을 추가할지 예의주시해야 할 것이다. 

GPT-3는 어느 애플리케이션 생태계에 적합한가?

위에서 언급한 사례에서 알 수 있듯이, GPT-3는 결코 스타트업 생태계를 개선시키는 완벽한 도구가 아니다. 오히려 언어 모델과 그것의 후속 버전은 기존 애플리케이션을 개선하고, 연관 제품군을 업그레이드하는 데 도움을 주는 플랫폼이 될 것이다. 이와 관련하여 마이크로소프트가 GPT-3를 오피스, 팀즈(Teams), 다이내믹스(Dynamics), 빙(Bing)에 어떻게 통합할 것인지 지켜볼만하다. 

GPT-3를 기반으로 수익성이 높은 새로운 비즈니스와 제품을 만들고, 다른 기업과 경쟁하기 위해선 신중한 계획이 필요하다. 하지만 아이러니하게도 이를 위해 필요한 전략은 다른 AI 기업들이 취하는 것과 크게 다르지 않다. 결국 양질의 데이터를 수집하고, 새로운 것을 학습하며, 더 나은 머신러닝 모델을 만드는 것이다.

참고 원문: What it takes to create a GPT-3 product | VentureBeat

728x90
반응형