본문 바로가기

기타 디지털 소식

유해한 행동을 탐지하는 페이스북의 시뮬레이터 feat. AI 봇

반응형

소요에서 관련 내용 확인하기

회사 업무를 하며 흥미롭게 봤던 페이스북 관련 내용이고 페이스북 AI 블로그 원문을 전문 번역해봤습니다~ 페이스북 내 악의적 행동을 하는 사용자를 탐지하기 위해 AI 봇과 테스트 버전 페이스북 환경을 활용한다는 주제입니다.


유해한 행동을 탐지하는 페이스북 규모의 시뮬레이터

대규모 소셜 네트워크의 경우, 코드 업데이트나 새로운 기능을 테스트하는 일은 복잡하고 어렵습니다. 온라인 속 사람들은 전통적인 알고리즘이 모델링하거나 복제하기 어려운 방식으로 행동하고 상호 작용합니다. 사람들의 행동은 시간의 흐름에 따라, 또 지역에 따라 진화와 적응을 거치고 작은 변화에도 반응이 제각기 달라 예측하기 어렵습니다.

이렇게 복잡한 환경, 특히 안전, 보안 및 개인 정보 보호와 관련된 제품 영역에서 소프트웨어 테스트를 개선하기 위해 페이스북은 WES(Web-Enabled Simulation)를 개발했습니다.

WES는 복잡한 소셜 네트워크에 대해 매우 현실적인 대규모 시뮬레이션을 구축한 최초의 방법입니다. 아래 WES의 세 가지 중요한 특성을 소개합니다.

1. 머신러닝을 통해 봇을 훈련시켜 소셜 미디어 플랫폼 속 실제 사람들의 행동을 사실적으로 시뮬레이션합니다. 봇은 실제 사용자와 동일한 인프라를 사용한 채, 서로 상호 작용하도록 훈련됩니다. 다른 봇에게 메시지를 보내고, 봇의 게시물에 댓글을 달고, 자신의 게시물을 게시하며, 다른 봇에게 친구 요청을 할 수 있는 것입니다. 하지만 봇은 실제 사용자와 교류할 수 없으며, 실제 사용자나 플랫폼에 어떠한 영향도 줄 수 없습니다.

2. WES는 수천, 수백만 개의 봇들 간의 상호 작용을 자동화할 수 있습니다. 페이스북은 온라인과 오프라인 시뮬레이션의 조합을 사용하며 간단한 규칙, 지도학습, 정교한 강화학습 등을 통해 봇을 훈련시킵니다. 이를 통해 속도, 스케일, 사실성과 같은 엔지니어링 문제를 다루는 다양한 시뮬레이션 특성을 파악할 수 있습니다. 이처럼 시뮬레이션 특성을 확인하는 것이 중요한데, 그 이유는 효율과 효과의 극대화를 위해서는 사용자 케이스마다 서로 다른 엔지니어링 트레이드오프(trade-off)가 필요하기 때문입니다.

3. WES는 이러한 봇을 플랫폼의 실제 프로덕션 코드 기반에 배포합니다. 봇은 서로 상호 작용할 수 있지만 실제 사용자와는 분리되어 있습니다. 하지만 실제 인프라 기반이므로 봇의 동작은 플랫폼을 사용하는 실제 사람들에게 직접적으로 영향을 끼칠 정도의 효과를 가집니다.

WES는 시뮬레이션 환경에서 복잡한 시나리오를 자동으로 탐색할 수 있습니다. 현재는 아직 연구 단계이지만, 점차 업데이트하여 플랫폼을 사용하는 실제 사람들이 어떠한 형태로든 피해를 입기 이전에 신뢰성, 무결성 관련 문제를 발견 및 서비스 향상을 이룰 수 있을 것입니다. 추가로 페이스북은 확장성, 사실성, 실험적 제어를 통해 여러 반사실적, 가정적 질문에 답변할 수 있는 능력을 개발하고 있습니다.


집단적 도전에 대한 열린 접근법


정교한 시뮬레이션 환경 구축은 다양한 과학적 도전을 필요로 합니다. 현실적이고 지능적인 봇을 구축하기 위해 페이스북은 검색 기반 소프트웨어 엔지니어링, 머신러닝, 프로그래밍 언어, 멀티 에이전트 시스템, 그래프 이론, 게임 AI 등 광범위한 주제의 기술과 연구 자료를 수집합니다.

또한, 잠재적 메커니즘의 탐색 공간과 그곳에서 상호 작용하는 행동의 방식은 거대하고 복잡합니다. 메커니즘과 행동 방식의 작은 변화는 미묘하고 예상치 못한 방식의 상호 작용을 초래하며 이는 결국 시뮬레이션에 복잡성을 부여합니다.

페이스북은 진행 속도를 높이기 위해 연구 커뮤니티의 사람들로부터 의견을 구하고 있습니다. WES와 초기 프로토 타입 WW의 세부 정보를 공유하고, 학술 연구자와 과학자가 새로운 아이디어를 제공할 수 있도록 “제안 요청서(RFP)”를 런칭했습니다. 지금까지 전 세계 17개국에서 85건의 제안서를 받았다고 합니다.


매우 사실적인 테스트 환경인 WW 구축

페이스북은 WES를 사용하여 플랫폼의 실제 프로덕션 코드 기반을 사용하여 시뮬레이션된 페이스북 가상 환경 WW(World Wide Web의 작은 버전임을 나타냄)를 구축했습니다. WW를 통해 총, 마약과 같이 플랫폼에서 허용되지 않는 품목을 구매하려는 사실적인 AI 봇을 만들 수 있습니다. 봇은 실제 프로덕션 버전의 페이스북에서 작동하므로 실제 사람처럼 검색, 페이지 방문, 메시지 보내기, 기타 작업을 수행할 수 있습니다. 위에도 언급했지만, 봇은 실제 페이스북 사용자와 상호 작용할 수 없으며 사용자 경험에 영향을 줄 수 없습니다.

이 그림은 WES가 실제 프로덕션 버전의 플랫폼을 사용하여 AI 봇 간의 상호 작용을 테스트하는 방법을 보여줍니다. 실제 플랫폼에 배치하기 전에, WW에서 사용자 보호 메커니즘을 설계하고 WW 봇에 미치는 영향을 시뮬레이션하는 방법입니다. 중앙에 위치한 빨간색 봇은 다른 사람에게 유해한 콘텐츠를 보내는 사용자를 시뮬레이션합니다. WW에서 유해한 봇 동작으로부터 다른 사람을 보호하는 메커니즘을 검색하고 다양한 옵션, 환경설정, 매개변수 등을 테스트합니다.


페이스북은 WW 내부 시뮬레이션을 실행하여 봇이 페이스북의 보호 조치를 방해하고 커뮤니티 표준을 위반하는지 확인할 수 있습니다. 물론, 현재 실제 사람의 의도를 정확히 파악하거나 복잡한 행동까지 시뮬레이션할 수준에는 도달하지 못했습니다. 하지만 페이스북이 보유한 대규모 데이터를 기반으로 작업을 수행하면 새로운 행동 패턴을 식별하고, 문제를 해결하는 방법을 찾아내 테스트할 수 있습니다. 추가로, 페이스북 아키텍처 자체의 약점도 찾아내어 이를 보완하는 데 사용할 수 있다고 합니다.

참고 원문: https://ai.facebook.com/blog/a-facebook-scale-simulator-to-detect-harmful-behaviors

728x90
반응형