AI의 명과 암...상상 초월 딥페이크 기술에 개발진도 당혹

[데일리포스트=김정은 기자] 최근 인공지능(AI)을 이용한 영상 변환 기술 ‘딥페이크(deep fake)’에 대한 관심이 높아지고 누구나 쉽게 기술을 활용하게 되면서 딥페이크 포르노 등 부작용이 속출하고 있다.

이런 가운데 최근 일론 머스크가 설립한 비영리 인공지능 연구소 오픈AI(OpenAI)가 딥페이크의 문장 버전이라 할 수 있는 텍스트 생성기(Text Generator)를 개발했다. 하지만 예상을 뛰어넘는 높은 수준의 텍스트 작성 능력에 개발진이 그 위험성을 우려하고 있는 것으로 알려졌다.

영국 가디언지(The Guardian)는 지난 14일(현지시간) 오픈AI 연구팀이 텍스트 생성 AI 모델인 'GPT2'를 개발했지만 범죄에 악용될 위험을 고려해 기술적 세부 사항을 담은 논문 발표를 연기하기로 결정했다고 전했다.

논문 공개는 연기되었지만 가디언은 GPT2가 텍스트를 자동 생성하는 장면을 담은 동영상을 공개했다. GPT2는 주로 뉴스와 픽션(Fiction)을 자동 생성하는 인공지능(AI) 모델이다.

가디언은 먼저 브렉시트(Brexit) 관련 첫 문장을 입력한다. 이는 "유럽연합(EU) 탈퇴 여부를 묻는 국민투표 이후 브렉시트는 이미 영국 경제에 적어도 800억 파운드의 부담을 주고 있다"는 내용이다.

그 후 GPT2가 자동으로 텍스트를 생성하는 데 밑줄이 그어진 부분의 텍스트가 GPT2가 쓴 것이다. GPT2는 첫 문장에 이어 "또한 많은 업계 전문가들이 브렉시트로 인한 경제적 손실이 한층 커질 것으로 전망한다"는 문장을 생성했다.



이처럼 GPT2는 몇 단어로 구성된 첫 문장만으로 이후에 이어질 매우 자연스러운 문장을 예측한다. 수준이 높고 잠재적으로 '가짜 뉴스' 등 다양한 용도로 응용될 수 있어 연구자들은 그 위험성을 우려하고 있다.

가디언은 “GPT2는 간단히 그럴듯한 문장을 만든다. 단락 중간에 지금까지 써 온 내용을 잊거나 문장이 길어지면 어색해지는 기존 AI 텍스트 생성기에서 볼 수 있었던 단점도 거의 찾아볼 수 없다”고 전했다.

매체는 GPT2가 두 가지 측면에서 획기적이라고 설명했다. 오픈AI 연구 이사인 다리오 아모데이(Dario Amodei)는 “GPT2가 (기존 최신 AI 모델보다) 훨씬 넓은 범위인 15배의 데이터를 수용할 수 있다”고 말한다. GPT2는 소셜 뉴스 사이트 레딧(Reddit)에서 3표 이상을 획득한 링크를 선별해 약 1000만 건의 문서를 학습했다. 데이터 용량은 텍스트만 40GB이며 이는 소설『백경』을 약 3만 5000권 저장할 수 있는 수준이다.

또 GPT2는 범용성이 높고 입력된 텍스트를 구조화해 번역 및 요약 등의 작업을 수행할 수 있다. 간단한 독해 시험에 합격할 수준의 문장을 생성할 수 있으며 특히 번역과 요약 작업에서 기존 AI 모델을 압도하는 성능을 발휘한다.

가디언지의 알렉스 헌(Alex Hern)은 트위터에 “신문에 게재된 문장은 GPT2가 작성한 것으로 (사람의) 편집 작업은 없었다”고 언급했다.



오픈AI 측은 GPT2의 텍스트 품질이 우수하기 때문에 이를 악의적으로 이용하면 어떤 문제가 발생할 지 신중히 검토할 시간이 필요하다고 판단, GPT2의 공개시기를 늦추기로 한 상황이다.

정확한 평가를 위해 스팸 및 가짜 뉴스를 생성하는 GPT2 버전도 만들고 있다. 인터넷상의 텍스트를 기반으로 학습이 이루어진 만큼 음모론이나 편견이 담긴 글을 비교적 어렵지 않게 만들 수 있을 것으로 예상하고 있다.

오픈AI의 프라이버시 디렉터 잭 클라크는 “기술 도입을 위한 비용은 지속적으로 감소하고 있으며 기술을 제어하는 룰도 근본적으로 변했다”며 첨단 기술에 대한 명확한 규범이 필요하다고 강조했다.

저작권자 © 데일리포스트 무단전재 및 재배포 금지