[미디어유스 / 김태섭 기자] 지난 14일 ChatGPT의 개발사 OpenAI에서 새로운 인공지능 모델, GPT-4를 공개했다. 기존의 GPT-3.5 기반 대화형 인공지능인 ChatGPT를 출시한 지 약 3개월 반 만이다. 현재 GPT-4는 월 20$인 ChatGPT Plus를 통해서만 이용할 수 있다.
GPT-4의 가장 큰 특징으로 멀티모달 기능이다. 채팅을 통해서만 대화가 가능했던 ChatGPT와는 달리 GPT-4는 채팅과 이미지, 두 가지 방식을 활용한 소통이 가능하다. GPT-4에 밀가루와 계란, 버터와 우유를 찍은 사진과 함께 ‘이 재료들로 무엇을 만들 수 있을까’라는 질문을 던지자 팬케이크, 와플, 크레프, 프렌치토스트, 오믈렛 등 수많은 답변이 돌아온다. 이러한 멀티모달 기능은 언어적으로 전달하기 어려운 정보들을 보다 쉽게 인공지능에 전달하며 대화의 편의성과 정확성을 높일 수 있으리라 평가받는다.
언어 능력도 큰 폭으로 향상되었다. OpenAI는 미국 변호사 시험에서 하위 10%의 성적을 받은 ChatGPT와는 달리, GPT-4는 상위 10%의 성적을 얻는 데에 성공했다고 밝혔다. 기존에 하위 31%의 성적을 거두었던 생물학 올림피아드 시험은 상위 1%를 기록했다는 연구 결과도 덧붙였다.
MMLU Benchmark 테스트 결과 역시 GPT-4의 성능을 뒷받침한다. MMLU(Massive Multitask Language Understanding) Benchmark 테스트는 대규모 멀티태스킹 언어 이해 측정으로, 인문학, 사회과학, 자연과학, 도덕적 시나리오 등 57개 과목, 총 14,000여 개의 문제를 통해 인공지능 모델이 획득한 지식을 평가하는 벤치마크이다. GPT-4 기술 보고서에 의하면 GPT-4의 MMLU Benchmark 테스트 평균 점수는 86.4점으로, 해당 분야의 인간 전문가와 유사한 수준이다. GPT-3.5 모델의 결과가 70.1점이었음을 고려한다면 놀라운 발전이다.
언어 능력의 발전은 영어에 그치지 않았다. OpenAI의 GPT-4 기술보고서에서 공개한 27개 언어의 MMLU Benchmark 테스트 평균치는 81.35점으로, 해당 수치 역시 GPT-3.5 기반 모델의 결과보다 10점 이상 상승하였다. 한국어 평균 점수 역시 77점으로, 기존의 영어 평균보다 7점 가량 높은 수치를 기록했다. 지금까지는 한글로 ChatGPT를 사용하는 경우 영어에 비해 느린 답변 속도와 적은 정보량을 감안해야만 했다. 이번 GPT-4 기반의 인공지능을 통해 한국 사용자들 역시 현재보다 원활한 수준의 대화를 기대할 수 있게 되었다.
GPT-4는 이외에도 한 번에 처리할 수 있는 단어량을 25,000개로, 기존 3,000개에 비해 8배 이상 늘렸다. 또한 전문가와의 협력을 통해 허용되지 않은 내용에 대한 응답 진행을 82% 낮추어 안전성을 높였으며, 사실이 아닌 내용을 사실이라고 주장하는 응답을 40%가량 낮추어 정확성을 높였다.
사실 GPT-3.5 기반의 ChatGPT는 이미 실생활에 널리 활용되고 있다. 사용자의 질문에 적합한 답변을 제공하는 ‘AI 챗봇’ 분야는 물론이고, 온라인 학습 프로그램 ‘퀴즈렛(Quizlet)’, 영어 공부 애플리케이션 ‘스픽(Speak)’ 등 학습 프로그램 기업들은 앞다투어 ChatGPT 기반의 인공지능을 도입하며 사용자 맞춤 질문, 피드백 등을 고객에게 제공하고 있다. 일부 쇼핑몰 기업에서는 해당 기능을 활용하여 각 소비자에게 적합한 상품을 자동으로 추천하는 쇼핑 어시스턴트 시스템을 개발, 도입 예정이다. 아직 기획 단계에 불과하지만, 일반 기업에서 역시 운영 및 실적 관리, 투자 포트폴리오 분석, 업무 지식 공유 등 다양한 분야에서의 ChatGPT 활용 방식이 개발되고 있는 시점이다.
이렇듯 인공지능의 발전 속도는 나날이 빨라지고 있지만, 인공지능을 대하는 각국의 태도는 엇갈린다. 출시 2개월 만에 월 사용자 1억 명을 넘어선 것과 대조적으로 중국과 미국 일부 주에서 ChatGPT 접속을 금지한 것이 대표적인 사례이다. 일본, 미국 등의 금융, IT 기업 역시 개인정보 보호 등을 이유로 사내 ChatGPT 사용을 금지하는 추세이며, 유럽연합(EU)이 3월 중으로 초안 발표 예정인 ‘인공지능 법안’ 역시 인공지능의 위험성 제거를 목적으로 한다.
이에 반해 한국은 정부 중점적으로 비교적 긍정적인 태도를 보인다. 과학기술정보통신부는 지난 2월 ChatGPT 기능 시연 및 AI 생태계의 미래에 대한 전문가 특강을 시작으로 지난달 22일 ‘초거대 인공지능(AI) 간담회’, 23일 ‘초거대 인공지능 및 인공지능 일상화 현장 간담회’, 지난 8일 ‘제3차 인공지능 최고위 전략 대화’ 등 수많은 논의를 통해 ChatGPT와 인공지능을 통한 기술 발전을 꾀하고 있다. 이는 지금까지 반도체, 디스플레이 등 다양한 IT 기술과 함께 발전한 한국의 친(親)기술적인 정서가 반영된 결과라고 볼 수 있을 것이다.
이미 인공지능의 시대는 시작되었다고 봐도 무방하다. GPT-4가 가져올 내일은 GPT-3.5 기반의 ChatGPT가 가져온 오늘과는 또 다른, 보다 새로운 미래일 것이다. 기술의 발전 속도는 빠르고, 새로운 기술이 우리의 삶에 녹아드는 속도는 이를 초월한다. 1868년 멘델이 유전 법칙을 발견한 지 135년 만에 인류는 인간의 게놈 지도를 완성했다. 1903년 라이트 형제가 12초의 비행을 성공한 지 63년 만에 인류는 달에 도달했다. 1990년 최초의 WWW(World Wide Web) 사이트가 개설되고 33년이 지난 지금, 인류는 어쩌면 스스로의 운명을 바꿀 거대한 전환점 앞에 서 있다.
지금껏 없었던 새로운 미래를 대비하는 데에 있어 무엇이 옳은가 그른가에 대한 토론은 무의미할 것이다. 중요한 것은 명확한 방향성의 설정이 아닌 범용성 있는 대처 계획 수립이다. 인공지능이 가져올 새로운 미래에 대해, 어떤 예측에 따라 어떤 결과가 도출되더라도 그에 적절히 대응이 가능할 만한 여러 대비책을 강구해야 한다. 어제와 오늘의 잣대에서 바라본 옳고 그름이 아닌 내일의 시선에서 바라보는 대비, 그것이 2023년의 우리가 인공지능을, 4차 산업혁명을 맞이하는 자세이지 않을까 싶다.
