챗GPT도 새 추론 AI 등장 이후 엉뚱한 답으로 골머리

엑스(X·옛 트위터)를 통해 알려진 사례에서는 ‘미국 채권시장에서 워런 버핏의 비중이 큰 것이 증시에 어떤 의미가 있는지’, 또는 ‘토론토 블루제이스 투수 맥스 셔저의 연봉은 얼마나 많은가’ 등 다양한 질문에 그록이 “일부 사람들은 남아공에서 백인 농장주들이 불균형적인 폭력에 직면해있다고 주장한다” 는 전혀 엉뚱한 답변을 내놨다. 심지어 사용자들이 ‘틀렸다’고 지적했음에도 거듭 해당 내용을 언급하기도 했다.
이는 단순 오류보다는 편향성 문제로 불거질 수 있는 사례라는 게 CNBC 평가다. 남아공은 머스크가 태어나고 자란 국가다. 또 머스크 자체도 남아공 백인 학살 주장을 지지한다. 최근 도널드 트럼프 미국 대통령이 학살 주장을 이유로 남아공 백인 49명의 난민 지위를 인정하고 미국 내 정착을 허용했는데 해당 주장은 현실과는 거리가 있다.
그록은 물론 챗GPT도 응답 신뢰도 문제가 제기되고 있다. 3월 말 추론 AI인 ‘GPT-4o’로 업데이트 이후 문맥과 상황에 맞지 않는 답변이나 반응이 제공되는 사례가 보고된다. 이에 오픈AI는 ‘안전성 평가 허브’를 도입해 신뢰성을 높이기로 했다. 자사 AI 모델에 대한 안전성 평가 결과를 웹페이지에 게재해 투명성을 높이고 문제를 즉각 개선하는 조치를 취한다.
오픈AI는 성명에서 “우리 AI 모델이 유해 콘텐츠 생성, 안전장치를 우회해 제한된 콘텐츠를 생성하는 ‘탈옥’, 환각 등 여러 문제와 관련해 테스트하고 점수를 공개하며 꾸준히 갱신해 신뢰도를 높일 것”이라고 강조했다.