
챗GPT 개발사 오픈AI가 화면을 보지 않고 말로 상호작용하는 오디오 인공지능(AI)에 본격적으로 베팅하면서, 스크린 중심으로 굳어져 온 기존 IT 기기 질서에 변화를 예고하고 있다.
1일(현지시간) IT전문매체 디인포메이션에 따르면 오픈AI는 엔지니어링·제품·연구팀을 통합해 AI 기기용 모델 개선 작업에 나섰다. 더 자연스러운 음성을 구현하고 실제 대화처럼 상대방의 말에 끼어들거나 사용자가 말하는 도중에도 응답할 수 있는 새로운 음성 모델을 올해 초 공개하는 것을 목표로 하고 있다. 이는 현재 음성 AI 모델들이 구현하지 못하는 기능이다.
음성 AI 프로젝트는 캐릭터.AI 출신의 쿤단 쿠마르가 주도 중인 것으로 알려졌다. 또 오픈AI는 이와 함께 도구에 그치지 않고 동반자처럼 작동하는 AI 기기 제품군을 구상 중이며, 여기에는 안경 형태의 기기나 화면 없는 스마트 스피커 등이 거론되고 있다.
이러한 움직임은 기술 산업 전반이 향하는 방향을 또렷하게 보여준다고 테크크런치는 짚었다. 화면은 점차 배경으로 밀려나고 오디오가 중심이 되는 미래다. 실제로 스마트 스피커는 이미 미국 가정의 3분의 1 이상에 보급되면서 음성 비서를 일상으로 끌어들였다.
빅테크들도 이러한 방향에 동참하고 있다. 메타는 최근 레이밴 스마트 글래스에 5개의 마이크 배열을 활용해 시끄러운 공간에서 대활르 듣도록 돕는 기능을 출시했다. 구글은 작년 6월부터 검색 결과를 대화형 요약으로 변환하는 ‘오디오 오버뷰’ 실험에 돌입했고, 테슬라는 xAI의 챗봇 그록을 차량에 통합해 내비게이션부터 실내 온도 조절까지 자연스러운 대화로 처리하는 대화형 음성 어시스턴트를 구축 중이다.



