음성인식의 원리, "경쟁에서 살아남는 단어 만이 인식되는 냉혹한 세계"

입력 2013-11-13 07:56

온라인뉴스팀

기자 이름을 클릭하면
더 자세한 정보를
확인할 수 있어요!

북마크 되었습니다.
마이페이지에서 확인하세요.

가장작게
작게
기본
크게
가장크게

음성인식의 원리

(사진=뉴시스)

'음성인식의 원리'가 소개돼 네티즌들의 관심이 쏠리고 있다.

최근 한 포털 사이트에는 '음성인식의 원리'라는 제목의 글이 게재돼 네티즌들의 눈길을 끈다.

게시된 글을 보면 음성인식기가 사람의 음성을 인식하는 기본적인 원리는 음성 파형 분석이다.

음성인식기는 매 1/1000초 단위로 그 시점에 있는 약 0.02초 길이의 음편을 가져와 분석한다. 그때 짧은 길이의 음성 파형은 여러 단계의 신호 처리를 거쳐 최종적으로 10개 이상의 숫자들이 나오는데, 음성 파형 분석은 성대 진동 횟수와 입 모양을 그릴 수 있는 숫자들을 분석하는 것이다.

한편, 음성 인식 측면에서 보면 사람은 어떤 음높이의 ‘학교’라는 말을 들어도 모두 ‘학교’라는 언어 정보를 추출한다. 즉, 성대의 진동 주기는 언어 정보와 무관하다. 그러므로 음성 파형을 분석한 숫자들을 더 이상 사용하지 않는다.

이를 비유적으로 표현해보자. 성문에서부터 입까지 찍는 특수한 사진기가 있다고 가정하고 그 사진기는 초당 100회 사진을 찍게 된다. 음성인식은 그 사진들을 시간 축으로 나열해 놓고 어떤 말일까 계산하는 과정이라고 할 수 있다.

음성인식기가 빠르게 음성을 인식하는 방법은 간단하다. 모든 후보 단어 열에 대한 가능성을 열어두고, 음성인식기가 음성을 듣다가 정답이 아닐 것 같은 후보들을 빨리 탈락시키면 된다. 음성 신호가 모두 처리됐을 때 그 험한 경쟁에서 살아남은 최종 단어가 최종 인식 결과가 되기 때문이다.

#음성인식의원리 #음성인식 #음성인식기 #음성인식기술

좋아요0
화나요0
슬퍼요0
추가취재 원해요0

주요 뉴스

“성장률 0%대 되나”…한은, '1.5%→?' 수정경제전망 주목

한은, 이달 29일 기준금리 결정날 수정경제전망 발표 올해 성장률 전망치 기존 1.5%…0%대로 낮출지 관심 2000년 이후 0%대 성장률 2009·2020년 단 두 번 한국은행이 올해 경제성장률을 ‘0%대’로 낮춰 잡을지 관심이 집중되고 있다. 2000년대 이후 연간 성장률이 0%대를 기록한 해는 2009년(0.8%)과 2020년(-0.7%) 단 두 차례뿐이다. 올해 전망치
엔비디아, 중국시장 절대 못 놓아…수출용 새 저가 칩 양산 착수

블랙웰 아키텍처 기반 AI 프로세서 제품군 저사양 메모리 사용 등 통해 가격 크게 낮춰 이르면 6월부터 대량 생산...다른 모델도 개발 중 젠슨 황 “수출 제한에 150억 달러 매출 손실 위기” 엔비디아가 미국의 규제를 피해 중국에 인공지능(AI) 칩을 수출하기 위해 이르면 6월부터 새로운 저사양 모델을 대량 생산할 계획이라고 CNBC방송이 24일
홍준표 “이준석에 대한 투표, ‘사표’ 아니라 ‘미래 투자’”

홍준표 전 대구시장은 25일 지지자 소통 채널인 ‘청년의 꿈’에 “이준석에 대한 투표는 사표(死票)가 아니라 미래에 대한 투자”라고 했다. 홍 전 시장은 이날 한 지지자가 이준석 개혁신당 후보를 향해 단일화를 촉구하는 내용이 담긴 나경원 국민의힘 의원의 페이스북 글을 비판하는 게시글을 올리자 이같이 댓글을 달았다. 나 의원은 전날(24일
AI 반등에 사활 건 카카오… ‘카나나’ 시험대 위로

8일 CBT 시작 '카나나' 첫 업데이트 앞둬 “카나나, 서비스 사용할수록 성능 고도화” 카나나 이후 하반기 AI 서비스 출시 예고 AI 메이트 로컬ㆍ오픈AI 협업 AI 에이전트 올해 1분기 주춤한 실적을 보이며 숨 고르기에 나섰던 카카오가 인공지능(AI) 사업을 필두로 하반기 반등에 나설 예정이다. 이때 가장 중요한 것은 현재 비공개 시범 테스트(
마약류 감정 6년간 3배 증가⋯압수품 3분의 1은 '신종마약'

지난해 국립과학수사연구원(국과수)에 접수된 마약류 감정 건수가 6년 전보다 3배가량 증가한 것으로 나타났다. 신종 마약류 유행과 마약류 집중단속 영향이다. 행정안전부 국과수는 이 같은 내용의 ‘마약류 감정백서 2024’를 발간했다고 25일 밝혔다. 과거에는 국내에서 메트암페타민과 대마 중심으로 마약류가 유행했으나, 버닝썬 사태가 발생
신유빈-유한나, 세계탁구선수권대회 4강서 아쉬운 패배…동메달 목에 걸었다

신유빈(대한항공)-유한나(포스코인터내셔널) 조가 '2025 국제탁구연맹(ITTF) 세계탁구선수권대회' 여자복식 4강에서 패하며 아쉽게 동메달로 대회를 마감했다. 신유빈-유한나 조는 25일(한국시간) 카타르 도하 루사일 스포츠아레나에서 열린 대회 여자복식 준결승에서 베르나데트 쇠츠(루마니아)-소피아 폴카노바(오스트리아) 조에 2-3(5-11 11-
청년 유입 없고 외국인 가득한 현장에 머리 아픈 건설업계

국내 건설 현장에서 외국인 근로자 비중이 가파르게 증가하고 있다. 동시에 20~30대 청년층 근로자의 신규 유입은 감소하면서 고령화 추세도 심화하고 있다. 업계에서는 의사소통, 태업 등 관련 문제 해결을 위해 동분서주 하는 모습이다. 이에 자체 번역 프로그램을 운용하는 등 새로운 시도도 나타나고 있다. 25일 건설근로자공제회가 발간한
‘런치플레이션’에 급식 시장 호조...업계 수익성은 희비교차, 왜?

삼성웰스토리·현대그린푸드·CJ프레시웨이, 나란히 1분기 매출 신장 현대그린푸드·CJ프레시웨이, 영업익 증가⋯삼성웰스토리 뒷걸음 매출 증가 배경엔 고물가 따른 외식비 부담…급식 수요 계속 증가 최근 치솟는 외식 물가에 점심값 부담이 커지면서 단체급식 업체들의 올해 1분기 매출이 나란히 성장했다. 상대적으로 비싼 식당 대신 구내식당에

0 / 300

음성인식의 원리, "경쟁에서 살아남는 단어 만이 인식되는 냉혹한 세계"

댓글