본문 바로가기
보청기_ 핫이슈

소음감소 알고리즘의 진화

by 브라이언송 2010. 5. 20.
반응형
보청기에 인공지능 기능이 탑재되어 있음 얼마나 좋을까요? 인공지능 대신 말소리와 소음을 구별시켜주는 기능이 있습니다. 이름 하여 소음감소 알고리즘 입니다. 휴대폰의 신상 제품 출시 주기가 짧아지는 것 처럼 보청기도 IT 산업과 맞물려 하여튼 머든 자꾸 나옵니다. 좋은 의미지요^^



☞ 아무리 보청기 기능이 복잡해 지고 세월이 변한다 하더라도 변함이 없는 것이 있습니다. 사람 말소리 잘 듣게 해 주는 본연의 기능이죠. 쉽게 생각하면 보청기의 역할은 아주 간단하죠. 크게 들을 수 있도록 증폭하는 거죠. 그럼 말소리도 있고 소음도 함께 있는 상황이라면 이 보청기는 무엇을 근거로 증폭을 할까요?

일단 말소리도 소리이고, 소음도 소리이니 일단 다 증폭을 시켜줍니다. 여기서 보청기를 연구하는 기술진들의 생각이 깊어집니다. 소음과 말소리를 구분하는 기준을 무엇으로 할까? 이겠죠. 그래서 파형을 분석하게 됩니다. 말소리와 소음은 각각 파형의 형상이 다릅니다. 제 블로그 여기에서 간단히 언급을 했었죠.


 

☞ 위 그림 커플의 대화를 파형으로 분석해 보았더니, 빨간색 파형으로 나타났다고 가정하겠습니다. 영어로 된 설명에는 말소리(Speech)의 temporal envelope(시간 엔벨로프)이 가변성이 높다(highly variable)라고 되어 있습니다.
쉽게 설명하면, 말소리의 경우 파형의 높낮이 즉, 기복이 심하게 나타납니다. 마치 중환자실에서 심장의 박동수 처럼 말입니다.

* Temporal envelope: 마땅한 한글 용어가 없는 것으로 알고 있는데 누구 아시면 알려주세요. 음향학 측면에서 temporal의 의미는 시간을 의미하고, envlope은 파형을 표현한 것을 의미합니다. 따라서 temporal envelope은 특정 음이 발생한 후 시간 vs 강도(amplitude; 파형의 높낮이)의 변화를 나타낸 것을 말합니다.




☞ 두 커플의 동일한 대화 내용을 장소를 옮겨서 커피숖에서 이루어진다고 가정해 보겠습니다. 첫번째 그림처럼 조용한 곳에서 대화가 이번에는 주변 소음이 있는 커피숖으로 옮겨지고 난 이후에는 빨간색 파형에 하얀색이 겹쳐져 있습니다. 그리고 영어 설명에는 소음(노이즈)의
temporal envelope(시간 엔벨로프)이 상당히 안정적(fairly stable)이라고 되어 있습니다.
쉽게 설명하면, 소음의 경우 파형의 높이가 일정하게 쭉~ 이어집니다. 따라서 말소리가 소음에 묻혀지는 모양이 나타나게 되죠. 이는 실제로는 말소리와 소음이 동시에 들려진다라는 의미입니다.




☞ 기존의 소음감소 알고리즘(오디오스케이프)에서는 이를 개선하기 위해서 순간적인 이득의 변화 알고리즘이 천천히(slow acting) 그리고 다소 지나치게 적극적(aggressive)으로 처리되었습니다. 

오디오스케이프 알고리즘에서는 상대적으로 큰 소리의 소음(broadband, unmodulated noise)인 경우에 보청기가 취했던 액션은 전체적인 이득의 감소(overall gain reduction) 방법을 택하였습니다. 이 때의 포커스는 보청기 사용자의 편안함을 만족시켜 주고자 다소 큰 소리의 소음의 경우, 전체 이득을 줄임으로서 그 소음을 듣지 않도록 하는데 초점이 맞추어져 있었습니다.

그 결과 두 가지 결점이 있었습니다. 첫째는 알고리즘의 처리속도(낮은 시간 상수값), 둘째는 획일하게 진행되어 융통성이 조금 결여된 부분입니다. 결과적으로 소음을 줄이기 위해서 어음의 정보를 얻게 되는 주파수 영역까지도 영향을 미치게 되어 말소리와 소음이 동일하게 감소(다운)되는 문제가 있었습니다. 사실 이 문제는 보청기 증폭과 관련되어 아주 어려운 기술적인 부분입니다.



☞ 다음 세대의 소음관리 알고리즘은 말소리 사이사이에서 소음의 제거하는 기술입니다. 여기에는 시간 상수값이 20ms으로 설정되어(fast acting),  어음은 최대한 보존될 수 있다고 합니다. 시간 상수값이 slow acting 이었을 때는 이득의 감소 부분이 말소리와 소음에 동시에 적용되었지만, fast acting 으로 변경된 알고리즘(Voice iQ를 의미함)에서는 말소리 사이 사이에서 소음이 제거되기 때문에 지금보다는 또 좋은 청취감을 제공한다고 합니다. 암튼 기대해 보겠습니다.



반응형
사업자 정보 표시
웨이브히어링 | 송욱 | 서울시 종로구 율곡로 56 운현하늘빌딩 2층 | 사업자 등록번호 : 101-86-84215 | TEL : 02-736-9966 | Mail : 08rose@hanmail.net | 통신판매신고번호 : 2016-서울종로-0885호 | 사이버몰의 이용약관 바로가기