학술대회         정기대회

한글로, 동시통역기 만들기 프로젝트?_1

작성자 : 관리자
조회수 : 775
한글로, 동시통역기 만들기 프로젝트?_1




실시간 동시통역의 현 방식은 통역자에 의한 통역 방식이다. 예를들어, 미국 사람이 영어로 한국 사람에게 말을 하면, 통역자가 그 말을 한국어로 바꾸어 전달해 주는 방식이다. 미국사람을 A, 통역자를 B, 한국사람을 C라고 해보자.

A의 음성언어는 영어다. B의 음성언어는 영어와 한국어다. C의 음성언어는 한국어다. 음성언어는 말이다. 영어도 말이고 한국어도 말이다. 말은 의미를 나타내는 소리다. 소리는 청각의 범주다. 즉 귀가 공기를 통한 음파(말소리)의 자극을 받는 것이다.

'꽃'이라는 사물을 A는 'flow er'라고 표현하고, C는 '꽃'이라고 표현한다. 똑같은 사물을 표현하는 방식이 소리도 다르고, 그 소리를 나타내는 기호도 다르다. B는 A로부터 flower라는 소리를 듣고 C에게 꽃이라는 소리로 전달해 준다. 즉 B는 flower라는 소리나 꽃이라는 소리가 같은 사물을 나타내는 소리라는 것을 전달해 주는 것이다.

기계가 이 역할을 한다면, 그것이 바로 동시통역기가 된다.

그렇다면 B는 'flower'라는 청각기호(말소리)와 '꽃'이라는 청각기호가 같은 대상을 나타낸다는 사실을 어떻게 아는 것일까? 그것은 각각의 청각기호에 대한 B의 익숙한 경험 때문이다. 이 익숙한 경험을 기계가 해결해줘야 기계적 동시 통역이 가능하다.

네이버 검색 창에 'flower'라고 글자를 치면 '꽃'이라는 글자가 나오고, 옆에 스피커만 누르면 flower의 소리도 들을 수 있다. 마찬가지로 '꽃'이라고 글자를 쳐도 백과사전 항목 밑에
flower, bloom, blossom과 같은 글자가 나타나고, 그 글자들을 다시 한 번 클릭하면 영어사전으로 옮겨지면서 또한 스피커가 나타난다. 이것은 간단한 단어이기 때문에 가능하다.

그런데 구글 번역은 매우 놀랍다. 아주 긴 글도 몇 초 안에 번역되어 나타난다. 물론 무슨 말이 무슨 말인지 알 수 없을 정도로 아직은 서툴다. 어순의 문제부터 여러 해결하지 못한 문법적인 사항들 때문인 것 같다. 그러나 가능성은 상당히 높다고 생각한다.

암튼 여기서 네이버 검색 창이나 구글 번역을 B'라고 간주해 보자. 말로 하든 글자로 하든 어찌 되었든, B'는 A의 생각을 C에게 되도록 정확하게 전달해 줄 수 있으면, 일단은 된다. 통역자 B와 검색창 B'의 차이가 무엇일까? B'가 B가 될 수는 없을까?

B'가 매우 진화된 B'가 있다고 가정해 보자. 예를 들어, 작은 스피커에 한국 말로 주절주절 했더니, 그 소리를 곧바로 한글 기호로 나타낸다거나, 반대로 작은 모니터에 손가락으로 뭐라고뭐라고 썼더니, 쓰자마자 그 글자들이 말소리로 나타나는, 그런 장치 B'가 있다고 가정해 보자.

근데 가능하긴 할까?... 가능할 것 같기도 하고, 불가능 할 것 같기도 하고, 사실 좀 거시기 하다. 하지만 사람의 발음기관하고 거의 똑같은 형체물을 만들 수 있다면, 혹 가능하지 않을까? 그리고 또 하나의 방법으로 음성의 파장이나 진동수를 이용해 보는 것은 어떨까?... 참 난해한 문제다.

그러나 B'의 출현은 가능하다고 생각한다. 그 답은 한글에 있다.

파장이나 진동수를 이용하면 답이 잘 안나온다. 말을 직접 듣고 익숙해지는 상황이라면 당연힌 청각의 범주 안에서 자극을 받는 것이 생체 신경학적으로 가장 현명한 방식이다. 그러나 그러기가 곤란하기 때문에 기계적 도움이라도 받아보려고 하는 것이 아니겠는가? 그런데 기계는 인간의 소리를 정확하게 듣는데 다소의 한계가 있는 것 같다. 그래서 청각적(소리적) 접근이 아니라, 시각적으로 접근해 보는 것이 어떨까 하고 생각해 본다. 인공적인 발음기관의 형체물을 만든다는 것은 그냥 우스개 소리로 한 번 해 본 말이다.

답은 의외로 간단할 수 있다. 말을 할 때 발음기관의 움직이는 모양을 그대로 팍 찍어서 모니터에 나태내면 된다. 그러면 말소리(음성언어)가 그대로 시각기호(문자언어)가 된다. 영어로 말을 하든 한국어로 말을 하든, 일단 팍 찍어서 모니터에 나타내면, 그것이 그대로 문자 시각기호가 될 수도 있다는 것이다.

예를 들어, A가 B'에 'flower'라고 말을 하면, B'는 그 소리를 /ㅍ, ㅡ, ㄹ, ㅏ, ㅇ, ㅜ, ㅓ, + r /와 같은 기호로 나타내고, 마찬가지로 C가 B'에 '꽃'이라고 말을 하면 B'는 /ㄲ, ㅗ, ㅊ/과 같은 문자 기호로 나타낼 수 있다는 것이다.

일단 적어도 여기까지 가능하다고 할 수 있다면, 다시말해 모든 음성언어를 자동으로 문자기호(한글)로 전환할 수만 있다면, 실시간 트위터에 그 문자를 자동으로 올리는 일은 그리 어려운 일은 아닌 것 같다.

B'가 완벽한 B가 될 수는 없지만, 그래도 고민해 본다.




(한글 동시통역기와 실시간 트위터의 만남으로, 혹 가능하지 않을까?)

 댓글
로그인 후 작성 가능합니다.
목록