
링크1: http://klpl.re.pusan.ac.kr/
이 연구는 인터넷을 중심으로 일어나는 정보 과부하를 극복하기 위한 지능적 우리말 문장분석 기술을 개발한다.
지난 25년 간의 연구결과에 따라 우리말 형태소분석 기술은 크게 발전했다. 이에 따라 형태소분석과 관련한 응용기술은 국내 대부분의 기업과 연구진이 거의 같은 수준의 기술적 성과를 보인다. 또 언어구조가 비슷하여 형태소 분석과 부분문장분석으로도 상당한 수준의 기계번역이 가능한 한·일 및 일·한 기계번역 시스템은 상용화에 성공한 것으로 평가한다.
하지만, 문장분석 기술을 활용한 응용시스템은 다년간의 노력에도 아직 만족할 만한 수준에 도달하지 못했다. 따라서, 언어구조가 달라 문장분석이 필요한 한·영(40% 이하)과 영·한(60% 내외) 기계번역이 아직 만족할 만한 수준에 다다르지 못했다. 영·한 기계번역에 비해 한·영 기계번역의 수준이 크게 떨어지는 이유는 영어에 비해 우리말 문장분석 기술이 크게 떨어지는데 따른 원인이 크다.
그런데 지식(정보) 유통의 효율성이 경제적 가치 창출의 기반이 되고, 국가 경쟁력의 척도가 되며, 정보 이용이 보편적 생활의 일부가 되는 인터넷 중심의 사회에서 지능적인 언어-중심 정보처리 환경의 구축은 매우 중요하다. 특히 인터넷을 기반으로 이루어지는 정보 과부하 현상을 극복하려면 정보검색을 넘어 정보의 추출(extraction), 분류(classification), 여과(filtering), 요약(abstraction)과 통합(integration)을 지능적으로 할 수 있는 실용적 수준의 언어처리기술을 개발해야 한다.
이런 요구를 만족하려면 기존언어처리 기술이 ①지능성(intelligence), ②정확도(accuracy), ③처리범위(coverage), ④안정성(robustness)과 ⑤모듈화(modularity)에서 근본적인 변화가 있어야 한다. 이 연구는 언어지식 표현모형, 언어지식 저장구조, 언어분석 알고리즘과 언어 처리 모형에 대한 새로운 접근을 통해, 인터넷을 기반으로 하는 대용량의 오류가 많으면서 다양하고 지속적으로 정보가 변해 가는 정보 환경에 적용할 수 있는 문장분석에 기반한 한국어 중심 언어처리 환경을 개발한다.

