그동안 국내 漢語 방언 연구에 있어 가장 큰 어려움은 일차자료 확보에 있었다. 공신력 있는 양질의 공개데이터가 있음에도 불구하고, 그것의 효율적 활용방안에 대한 논의가 진행되지 않아, 선행연구의 일부 자료 혹은 특정한 몇 개의 방언 조사 자료에 한정되어 진일보한 ...
그동안 국내 漢語 방언 연구에 있어 가장 큰 어려움은 일차자료 확보에 있었다. 공신력 있는 양질의 공개데이터가 있음에도 불구하고, 그것의 효율적 활용방안에 대한 논의가 진행되지 않아, 선행연구의 일부 자료 혹은 특정한 몇 개의 방언 조사 자료에 한정되어 진일보한 연구성과를 얻지 못하였고, 답보상태에 머물러 있던 것이 사실이다. 본 연구는 이 문제를 해결하기 위해 가장 먼저 데이터베이스의 효율적 활용방안을 모색하였다. 그에 대한 결과로, 웹 크롤러 프로그래밍을 통해 기존의 소모적인 수집 과정을 줄이고 다량의 데이터를 단시간 내 효율적으로 검색, 추출, 저장할 수 있는 방안을 제시하였고, 누구나 손쉽게 활용할 수 있는 기본적인 틀을 제시함으로써 널리 응용할 수 있도록 하였다. 이를 활용한다면, 한어 방언 연구뿐 아니라 양적 데이터 분석을 필요로 하는 여러 언어학 연구 방면에 충분한 데이터 확보가 가능하다. 뿐만 아니라 기존 데이터베이스의 현황 및 활용 실태에 대한 구체적인 분석을 바탕으로 기존 데이터베이스의 미비점을 보완하고 더 발전된 형태의 프로그래밍 작업을 도모하는 토대로써 활용될 수 있다 이밖에, 후속 연구를 위한 일차자료 제공을 넘어, 본 연구 결과를 기초로 한국어 검색과 적용이 가능한 온라인 방언 데이터베이스 구축 및 기타 다양한 콘텐츠 개발을 기대해 볼 수 있다. 오방언의 연독 변조 현상처럼 방언의 특정 음운 규칙과 음운 체계는 결국 컴퓨터 언어 규칙들의 집합인 코딩을 통해 충분히 프로그램화할 수 있다. 특정한 주요 음운 규칙을 시작으로, 세부 규칙, 지역 방언별 예외 규칙까지 계속 추가 보완하여 컴퓨터 언어로 전환하게 된다면, 일회성 연구에서 끝나는 것이 아니라 무한한 데이터를 기반으로 언어 계통, 접촉, 변화 등 언어연구 영역의 확장뿐 아니라 앞서 말한 다양한 콘텐츠 개발까지 기대해볼 수 있다.
지금까지 음운연구는 순수 언어학 분야로서, 연구성과의 실제 활용 측면에 있어 상당히 제한적인 모습을 보여주었다. 이제는 특정 문헌만을 근거로 삼거나, 음운 체계를 정리하고, 일부 코퍼스로부터 몇 개의 음운 규칙을 도출해내는 일회성 연구로 끝낼 것이 아니라, 활발한 후속 연구와 다양한 분야에서의 활용이 가능하도록 학문적 융합을 통한 새로운 시도가 필요한 때라고 생각한다. 본 연구를 통해, 디지털 인문학, 인문학과 소프트웨어의 융합이라는 것은 결코 추상적이고 난해한 개념이 아니며, 딥러닝, 인공지능 개발이라는 심화적이고 전문적인 영역만을 의미하는 것도 아님을 알 수 있었다. 무엇보다 프로그래밍 전문가가 아니더라도 프로그래밍 언어 설계와 응용을 통해 기존 연구의 미비점을 보완하고 보다 발전적인 논의를 진행할 수 있으며, 이 자체로 중요한 의미를 가질 수 있다는 것을 확인할 수 있었다. 본 연구는 일차자료 분석을 근간으로 하는 전통적 연구방식에 이론 해석이라는 현대적 연구방식을 더하고 나아가 이를 기반으로 응용학문과의 융합을 실천하여, 언어 연구의 새로운 패러다임을 제시하는 데 의미 있는 연구가 될 수 있을 것이다. 그리고 이러한 시도가 언어학을 포함한 21세기 인문학 전 분야의 발전을 위한 중요한 시사점을 마련하는 계기로 역할 할 수 있길 기대한다.