연구과제 상세정보

https://www.krm.or.kr/krmts/link.html?dbGubun=SD&m201_id=10099342&res=y

음운규칙 프로그래밍을 통한 데이터베이스 응용과 언어연구: 중국 오방언을 중심으로
Database Application and Language Study through Phonological rules’ Programming: Focusing on Chinese Wu-dialect

연구자가 한국연구재단 연구지원시스템에 직접 입력한 정보입니다.

사업명	(B유형) 인문사회학술연구교수
연구과제번호	2020S1A5B5A17090187
선정년도	2020 년
연구기간	1 년 (2020년 09월 01일 ~ 2021년 08월 31일)
연구책임자	엄지
연구수행기관	이화여자대학교
과제진행현황	종료

과제신청시 연구개요

연구목표
1920년대 본격적으로 지역 방언을 수집하고 이를 근거로 언어 전반에 대한 연구를 끊임없이 진행해온 중국과 달리, 국내의 漢語 방언 연구는 근거로 삼는 자료가 몇 개 어휘집으로 한정되어 있을 뿐 아니라 중국에서 이미 진행된 선행연구의 재검토에 머무르는 등 그 연구 ...

1920년대 본격적으로 지역 방언을 수집하고 이를 근거로 언어 전반에 대한 연구를 끊임없이 진행해온 중국과 달리, 국내의 漢語 방언 연구는 근거로 삼는 자료가 몇 개 어휘집으로 한정되어 있을 뿐 아니라 중국에서 이미 진행된 선행연구의 재검토에 머무르는 등 그 연구성과가 상당히 미흡한 실정이다. 이와 같은 상황에서 漢語 방언의 음운규칙을 정립하고 이를 프로그래밍할 수 있다면, 자료 부족이라는 일차적 원인을 해결하고 기존의 코퍼스를 충분히 활용하여 더욱 발전적인 논의가 가능할 것으로 생각된다.
이에 본 연구는 먼저 대방언 중 가장 사용 인구가 많을 뿐 아니라 다량의 코퍼스를 얻을 수 있는 오방언을 기점으로 삼아, 추가적인 음성자료 수집과 함께 국내외 선행연구를 종합 분석하여, 오방언의 주요 음운규칙과 이를 적용할 수 있는 알고리즘을 정립하는 것을 일차 목적으로 삼는다. 그리고 이를 코딩하여 지금까지 제한적이었던 漢語 방언 자료를 다양한 방식으로 활용할 수 있도록 컴퓨터 프로그래밍 작업까지 진행하고자 한다. 이러한 음운규칙의 프로그래밍을 통해 무궁무진한 데이터베이스 활용을 가능하게 함으로써, 국내 漢語 연구에서 상대적으로 미흡했던 방언과 민족어에 관한 발전적인 논의와 함께 언어학 전반으로의 응용 연구가 가능할 것이라 기대해 볼 수 있다. 나아가 漢語 음운연구는 성운학의 토대 위에 문헌 분석과 이론적 해석이 주를 이루는 순수 어학 분야이나, 음운규칙 프로그래밍이라는 소프트웨어 학문과의 융합을 통해 21세기 언어학에 새로운 패러다임을 제시할 수도 있을 것이다.

기대효과
본 연구는 크게 자료 수집 및 분석을 통한 음운규칙과 알고리즘 정립, 데이터 프로그래밍 그리고 분석과 응용의 세 단계로 진행될 것이다. 먼저 연구 제1, 2분기, 중국 오방언 화자의 실제 음성자료와 이를 토대로 분석한 구 단위 이상의 음운규칙 정리 자료를 얻을 수 ...

본 연구는 크게 자료 수집 및 분석을 통한 음운규칙과 알고리즘 정립, 데이터 프로그래밍 그리고 분석과 응용의 세 단계로 진행될 것이다. 먼저 연구 제1, 2분기, 중국 오방언 화자의 실제 음성자료와 이를 토대로 분석한 구 단위 이상의 음운규칙 정리 자료를 얻을 수 있음에 따라, 구체적인 중간결과물 산출이 가능하다. 또한, 연구 제3, 4분기, 음운규칙 알고리즘을 기반으로 기존의 코퍼스를 모두 대입하여 무한한 자료 생성이 가능한 방언 산출 프로그램 개발을 시도함으로써 지금까지 일차연구 자료의 부족으로 상당히 제한적일 수밖에 없던 국내의 漢語 방언 연구 발전에 크게 이바지할 수 있을 것이다. 무엇보다 문헌 분석과 이론적 해석을 넘어, 실제 언어자료를 컴퓨터 언어로 전환하는 과정을 통해 언어학 연구 전반에 새로운 패러다임을 제시하고 21세기 인문학의 발전 방향을 모색하는데 중요한 시사점을 마련할 수 있을 것이다.
이밖에, 후속연구를 위한 일차자료 제공을 넘어, 본 연구 결과를 기초로 온라인 漢語 방언사전 구축과 다양한 APP 콘텐츠 개발을 기대해 볼 수 있다. 간단한 예를 들자면, 북부 오방언의 경우 2음절 이상의 구 단위에서 본래 성조와는 상관없이 두음의 두 번째 모라 성조가 그대로 끝음절까지 이어지는 독특한 변조 현상을 보이는데 이러한 음조 규칙을 코딩하여 기존 코퍼스에 적용할 수 있다면 현지에서 모든 문장의 음조를 수집할 필요 없이, 이미 충분히 가지고 있는 단음절 코퍼스 자료를 활용하여 무한한 문장의 음조 생성이 가능하다. 이처럼 주요 음운규칙을 시작으로 세부규칙, 예외규칙까지 계속 추가 보완하여 컴퓨터 언어로 전환하게 된다면, 일회성 연구에서 끝나는 것이 아니라 이를 기반으로 다양한 콘텐츠 개발로의 확장이 가능하다고 할 수 있다. 나아가 이러한 프로그래밍은 漢語 방언과 민족어를 포함하여, 사멸위기에 처한 세계의 많은 언어를 보존하는데 효과적인 방법으로 역할 할 수도 있다. 언어의 사멸은 곧 그 언어를 사용하는 민족의 정체성과 문화의 사멸로 이어지는 중대한 문제로 21세기 언어학자들이 경각심을 가지고 이를 지키기 위해 다양한 노력을 하고 있다. 이와 같은 상황에서 무한한 코퍼스 활용을 가능케 하는 본 연구의 시도는 가히 의미가 있는 일이라 할 수 있다.
지금까지 음운연구는 순수 언어학 분야로서, 연구성과의 실제 활용 측면에 있어 상당히 제한적인 모습을 보여주었다. 이제는 음운 체계를 정리하고, 일부 코퍼스로부터 몇 개의 음운규칙을 도출해내는 일회성 연구로 끝낼 것이 아니라, 활발한 후속연구와 다양한 분야에서의 활용이 가능하도록 학문적 융합을 통한 새로운 시도가 필요한 때라고 생각한다. 본 연구는 일차자료 분석을 근간으로 하는 전통적 연구방식에 이론 해석이라는 현대적 연구방식을 더하고 나아가 이를 기반으로 응용학문과의 융합을 실천하여, 언어 연구의 새로운 패러다임을 제시하는 의미 있는 연구가 될 것이라 감히 자신할 수 있다. 그리고 이러한 시도는 언어학을 포함한 21세기 인문학 전 분야의 발전을 위한 중요한 시사점을 마련할 수 있을 것이다.

연구요약
본 연구는 크게 다음의 세 단계로 나누어 볼 수 있다.
1) 자료 수집 및 분석을 통한 음운규칙과 알고리즘 정립.
2) 데이터 프로그래밍.
3) 분석과 응용.
가장 먼저 연구 제1분기(2020년 9월~12월)에는 중국 코퍼스 자료를 일정 기준에 따라 정리하고 음성자료 ...

본 연구는 크게 다음의 세 단계로 나누어 볼 수 있다.
1) 자료 수집 및 분석을 통한 음운규칙과 알고리즘 정립.
2) 데이터 프로그래밍.
3) 분석과 응용.
가장 먼저 연구 제1분기(2020년 9월~12월)에는 중국 코퍼스 자료를 일정 기준에 따라 정리하고 음성자료 수집과 중국을 포함한 국외 선행연구를 분석하여 대방언 중 사용 인구수가 가장 많은 오방언의 주요 음운규칙과 이를 적용 시킬 수 있는 알고리즘을 정립하고자 한다. 또한, 이 과정에서 최적성 이론과 같이 음운규칙 알고리즘의 토대가 될 수 있는 언어이론을 적용하여 분석함으로써 연구의 객관성을 높이고자 한다.
그리고 연구 제2분기(2020년 12월~3월) 오방언 전체를 아우를 수 있는 상위 알고리즘을 우선 정립 후, 지역별 방언과 세부음운규칙의 하위 알고리즘을 계속 추가 보완해 나감으로써 다량의 알고리즘을 정리 및 구체화하는 작업을 진행할 것이다.
연구 제3분기(2020년 3월~6월) 본격적으로 앞선 작업에서 얻은 알고리즘을 엠블럭, 엔트리 등의 교육용 컴퓨터 언어 혹은 파이썬, C언어를 활용하여 프로그래밍 할 것이다. 동시에 산출 값이 실제 음성자료와 얼마나 일치하는지 확인하는 작업을 통해 프로그래밍 검사를 계속해서 진행할 예정이다.
연구 제4분기(6월~9월)에는 기존의 오방언 코퍼스를 대입하여 구 단위 이상의 무한한 데이터베이스를 산출할 수 있는 방언 산출 프로그램을 구체화할 것이며, 나아가 지역별 음운규칙과 알고리즘을 추가해 나감으로써 다른 방언과 민족어까지 확대 적용할 수 있도록 할 것이다. 또한, 예외적 언어 현상을 해결할 수 있는 방안에 대해서도 함께 고민해 볼 것이다.
본 연구는 21세기형 소프트웨어 응용 연구방법을 전통적 언어연구에 적용하여 실제 언어와 컴퓨터 언어 간의 융합을 시도한다는 점에서 중요한 의미가 있다. 또한, 음운규칙을 근거로 방언 산출 프로그램을 구축함으로써 대방언에서 차방언으로, 차방언에서 각 지역 방언 및 민족어로 무한한 응용이 가능할 것이다. 특히, 지금까지 한정된 자료로 인해 미흡할 수밖에 없었던 구 단위 이상에서의 음변 현상과 성조 변화 현상에 대해 발전적인 논의가 가능할 것으로 보인다. 일회성에 그치는 연구가 아니라, 후속 연구의 기본 토대가 될 수 있는 음운규칙의 정립과 알고리즘 구상을 통해, 다양한 방언과 민족어에 대한 심도 있는 논의를 이어나갈 것이다. 본 연구는 단독 연구일 뿐 아니라 기초 정립에 중점을 두고 있어 1년이라는 기간 동안 국내외에서 활용 가능한 온라인 漢語 방언사전이나 관련 APP 개발까지 진행하는 것은 사실상 어려울 것으로 보인다. 그러나 본 연구를 시작으로, 일부 음운연구에 국한되는 것이 아니라 온라인 사전과 APP 등의 오픈 소스 개발을 포함하여 다양한 방면에서 漢語 방언이 활용될 수 있도록 계속해서 발전된 논의를 진행하고자 하며 이를 통해 언어학 연구 전반에 새로운 패러다임을 제시할 수 있도록 할 것이다.

결과보고시 연구요약문

국문
본 연구의 가장 주요한 목적은 중국 방언 데이터베이스를 보완하고, 효율적인 활용방안을 모색함으로써, 일차 자료의 부족으로 인해 국내 漢語 연구에서 상대적으로 미흡했던 방언과 민족어에 관한 발전적인 논의를 가능하게 하는 데 있다. 이를 위해, 비전공자도 쉽게 이해 ...

본 연구의 가장 주요한 목적은 중국 방언 데이터베이스를 보완하고, 효율적인 활용방안을 모색함으로써, 일차 자료의 부족으로 인해 국내 漢語 연구에서 상대적으로 미흡했던 방언과 민족어에 관한 발전적인 논의를 가능하게 하는 데 있다. 이를 위해, 비전공자도 쉽게 이해하고 응용할 수 있는 프로그래밍 설계 및 활용 방안에 대해 구체적으로 제시하였으며, 중국 오방언의 연독변조 현상을 중심으로 기구축된 데이터베이스와의 연계 및 응용 방안에 대해서도 함께 고찰하였다. 디지털 인문학 시대를 맞이하여, 본 연구가 앞으로의 언어연구를 위한 의미 있는 시도이자 중요한 계기로서 역할할 수 있길 기대하는 바이다.

영문
The main purpose of this study is to supplement the Chinese dialect database and seek effective utilization measures which enable developmental discussions on dialect and ethnic language that are relatively insufficient in domestic Chinese research du ...

The main purpose of this study is to supplement the Chinese dialect database and seek effective utilization measures which enable developmental discussions on dialect and ethnic language that are relatively insufficient in domestic Chinese research due to the lack of primary data. To this end, a programming design and application plan that could be easily understood and applied by non-majors were specifically presented, and a connection and application plan with a database built based on the tone sandhi phenomenon in Wu dialect, the major dialect groups of Chinese, was also considered. In the era of digital humanities, we hope that this study will serve as a meaningful attempt and an important opportunity for future language research.

연구결과보고서

초록
본 연구의 가장 주요한 목적은 중국 방언 데이터베이스를 보완하고, 효율적인 활용방안을 모색함으로써, 일차 자료의 부족으로 인해 국내 漢語 연구에서 상대적으로 미흡했던 방언과 민족어에 관한 발전적인 논의를 가능하게 하는 데 있다. 이를 위해, 본 연구는 다른 프로 ...

본 연구의 가장 주요한 목적은 중국 방언 데이터베이스를 보완하고, 효율적인 활용방안을 모색함으로써, 일차 자료의 부족으로 인해 국내 漢語 연구에서 상대적으로 미흡했던 방언과 민족어에 관한 발전적인 논의를 가능하게 하는 데 있다. 이를 위해, 본 연구는 다른 프로그래밍 언어보다 문법이 단순하여 비전공자도 쉽게 배워 활용할 수 있을 뿐 아니라, 윈도우, 맥, 리눅스 등 대부분의 운영체제에서 사용 가능하고 간단한 애플리케이션부터 웹 서버, 인공지능, 딥러닝 프로그램 등에 모두 적용 가능한 파이썬(Phython)으로 웹 크롤러(웹 자동 탐색프로그램) 코딩을 우선적으로 진행하였다. 본 연구는 컴퓨터 프로그래밍과 전혀 상관없는 인문학의 영역에서 비전공자가 간단한 조작만으로 본인 연구 영역에 활용할 수 있는 방안을 제시하는 것을 목표로 삼기에, 누구든지 손쉽게 따라할 수 있으며, 어떤 데이터베이스 웹사이트에서도 실제 적용 가능한 웹 크롤러 코딩 방법을 제공하고자 하였다. 그 결과 selenium, openpyxl, xlwt, BeautifulSoup 등의 모듈을 사용해 특정 웹사이트에 공개된 자료들을 자동으로 검색, 추출, 저장하는 웹 크롤러 코딩을 구상해 내었다..
다음으로, 漢語 방언 중 관화방언 다음으로 월(粤)방언과 함께 가장 많은 인구가 사용한다고 알려진 오(吳)방언 중 상해방언과 소주방언을 중심으로 주요 음운 규칙을 분석 및 정리하였다. 그리고 그중, 지역 간 차이는 존재하나, 대게 첫째 음절이 뒤이어 나오는 음절들의 성조를 결정짓는 주요 요소가 되며 개별 성조와 상관없이 정해진 유형에 따라 다음절 성조 산출형이 결정되는 연독 변조 현상에 집중하여 기구축된 데이터베이스와의 연계 및 응용 방안에 대해 고찰하였다.
본 연구를 통해, 디지털 인문학, 인문학과 소프트웨어의 융합이라는 것은 결코 추상적이고 난해한 개념이 아니며, 프로그래밍 전문가가 아니더라도 프로그래밍 언어 설계와 응용을 통해 기존 연구의 미비점을 보완하고 보다 발전적인 논의를 진행할 수 있을 뿐 아니라 이 자체로 중요한 의미를 가질 수 있음을 확인할 수 있었다. 본 연구는 일차자료 분석을 근간으로 하는 전통적 연구방식에 이론 해석이라는 현대적 연구방식을 더하고 나아가 이를 기반으로 응용학문과의 융합을 실천하여, 언어 연구의 새로운 패러다임을 제시하는 의미 있는 시도라 할 수 있다. 이러한 시도가 언어학을 포함한 21세기 인문학 전 분야의 발전을 위해 중요한 시사점을 마련하는 계기로 역할 할 수 있길 기대한다.

연구결과 및 활용방안
그동안 국내 漢語 방언 연구에 있어 가장 큰 어려움은 일차자료 확보에 있었다. 공신력 있는 양질의 공개데이터가 있음에도 불구하고, 그것의 효율적 활용방안에 대한 논의가 진행되지 않아, 선행연구의 일부 자료 혹은 특정한 몇 개의 방언 조사 자료에 한정되어 진일보한 ...

그동안 국내 漢語 방언 연구에 있어 가장 큰 어려움은 일차자료 확보에 있었다. 공신력 있는 양질의 공개데이터가 있음에도 불구하고, 그것의 효율적 활용방안에 대한 논의가 진행되지 않아, 선행연구의 일부 자료 혹은 특정한 몇 개의 방언 조사 자료에 한정되어 진일보한 연구성과를 얻지 못하였고, 답보상태에 머물러 있던 것이 사실이다. 본 연구는 이 문제를 해결하기 위해 가장 먼저 데이터베이스의 효율적 활용방안을 모색하였다. 그에 대한 결과로, 웹 크롤러 프로그래밍을 통해 기존의 소모적인 수집 과정을 줄이고 다량의 데이터를 단시간 내 효율적으로 검색, 추출, 저장할 수 있는 방안을 제시하였고, 누구나 손쉽게 활용할 수 있는 기본적인 틀을 제시함으로써 널리 응용할 수 있도록 하였다. 이를 활용한다면, 한어 방언 연구뿐 아니라 양적 데이터 분석을 필요로 하는 여러 언어학 연구 방면에 충분한 데이터 확보가 가능하다. 뿐만 아니라 기존 데이터베이스의 현황 및 활용 실태에 대한 구체적인 분석을 바탕으로 기존 데이터베이스의 미비점을 보완하고 더 발전된 형태의 프로그래밍 작업을 도모하는 토대로써 활용될 수 있다 이밖에, 후속 연구를 위한 일차자료 제공을 넘어, 본 연구 결과를 기초로 한국어 검색과 적용이 가능한 온라인 방언 데이터베이스 구축 및 기타 다양한 콘텐츠 개발을 기대해 볼 수 있다. 오방언의 연독 변조 현상처럼 방언의 특정 음운 규칙과 음운 체계는 결국 컴퓨터 언어 규칙들의 집합인 코딩을 통해 충분히 프로그램화할 수 있다. 특정한 주요 음운 규칙을 시작으로, 세부 규칙, 지역 방언별 예외 규칙까지 계속 추가 보완하여 컴퓨터 언어로 전환하게 된다면, 일회성 연구에서 끝나는 것이 아니라 무한한 데이터를 기반으로 언어 계통, 접촉, 변화 등 언어연구 영역의 확장뿐 아니라 앞서 말한 다양한 콘텐츠 개발까지 기대해볼 수 있다.
지금까지 음운연구는 순수 언어학 분야로서, 연구성과의 실제 활용 측면에 있어 상당히 제한적인 모습을 보여주었다. 이제는 특정 문헌만을 근거로 삼거나, 음운 체계를 정리하고, 일부 코퍼스로부터 몇 개의 음운 규칙을 도출해내는 일회성 연구로 끝낼 것이 아니라, 활발한 후속 연구와 다양한 분야에서의 활용이 가능하도록 학문적 융합을 통한 새로운 시도가 필요한 때라고 생각한다. 본 연구를 통해, 디지털 인문학, 인문학과 소프트웨어의 융합이라는 것은 결코 추상적이고 난해한 개념이 아니며, 딥러닝, 인공지능 개발이라는 심화적이고 전문적인 영역만을 의미하는 것도 아님을 알 수 있었다. 무엇보다 프로그래밍 전문가가 아니더라도 프로그래밍 언어 설계와 응용을 통해 기존 연구의 미비점을 보완하고 보다 발전적인 논의를 진행할 수 있으며, 이 자체로 중요한 의미를 가질 수 있다는 것을 확인할 수 있었다. 본 연구는 일차자료 분석을 근간으로 하는 전통적 연구방식에 이론 해석이라는 현대적 연구방식을 더하고 나아가 이를 기반으로 응용학문과의 융합을 실천하여, 언어 연구의 새로운 패러다임을 제시하는 데 의미 있는 연구가 될 수 있을 것이다. 그리고 이러한 시도가 언어학을 포함한 21세기 인문학 전 분야의 발전을 위한 중요한 시사점을 마련하는 계기로 역할 할 수 있길 기대한다.

색인어
한어(漢語), 오방언(吳方言), 음운규칙, 프로그래밍, 코딩, 데이터베이스 활용

이 연구과제의 신청시 심사신청분야(최대 3순위까지 신청 가능)
1순위 : 인문학 > 중국어와문학 > 중국어학 > 음성/음운론(중국어학)

연구성과물 목록