연구성과물검색
유형별/분류별 연구성과물 검색
HOME ICON HOME > 연구과제 검색 > 연구과제 상세정보

연구과제 상세정보

말뭉치에 기반한 국어 대용어 연구 - 대명사, 재귀사 , 영형태를 중심으로-
  • 연구자가 한국연구재단 연구지원시스템에 직접 입력한 정보입니다.
사업명 인문저술지원사업 [지원년도 신청 요강 보기 지원년도 신청요강 한글파일 지원년도 신청요강 PDF파일 ]
연구과제번호 2009-812-A00216
선정년도 2009 년
연구기간 3 년 (2009년 12월 01일 ~ 2012년 11월 30일)
연구책임자 이선희
연구수행기관 연세대학교
과제진행현황 종료
과제신청시 연구개요
  • 연구목표
  • 이 연구는 말뭉치 자료를 바탕으로 국어 대용어 범주의 분포와 기능을 파악하고, 그 형태 통어적 특성과 의미 특성들을 밝히는 것을 연구 목적으로 한다. 그리고 나아가 대용어 의미 해석에 관여하는 언어학적 제약과 자질들을 추출, 분류, 일반화함으로써 국어 대용어 주석의 기본틀을 마련하고 대용어 주석 말뭉치 구축을 위한 토대를 제공하고자 한다. 국어 대용어는 이제까지 형태·통사·의미론 그리고 화용론에 걸친 언어학 분야에서 꾸준한 연구 대상이 되어 왔음에도 불구하고 이들이 현대 국어의 입말과 글말에서 어떻게 분포하고 기능하고, 어떠한 제약을 보이는가에 대한 면밀한 접근은 아직까지 부족한 실정이다. 실제로 80년대 이후 대용어에 대한 연구들은 인구어의 대용어 특성들에 맞추어 국어 대용어를 다루려는 생성 문법 접근이 주를 이루었다. 한편 이와 대조적으로 대용어 형태의 통시적 발달 양상에 초점을 두고 국어 대용어의 고유한 특성을 파악하고자하는 시도도 있어왔다. 그러나, 통시적 변화 양상만으로는 현대 국어에서 점점 그 기능 부담량이 커지며 복잡한 통사의미 제약들을 보이는 대용어의 기능을 제대로 파악하기 힘들다. 이 연구는 다양한 대용어 범주 중 학계에서 가장 많은 관심의 대상이 되어온 대명사, 재귀사, 영형태의 명사 범주 대용어를 연구 대상으로 한다. 현대 국어의 구어와 문어 말뭉치 자료를 활용하여 대용어의 분포와 문법적 기능에 관여하는 언어학적 제약들이 밝히고 이들이 어떠한 유사점과 차이점을 갖는지를 논의할 것이다. 대용어 연구는 이론 언어학 분야를 벗어나 응용 분야인 한국어 교육, 언어 획득, 번역 연구 등에서도 중요한 위치를 차지한다. 또한 담화 시스템 구축, 기계 번역, 자동 정보 추출을 다루는 전산언어학 분야에서 대용어 시스템 개발의 기본 자료로 활용이 가능하다. 이 연구에서는 대용어 연구의 이러한 학제적 연계성에 중점을 두고 국어 대용어의 언어 특성들을 분류하고 범주화하여 주석의 틀을 제공함으로써 대용어 주석 말뭉치 구축의 기반을 마련하고자 한다.
  • 기대효과
  • 이 연구의 기대 효과는 몇 가지 측면으로 나누어 다음과 같이 제시할 수 있다.

    [1] 언어학적 측면의 기대 효과
    국어의 대용어는 언어학적 측면에서 문장의 의미와 담화 분석 과정에 매우 중요한 기능을 한다. 이 연구에서는 말뭉치 자료를 바탕으로 각 유형 별 대용어의 분포와 기능을 비교 분석하고 나아가 전체 범주로서 이들의 언어적 특성을 일반화하고자 한다. 이러한 작업은 형태 및 통사의미, 담화화용등 다양한 층위의 언어 자질들에 대한 고찰을 전제로 한다. 한영 병렬 말뭉치 자료를 통한 대용어의 분석은 국어 대용어 범주가 지닌 고유한 특성과 더불어 영어와 같은 인구어의 대용어 범주와의 비교언어학적 연구를 가능케 할 것이다. 또한 문어와 구어에서 대용어 사용 양상에 대한 차이를 규명한다는 것도 언어학적 측면의 기대 효과에 해당한다. 말뭉치 자료를 활용한 접근은 언어학자 개인의 직관에 근거한 제한된 예문들에서 벗어나 생생한 언어 사용 현장에서 실제 어휘 범주의 사용 양상을 파악할 수 있다는 점에서도 연구 가치가 높다 하겠다.

    [2] 전산언어학과 말뭉치 언어학 측면의 기대 효과
    전산언어학적 차원에서 대용어의 의미 정보는 기계 번역, 정보 검색, 질의응답 시스템 개발 등의 자연어의 고차원적 처리 과정에서 빠져서는 안 되는 필수적 정보이다. 이 연구는 대용어 처리와 관련된 말뭉치 주석의 체계와 관련 언어 정보의 기술 문제 등에 관심을 두고 있다. 대용어 처리 시스템은 기계 번역 시스템, 정보 검색, 자동 문서 요약 등에 직접적으로 활용이 가능한 부문이다. 나아가 대용어의 정확한 분석은 인간의 언어를 중심으로 한 질의-응답 시스템이나 대화 시스템의 질적 향상 등 원활한 인간 대 컴퓨터 상호 작용을 도모할 것이다.

    [3] 한국어 교육과 관련한 기대 효과
    대용어에 대한 연구 성과는 한국어 교육에 직접 활용이 가능하다. 영어와 같은 인구어의 대용어에 익숙한 학습자들은 한국어 작문에서 흔히 대명사를 과도하게 사용하는 경향이 있다. 혹은 반복되는 문장의 명사항의 생략이 자유롭다는 점에 착안해 영대용어를 지나치게 사용함으로써 문장의 의미를 정확히 전달하지 못하는 경우도 많다. 대용어의 분포와 기능에 대한 상세한 연구 결과는 자연스러운 국어 문장 구성을 위한 대용어의 사용 환경을 밝힘으로써 한국어 교육의 효율성을 높이는 데 기여한다. 또한 이 연구 결과는 제2외국어 습득과 관련하여 모국어 화자와 한국어 학습자 사이에 나타나는 대용어 사용의 비교 연구에도 활용이 가능하다.

    [4] 인지 언어학적 측면의 기대 효과
    인지적인 측면에서 대용어 연구는 문장 성분의 의미 정보와 관련된 인지 처리 과정의 특성을 밝힘으로써 보다 정확한 인지적 언어 처리 과정의 모형 구축에 기여한다. 이 연구는 대용어 처리에 관여하는 언어 보편적 특성들과 국어 고유의 특성들을 분류해 냄으로써 국어의 대용어 처리와 관련한 언어 처리 과정 모형을 구축하는데 보탬이 될 것으로 기대된다.

    [5] 학제적 연관성의 증진을 도모하는 신인문학으로서의 기대 효과
    대용어 연구는 다양한 언어학적 층위와 전산적 층위 전반에 걸친 학제적 연구 분야로서, 정교한 언어학적 분석이 전산언어학적 시스템의 효율성을 높이는데 기여할 수 있음을 전제로 한다. 보다 정교한 언어학적 분석을 위해서는 관련 언어 층위 전반에 걸친 체계적 탐구가 뒷받침되어야 한다. 또한 이러한 연구는 언어 정보 표상에서 전산적 처리의 효율성을 고려함으로써, 언어학적 연구가 독자적 울타리를 벗어나 타학문과 연계되어 그 학문적 자리를 넓혀 갈 수 있으리라는 가능성을 시사한다.
  • 연구요약
  • 국어에서 '이, 그, 저, 이것, 저것, 그것' 등의 대명사나 '자기'와 같은 재귀사는 하나의 단어로서 자신의 고유한 어휘적 의미를 갖지 못한다. 이들은 자신의 고유한 어휘 의미 대신 앞 문장에서 이미 나타난 성분이 가리키는 대상을 지시하는, 대용의 기능을 수행한다. 이처럼 의미 해석 과정에서 앞 문장 선행사와 동일한 지시 관계를 수행하는 문법 요소를 대용어라고 한다. 국어에서는 대명사나 재귀사가 나타나지 않고 흔히 반복된 요소가 생략되는데 이러한 영형태도 앞선 문장의 선행사를 지시하는 기능을 한다는 점에서 크게 대용어 범주에 포함된다. 이 밖에도 대용어 범주에는 체언의 자리를 차지하는 요소 외에 부사나 서술어, 의존 명사 등 다양한 문법 요소들이 포함된다. 이러한 대용어 범주 중 분포와 기능 면에서 뚜렷한 유사점과 차이점을 보이는 대명사, 재귀사, 영형태는 국어에서 명사 범주의 의미 해석에 빠질 수 없는 요소들이다. 이 연구는 명사 범주의 문법적 기능을 수행하는 세 가지 유형의 대용어를 대상으로 대용어 의미 해석에 관련한 언어학적 특성들을 고찰할 것이다.
    국어 대용어의 문법적 특성은 통사, 의미, 화용의 다양한 언어학적 층위와 맞물려 있고 선행어와의 공지시 관계가 종종 문장을 벗어나 담화단위로 확장되어 나타난다. 80년대 이후 촘스키식의 생성 문법적 접근이 국어 연구에 활발하게 도입된 이래 수많은 연구들이 통사론적 층위에서 대명사와 재귀사 ‘자기’의 의미 결속 현상을 다루었다. 그러나 당시 대부분의 이론적 접근은 통사 지배 구조를 바탕으로 하여 영어 대용어와 국어 대용어의 언어 보편적 평행성을 찾는데 치중하였다. 결국 수많은 논의에도 불구하고 이러한 대용어 연구들에서는 자료의 언어학적 분석을 통한 설명적 충족성은 막론하고 국어 대용어의 고유한 특성과 기능에 대한 관찰적 충족성도 찾기 힘든 경우가 많다.
    한편 이론적 접근보다 자료 분석을 통한 언어 기술적 (decriptive) 접근이 강세를 보이는 국어학 분야에서 대용어 연구는 중심 연구 주제로 자리매김을 하지 못하였다. 이는 교착어에 속하는 국어의 특성 상 주로 조사, 어미, 서술어를 중심으로 논항 구조, 합성어 등에 연구가 집중되었고, 따라서 상대적으로 활용 빈도가 낮은 대명사, 재귀사에 대한 관심이 높지 못한 탓이라 해석할 수 있다. 또한 영형태의 문제는 대용어의 범주로 다루어지기보다는 담화 상의 생략 현상으로 여겨져서 형태, 통사, 의미론에서 벗어나는 주변적 연구 과제로 취급되었다. 다시 말해 대용어 범주의 세부 유형과 분포, 기능을 중심으로 한 면밀한 고찰이 아직까지 부족한 실정이다.
    앞선 연구들에서 드러나는 또 하나의 문제점은 대부분의 대용어 연구가 개인의 직관에 의존하여 이루어졌다는 점이다. 홍민표(2000), 강범모(1998) 등 소수 논문을 제외하고 실제 언어 자료를 분석한 공시적 측면의 대용어 연구는 그다지 많지 않다. 또한 실제 언어 자료에 기반했다 하더라도 말뭉치 규모나 특성 면에서 자료가 불충분하거나 균형이 맞지 않는 경우들이 흔하다.
    말뭉치 자료를 기반으로 한 대용어의 연구는 국어 대용어 범주의 문법적 특성들을 밝히고 대용어 처리의 인지 과정에 대한 실마리를 제공한다. 이는 또한 대용어의 전산언어학적 처리를 위해 필수적이다. 나아가, 국어 교육 및 번역 분야에서도 대용어의 의미 복원은 중요한 연구 대상이다. 즉, 대용어 범주의 분석은 복잡한 언어학적 자질의 이해, 방대한 말뭉치 자료의 검색과 분석, 자연어 처리 분야의 전산언어학적 지식을 포괄하는 연구 과제로 학제적 연계성을 내포한다. 이 연구는 언어학적 고찰을 통해 대용어의 문법적 특성을 추출하고, 이를 제반 관련 분야의 대용어 연구에 활용할 방안을 모색해 보기로 한다.
    이 연구에서는 구어와 문어의 차이, 레지스터에 따른 변이, 담화화용 정보 등과 같은 복잡한 요인들을 고려하면서 다양한 말뭉치 자료를 중심으로 대용어의 실제적 쓰임과 기능, 통사의미, 담화 화용 제약들을 추출한다. 이는 또한 영어와 한국어의 병렬 말뭉치, 구어 말뭉치, 문어 말뭉치 등의 정밀한 검색과 관련 정보 분석을 포함한다. 나아가 국어 대용어의 쓰임이 담화 응집성(discourse coherence)과 같은 담화 화용적 제약으로 묶일 수 있는가를 고찰하고 대용어 처리를 위한 주석 말뭉치 개발에 관한 문제들도 면밀히 살펴볼 것이다.
  • 한글키워드
  • 의미 분석,재귀사,인식자,자연어처리,생성문법,생략,선행사,비교 말뭉치,병렬 말뭉치,구문 분석,결속,말뭉치,대용어,주제,영형태,센터링 이론,흔적,현저성,학습자 말뭉치,코퍼스,태깅,주석 말뭉치,주석,조응사,대명사,담화화용,담화응집성,대명사 분석 알고리즘,논항,지시 대명사,지시,지배,주석틀
  • 영문키워드
  • Logophor,Government,Generatve Grammar,Ellipsis,Pronoun,Parallel Corpus,Natural Language Processing,Zero pronoun,Discourse Coherence,Annotation Scheme,Annotaton,Anaphor,Trace,Tagged Corpus,Salience,Reference,Pronoun Resolution,Learner Corpus,Corpus,Comparative Corpus,Binding,Centering Theory,Antecedent
  • 연구성과물 목록
데이터를 로딩중 입니다.
데이터 이용 만족도
자료이용후 의견
입력