국어에서 '이, 그, 저, 이것, 저것, 그것' 등의 대명사나 '자기'와 같은 재귀사는 하나의 단어로서 자신의 고유한 어휘적 의미를 갖지 못한다. 이들은 자신의 고유한 어휘 의미 대신 앞 문장에서 이미 나타난 성분이 가리키는 대상을 지시하는, 대용의 기능을 수행한다. ...
국어에서 '이, 그, 저, 이것, 저것, 그것' 등의 대명사나 '자기'와 같은 재귀사는 하나의 단어로서 자신의 고유한 어휘적 의미를 갖지 못한다. 이들은 자신의 고유한 어휘 의미 대신 앞 문장에서 이미 나타난 성분이 가리키는 대상을 지시하는, 대용의 기능을 수행한다. 이처럼 의미 해석 과정에서 앞 문장 선행사와 동일한 지시 관계를 수행하는 문법 요소를 대용어라고 한다. 국어에서는 대명사나 재귀사가 나타나지 않고 흔히 반복된 요소가 생략되는데 이러한 영형태도 앞선 문장의 선행사를 지시하는 기능을 한다는 점에서 크게 대용어 범주에 포함된다. 이 밖에도 대용어 범주에는 체언의 자리를 차지하는 요소 외에 부사나 서술어, 의존 명사 등 다양한 문법 요소들이 포함된다. 이러한 대용어 범주 중 분포와 기능 면에서 뚜렷한 유사점과 차이점을 보이는 대명사, 재귀사, 영형태는 국어에서 명사 범주의 의미 해석에 빠질 수 없는 요소들이다. 이 연구는 명사 범주의 문법적 기능을 수행하는 세 가지 유형의 대용어를 대상으로 대용어 의미 해석에 관련한 언어학적 특성들을 고찰할 것이다.
국어 대용어의 문법적 특성은 통사, 의미, 화용의 다양한 언어학적 층위와 맞물려 있고 선행어와의 공지시 관계가 종종 문장을 벗어나 담화단위로 확장되어 나타난다. 80년대 이후 촘스키식의 생성 문법적 접근이 국어 연구에 활발하게 도입된 이래 수많은 연구들이 통사론적 층위에서 대명사와 재귀사 ‘자기’의 의미 결속 현상을 다루었다. 그러나 당시 대부분의 이론적 접근은 통사 지배 구조를 바탕으로 하여 영어 대용어와 국어 대용어의 언어 보편적 평행성을 찾는데 치중하였다. 결국 수많은 논의에도 불구하고 이러한 대용어 연구들에서는 자료의 언어학적 분석을 통한 설명적 충족성은 막론하고 국어 대용어의 고유한 특성과 기능에 대한 관찰적 충족성도 찾기 힘든 경우가 많다.
한편 이론적 접근보다 자료 분석을 통한 언어 기술적 (decriptive) 접근이 강세를 보이는 국어학 분야에서 대용어 연구는 중심 연구 주제로 자리매김을 하지 못하였다. 이는 교착어에 속하는 국어의 특성 상 주로 조사, 어미, 서술어를 중심으로 논항 구조, 합성어 등에 연구가 집중되었고, 따라서 상대적으로 활용 빈도가 낮은 대명사, 재귀사에 대한 관심이 높지 못한 탓이라 해석할 수 있다. 또한 영형태의 문제는 대용어의 범주로 다루어지기보다는 담화 상의 생략 현상으로 여겨져서 형태, 통사, 의미론에서 벗어나는 주변적 연구 과제로 취급되었다. 다시 말해 대용어 범주의 세부 유형과 분포, 기능을 중심으로 한 면밀한 고찰이 아직까지 부족한 실정이다.
앞선 연구들에서 드러나는 또 하나의 문제점은 대부분의 대용어 연구가 개인의 직관에 의존하여 이루어졌다는 점이다. 홍민표(2000), 강범모(1998) 등 소수 논문을 제외하고 실제 언어 자료를 분석한 공시적 측면의 대용어 연구는 그다지 많지 않다. 또한 실제 언어 자료에 기반했다 하더라도 말뭉치 규모나 특성 면에서 자료가 불충분하거나 균형이 맞지 않는 경우들이 흔하다.
말뭉치 자료를 기반으로 한 대용어의 연구는 국어 대용어 범주의 문법적 특성들을 밝히고 대용어 처리의 인지 과정에 대한 실마리를 제공한다. 이는 또한 대용어의 전산언어학적 처리를 위해 필수적이다. 나아가, 국어 교육 및 번역 분야에서도 대용어의 의미 복원은 중요한 연구 대상이다. 즉, 대용어 범주의 분석은 복잡한 언어학적 자질의 이해, 방대한 말뭉치 자료의 검색과 분석, 자연어 처리 분야의 전산언어학적 지식을 포괄하는 연구 과제로 학제적 연계성을 내포한다. 이 연구는 언어학적 고찰을 통해 대용어의 문법적 특성을 추출하고, 이를 제반 관련 분야의 대용어 연구에 활용할 방안을 모색해 보기로 한다.
이 연구에서는 구어와 문어의 차이, 레지스터에 따른 변이, 담화화용 정보 등과 같은 복잡한 요인들을 고려하면서 다양한 말뭉치 자료를 중심으로 대용어의 실제적 쓰임과 기능, 통사의미, 담화 화용 제약들을 추출한다. 이는 또한 영어와 한국어의 병렬 말뭉치, 구어 말뭉치, 문어 말뭉치 등의 정밀한 검색과 관련 정보 분석을 포함한다. 나아가 국어 대용어의 쓰임이 담화 응집성(discourse coherence)과 같은 담화 화용적 제약으로 묶일 수 있는가를 고찰하고 대용어 처리를 위한 주석 말뭉치 개발에 관한 문제들도 면밀히 살펴볼 것이다.