연구성과물검색
유형별/분류별 연구성과물 검색
HOME ICON HOME > Search by Achievements Type > Reports View

Reports Detailed Information

https://www.krm.or.kr/krmts/link.html?dbGubun=SD&m201_id=10013515&local_id=10014412
현대 중국어 기본 어휘의 연어 관계 연구
Reports NRF is supported by Research Projects( 현대 중국어 기본 어휘의 연어 관계 연구 | 2006 Year 신청요강 다운로드 PDF다운로드 | 강병규(서울대학교) ) data is submitted to the NRF Project Results
Researcher who has been awarded a research grant by Humanities and Social Studies Support Program of NRF has to submit an end product within 6 months(* depend on the form of business)
  • Researchers have entered the information directly to the NRF of Korea research support system
Project Number A00108
Year(selected) 2006 Year
the present condition of Project 종료
State of proposition 재단승인
Completion Date 2008년 02월 29일
Year type 결과보고
Year(final report) 2008년
Research Summary
  • Korean
  • 본 연구는 중국어 상용어휘들의 결합관계를 연어(collocation)의 측면에서 고찰하여 중국어에서 자주 쓰이는 연어적 표현들을 찾고 그 유형을 분류하는 방법론을 제시하는 것을 목적으로 한다. 또한 이러한 단어간의 상용 결합 관계를 파악하기 위해 중국어 말뭉치(corpus)를 어떻게 효과적으로 활용할 수 있을 것인지에 대해서도 연구하고자 하였다.

    본 연구에서는 이렇게 어떠한 단어가 다른 어떤 단어들과 자주 결합하는 관계를 연어(搭配)관계라고 정의하고 중국어에서는 자주 쓰이는 연어적 표현들을 찾고 유형을 분류하는 방법을 제시하고자 하였다. 특히 본 연구에서는 특정한 언어학적 기준을 가지고 중심어(head)와 한 문장에서 공기하는 연결어의 관계를 계량적 접근 방법을 통해 분석하였다. 그리고 이러한 결과에 근거하여 해당 어휘들의 연어 관계에 대한 특성을 기술하고자 하였다. 지금까지 이런 목적으로 중국어의 다양한 연어 관계를 정리하고 언어학적 특성을 종합적으로 설명하고자 한 시도는 매우 드물었다. 특히 구문적(문법적) 연어 관계 연구나, 공기하는 단어를 이용한 단어의 의미적 특징 연구는 더욱 드물었다. 영어학계나 한국어학계에서는 통계를 이용한 언어 현상 분석에 대해 상당한 연구가 되어 있지만, 국내의 중국어학계에서의 연어 관계의 연구는 아직 부족한 것이 현실이다. 본 연구는 이러한 현실을 인식하고 엄밀한 통계 방법의 검증을 통해 단어들의 공기 관계를 규명하고자 하였다. 이러한 작업이 선행되었을 때 언어학적인 입장에서 체계적이고 종합적으로 중국어의 연어 관계의 특성을 파악할 수 있을 것이다.

    본 연구의 내용은 크게 다음의 세 가지로 나누어진다.

    첫째, 언어학적으로 어휘들의 연어 관계의 개념을 명확히 설정하고 이를 바탕으로 한 연어 관계의 특성을 구체적으로 기술하였다. '연어'는 한 텍스트 내 각각의 협소한 공간 안에서 둘 이상의 단어들이 공기하는 것을 일컫는다. 또한 이들은 '공기성(co-occurrence)', '분포의 제약성', '이항 관련성' 등의 특징을 갖는다.

    둘째 본 연구에서는 중국어 말뭉치를 활용하여 연어성이 높은 예들을 효과적으로 추출하기 위한 방법을 제시하였다. 중국어의 유의미한 연어를 찾아내기 위해서 충분한 양의 중국어 말뭉치를 구비할 것과 효과적인 연어 추출 도구를 활용할 것을 제시하였다. 특히 말뭉치를 효과적으로 연어 관계 연구에 이용하기 위해서는 연구자의 세심한 관찰뿐만 아니라, 계량언어학적 연구에 필요한 통계 기법의 특성을 정확하게 이해하고 적절한 추출 도구를 사용하는 것이 필요하다는 점을 강조하였다. 이러한 반자동적인 방법을 사용하면 한 문장 내에서 연구 대상어인 중심어(node, base)와 유의미하게 공기하는 단어를 추출하는데 많은 도움을 줄 수 있다.

    셋째, 반자동적인 방법을 사용하여 추출된 연어 후보들을 관찰하여 한 문장 내에서 연구 대상어인 중심어와 유의미하게 공기하는 단어들의 특성을 정리하였다. 본 연구에서는 말뭉치의 통계정보에 의거한 연구의 실례를 보이기 위해 의미는 비슷하지만 실제로 용법이 조금씩 다른 동의어(유의어)를 대상어로 선택하여 연구를 하였다. 특히 본 연구에서는 상용어휘 중에서 동사, 형용사, 명사, 부사를 뽑아서 그것을 중심어(연어핵)으로 놓고 그와 결합하는 단어(연어변)들의 출현 양상을 분석해 보았다. 본 연구에서 선택한 단어들 중에는 유의어가 많다. 이러한 유의어들은 실제로 중국어 사전에 기술된 의미정보와 용례만을 가지고 공통점과 차이점을 명확히 구분하기 어렵다. 그러나 중국어 말뭉치에 의거하여 이 단어와 자주 사용되는 단어들을 조사해 보면 공통점과 차이점을 객관적으로 정리하는 것이 가능해진다. 이들은 실제 출현 빈도 면에서 차이를 보이고 있으며, 자주 결합되는 단어들이 다르다는 것을 알 수 있었다. 즉 연어 구성이 다르다는 것을 알 수 있었다.
  • English
  • A Study on the Collocation Pattern of Chinese Basic Vocabulary
    (Kang Byeong Kwu)

    During the past decades, the corpus-based research has played a significant role in the linguistic domain. Analysis of corpus(an linguistic usage data) have revealed quite various patterns of language. Traditional descriptive frameworks are normally not able to account for such a various patterns or features of language. As a result, recently, there has been a vast amount of linguistic research based on corpus, such as word frequency, collocation, lexical or grammatical patterns, etc.

    A study on the collocation patterns is one of the most fundamental in the corpus-based research. Within the area of corpus linguistics, collocation is defined as a sequence of words which co-occur more often than would be expected by chance. Collocation refers to the restrictions on how words can be used together, for example which nouns are used with particular verbs, or which adjectives and nouns are used together.

    Collocation in Chinese is less well-studied than it is in English or Korean. Especially the investigation of Chinese collocation patterns based on large-scaled corpora has not yet been fully done by Korean researchers.

    In this study, we has examined collocation patterns and phrasal units from a Chinese corpus. We have investigate some Chinese text (including the newspaper text, novel text, essay text and academic text) in a systematic manner to begin to gauge how large a scale the collocation patterns are used in the written Chinese. In this study we have analyzed the collocation patterns of Chinese on the basis of words. For example, verb-noun collocations, adjective-noun collocations, adverb-verb collocations.

    The contributions of this study mainly include the following:
    (1) The linguistic features of Chinese collocations are analyzed systemically on a statistical frequency basis. Chinese collocations have their own, unique characteristics, as well as shared features with other languages.

    (2) On the basis of Chinese corpus, we have extracted collocation patterns of Chinese words, using collocation extraction tools and text edit programs. The collocation pattern has been analyzed on the basis of words, such as verbs, nouns, adjectives, and adverbs. And we have investigate the lexical meanings and syntactic structures of them.
    The above-mentioned achievements are helpful for research of lexical semantics, Chinese collocation dictionary and Chinese-Teaching.
Research result report
  • Abstract
  • 연어(collocation)은 긴밀한 결합 관계를 가지는 단어와 단어의 조합을 가리키는 개념이다. Firth(1957)에서부터 시작된 단어의 긴밀한 결합 관계 연구는 말뭉치가 구축되면서 언어학계에서 새롭게 주목받고 있다. 왜냐하면 연어 관계 연구는 어휘들 상호간의 긴밀성을 밝히는 것이므로 어휘부에 대한 이해의 폭을 넓히는데 중요한 토대가 되기 때문이다. 이러한 연유로 영어학계나 한국어학계에서는 90년대부터 줄곧 어휘들의 결합 관계 연구가 중요하게 다루어져 왔다. 그래서 어휘들의 연어 관계의 개념 설정과 이를 바탕으로 한 연어 관계 구성의 정리와 특성을 기술하는 연구가 많이 되어 있는 편이다. 그러나 이에 비해 국내의 중국어학계에서는 중국어 연어(搭配) 관계에 대한 연구가 아직 많이 이루어지지 않고 있는 것이 현실이다.

    본 연구에서는 이러한 점에 착안하여 현재 국내외적으로 진행되고 있는 말뭉치에 기초한 언어 연구의 일환으로서 중국어 기본 어휘들의 연어 관계를 고찰하고자 하였다. 특히 중국어 상용어휘들의 결합관계를 연어(collocation)의 측면에서 고찰하여 중국어에서 자주 쓰이는 연어적 표현들을 찾고 그 유형을 분류하는 방법론을 제시하였다. 또한 이러한 단어간의 상용 결합 관계를 파악하기 위해 중국어 말뭉치(corpus)를 어떻게 효과적으로 활용할 수 있을 것인지에 대해서도 연구하고자 하였다.
    본 연구에서 관심을 가진 것은 실제 중국어 자료에서 어떠한 단어들의 결합이 더 자연스러운 것인지에 대한 것이다. 지금까지의 중국어 연구에서 어떤 문제가 되는 표현이 문법적인지 아닌지에 주로 관심을 가져왔다면 본 연구에서는 문법성의 여부 뿐만 아니라 실제 중국어 자료를 바탕으로 어떤 것이 더 의미있는 결합관계를 갖는지에 중점을 두었다. 외국어로서 중국어를 연구하는 우리로서는 언어적 직관만으로는 어휘들의 결합관계를 정리해 내기가 힘들다. 그래서 본 연구에서는 실제 언어 자료인 중국어 말뭉치의 용례를 면밀히 관찰하였다. 그리고 정량적인 방법과 정성적인 방법을 사용하여 중국어 기본 어휘의 연어 관계를 파악하고자 하였다. 어떤 단어가 문장의 어느 위치에 자주 출현하는지, 통사적으로 어떤 기능을 하는지, 어떤 단어들과 자주 결합하는지 등을 기술하고자 하였다. 이러한 기술은 모두 실제 언중들이 사용하는 언어 표현을 모아놓은 중국어 말뭉치에 근거하여 이루어졌다.

    본 연구에서는 먼저 언어학적으로 어휘들의 연어 관계의 개념을 명확히 설정하고 이를 바탕으로 한 연어 관계의 특성을 구체적으로 기술하였다. 그리고 언어학적인 개념 설정에 기초하여 중국어 말뭉치에 출현하는 어휘들의 결합 양상을 조사하였다. 중국어 말뭉치는 북경대학 중문학과과 전산언어학 연구소에서 구축한 것을 기반으로 하였다. 본 연구에서는 북경대학의 말뭉치 중에서 자료의 대표성과 균형성을 고려하여 신문류, 문학작품류, 학술서적류 등을 일정한 비율로 선별하여 그것을 관찰대상으로 삼았다. 실제 통계 분석에 사용된 것은 200만자 규모이고 용례 분석을 위해서 사용된 것은 2000만자 규모의 자료이다.

    본 연구에서는 중국어 말뭉치를 활용하여 연어성이 높은 예들을 효과적으로 추출하기 위한 방법을 제시하였다. 그리고 중국어의 유의미한 연어를 찾아내기 위해서 효과적으로 사용할 수 있는 연어 추출 도구를 소개하였다. 뿐만 아니라 말뭉치를 효과적으로 연어 관계 연구에 이용하기 위한 계량언어학적인 통계 분석 방법을 제시하였다.

    본 연구에서는 반자동적인 방법을 사용하여 추출된 연어 후보들을 관찰하여 한 문장 내에서 연구 대상어인 중심어와 유의미하게 공기하는 단어들의 특성을 정리하였다. 그 중에서 의미는 비슷하지만 실제로 용법이 조금씩 다른 동의어(유의어)를 대상어로 선택하여 연구를 하였다. 연구 결과 중국어 말뭉치에 의거하여 이 단어와 자주 사용되는 단어들을 조사해 보면 공통점과 차이점을 객관적으로 정리하는 것이 가능하다는 것을 알 수 있었다. 이들은 실제 출현 빈도 면에서 차이를 보이고 있으며, 자주 결합되는 단어들이 다르다는 것을 알 수 있었다.
    이러한 방식으로 다른 개별 어휘들을 정리해 나간다면 어휘들의 결합관계와 계열관계를 더 깊이 있게 이해할 수 있을 것으로 판단된다.
  • Research result and Utilization method
  • 중국어 말뭉치에 기초하여 중국어 기본 어휘의 연어 관계를 연구하는 것은 다음과 같은 몇가지 점에서 기대 효과와 활용 가치가 있다고 판단된다.

    첫째, 언어학적으로 볼 때, 말뭉치에 기초한 연구 방법은 중국어의 연어에 대해 구체적이고 객관적인 정보를 제공해줄 수 있다. 중국어 연어 관계에 대한 연구는 어휘들 상호간의 긴밀성을 밝히는 작업이다. 따라서 이러한 연구는 중국어 어휘부(lexicon)에 대한 이해의 폭을 넓히는데 큰 기여를 할 수 있다. 중국어 어휘부의 의미항 분석과 그 유형을 분류하는 연구는 어느 정도 진행되어 왔다. 그러나 중국어의 어떤 어휘가 어떤 어휘와 자주 결합되는지에 대해서는 많은 연구가 이루어지지 않았다. 중국어 연어 관계의 연구 결과들은 어휘의 결합 정보들을 알려주므로 어휘부의 의미 기술을 더욱 폭넓게 할 수 있게 한다. 뿐만 아니라 수많은 언어 사용자들이 사용한 실제 언어 자료를 이용하여 중국어 연어의 형식의 분포와 그 유의미성을 조사하고 분석한다면 자연스러운 중국어 표현에 관한 실제적인 증거를 제시할 수 있다. 또한 이러한 연구는 언어의 계열관계(paradigmatic relations)와 결합관계(syntagmatic relations)의 특성을 객관적인 방법으로 분명히 정리할 수 있게 한다.

    둘째, 중국어 교육의 측면에서도 연어 연구의 결과물이 중요한 자료로 사용될 수 있다. 중국어를 배우는 학생들이 범한 어휘 사용상의 오류 중에 상당수는 단어의 결합 관계, 혹은 연어 관계의 이해 부족 때문에 발생한다. 특히 중국어 학습자들이 중급이나 고급 과정으로 갈수록 이런 연어(搭配) 관계와 관련된 오류를 많이 범하게 된다. 예를 들어 중국어 단어 형용사 '安定(안정되다)'와 ' 稳定(안정되다)'는 비슷한 의미를 가진다. 그러나 이들과 결합할 수 있는 단어는 차이가 있다. 즉 '稳定的工作(안정된 직장)'은 자연스러운 표현이지만 ' 安定的工作(안정된 직장)'은 어색하다. '安定'는 한국어의 '안정되다'와 사용의 범위가 달라서 '安定'과 '工作'는 함께 사용되지 않는다. 중국어를 학습하는 과정에서 이러한 중국어 단어의 통사적 용법이나 결합할 수 있는 단어들에 대한 이해가 부족하면 자연스러운 중국어 표현을 하기 힘들다. 중국어 연어 관계에 대한 연구는 바로 이런 문제에 대한 많은 정보를 제공할 수 있다.

    셋째, 중국어 연어 관계에 대한 연구는 중국어 사전 편찬에도 많은 기여를 할 수 있다. 기존에 출판된 중국어 사전들은 실제 언중(言衆)들의 언어 사용 양상을 제대로 반영하고 있지 못한 면이 있다. 오늘날 새롭게 출판되는 사전들은 실제 말뭉치의 용례들을 많이 참고하여 편찬된다. Sinclair가 주관한 《Coubuild 영어사전》이나, 연세대학교 언어정보연구원에서 편찬한 《연세한국어사전》은 모두 실제 말뭉치에 근거하여 표제어를 선정하고 예문들을 제시한 사전이다. 앞으로 말뭉치에 기초한 중국어 사전들을 편찬하기 위해서는, 어휘 빈도의 산출, 문법 빈도의 산출, 연어 정보 빈도의 산출, 관용 표현의 빈도 산출 등 빈도에 관한 정보를 이용한 다양한 언어 정보 분석이 필수적으로 진행되어야 한다. 뿐만 아니라 실제적인 언어 자료를 바탕으로 풍부한 용례를 제공해야 한다. 따라서 본 연구에서 제시한 중국어 어휘의 연어 연구 방법은 사전편찬학적인 측면에서도 중요한 의미를 가진다고 하겠다.

    넷째, 중국어 연어 관계에 대한 연구 성과는 자연언어처리 분야에도 중요한 자원으로 사용될 수 있다. 실제로 중국어 정보 처리 분야에서 연어 정보에 기초한 다양한 응용 시스템 개발이 시도되어 왔다. 기계번역이 그 전형적인 예이다. 단어를 번역의 단위로 처리를 하게 되면 의미 중의성(ambiguity)문제가 대두된다. 그러나 자주 결합되는 연어 패턴을 번역의 단위로 삼으면 의미의 중의성 문제를 해결하는데 많은 도움을 줄 수 있다. 왜냐하면 특정한 패턴의 연어 관계는 일반적으로 고정된 의미를 가지고, 그와 대응되는 대역어 역시 정해져 있기 때문이다. 따라서 대량의 연어 정보가 들어있는 번역 사전을 이용한다면, 훨씬 효율적인 번역시스템을 만들 수가 있을 것이다.
  • Index terms
  • 중국어 말뭉치, 중국어 연어, 연어 관계, 공기관계, 공기빈도, 통계적 관련성, 빈도, 카이-제곱근 수치, 분포의 제약성, 이항 관련성, 연어핵(Base), 연어변(Collocate 또는 Collocator) , 내용어, 유의어, 말뭉치 언어학, 계량언어학, 정량분석, 정성분석
  • List of digital content of this reports
데이터를 로딩중 입니다.
  • This document, it is necessary to display the original author and you do not have permission
    to use copyrighted material for-profit
  • In addition , it does not allow the change or secondary writings of work
데이터 이용 만족도
자료이용후 의견
입력