Search
Search

연구성과물 검색 타이틀 이미지

HOME ICON HOME > Search by Achievements Type > Reports View

Reports Detailed Information

https://www.krm.or.kr/krmts/link.html?dbGubun=SD&m201_id=10012243&local_id=10013609
어휘 의미 중의성 해소: 직관 설문조사 및 코퍼스를 바탕으로 한 중의성 해소 알고리즘
Reports NRF is supported by Research Projects( 어휘 의미 중의성 해소: 직관 설문조사 및 코퍼스를 바탕으로 한 중의성 해소 알고리즘 | 2005 Year 신청요강 다운로드 PDF다운로드 | 최재웅(고려대학교) ) data is submitted to the NRF Project Results
Researcher who has been awarded a research grant by Humanities and Social Studies Support Program of NRF has to submit an end product within 6 months(* depend on the form of business)
사업별 신청요강보기
  • Researchers have entered the information directly to the NRF of Korea research support system
Project Number A00275
Year(selected) 2005 Year
the present condition of Project 종료
State of proposition 재단승인
Completion Date 2007년 01월 31일
Year type 결과보고
Year(final report) 2007년
Research Summary
  • Korean
  • 본 논문은 의미 중의성 해소에 대한 화자의 직관의 계산 모형에 대한 연구로, Harris (1964)의 ‘분포가설’에 근거하여 핵심어와 공기하는 어휘들에 대한 분포적 정규성을 포착하는 언어 직관의 계산 모형을 제안한다. 이를 위해 분포적 정규성에 대한 화자의 처리 계산 모형을 파악하기 위하여 심리언어학적 실험을 실시하고 그 결과를 분석한다. 계산 모형으로는 논리 모형, 확률 모형, 그리고 확률 추론 모형의 세 가지 모형이 설정되었다. 실험은 두 가지로 구성되었다. 첫 번째는 100만 어절 코퍼스에서 추출된 문장을 화자 직관으로 의미를 식별하는 실험이었다. 이 실험에서는 응답간 일치도가 98%로 나왔다. 두 번째 실험은, 제한된 환경에서 실험자의 반응을 관찰하기 위한 것으로, 분열문이라는 환경을 통해 핵심어와 공기어사이의 의미 관계를 살펴보았다. 또한 100만 어절 코퍼스에서 관찰된 수치와 실험에서 관찰된 관찰치사이의 상관성을 피어슨의 상관계수로 측정하였다. 그러한 측정 결과 실제 코퍼스에서 관찰되는 현상은 논리 모형과 상관성이 있었고, 제한된 환경에서 실시한 결과는 확률 모형과 상관성이 있었다. 이 실험결과는 논리 모형이 우선적으로 의미 분류에 관여하나, 만약 논리 모형이 적용되지 않을 경우 확률 모형이 관여함을 보여 준다. 아울러 의미 결정 모형의 관점에서는 논리 모형이 정확하게 직관모형을 예측할 수 있었고, 확률 추론 모형도 직관모형을 근사치에 가깝게 예측할 수 있었다.
  • English
  • According to Harris'(1966) distributional hypothesis, understanding the meaning of a word is thought to be dependent on its context. Under this hypothesis about human language ability, this paper proposes a computational model for native speaker's language processing mechanism concerning word sense disambiguation, based on two sets of experiments. Among the three computational models discussed in this paper, namely, the logic model, the probabilistic model, and the probabilistic inference model, the experiment shows that the logic model is first applied for semantic disambiguation of the key word. Next, if the logic model fails to apply, then the probabilistic model becomes most relevant. The three models were also compared with the test results in terms of Pearson correlation coefficient value. It turns out that the logic model best explains the human decision behaviour on the ambiguous words, and the probabilistic inference model comes next. The experiment consists of two parts; one involves 50 sentences extracted from 1 million graphic-word corpus, and the result shows the agreement rate among native speakers is at 98% in terms of word sense disambiguation. The other part of the experiment, which was designed to exclude the logic model effect, is composed of 50 cleft sentences.
Research result report
  • Abstract
  • 본 논문은 의미 중의성 해소에 대한 화자의 직관의 계산 모형에 대한 연구로, Harris (1964)의 ‘분포가설’에 근거하여 핵심어와 공기하는 어휘들에 대한 분포적 정규성을 포착하는 언어 직관의 계산 모형을 제안한다. 이를 위해 분포적 정규성에 대한 화자의 처리 계산 모형을 파악하기 위하여 심리언어학적 실험을 실시하고 그 결과를 분석한다. 계산 모형으로는 논리 모형, 확률 모형, 그리고 확률 추론 모형의 세 가지 모형이 설정되었다. 실험은 두 가지로 구성되었다. 첫 번째는 100만 어절 코퍼스에서 추출된 문장을 화자 직관으로 의미를 식별하는 실험이었다. 이 실험에서는 응답간 일치도가 98%로 나왔다. 두 번째 실험은, 제한된 환경에서 실험자의 반응을 관찰하기 위한 것으로, 분열문이라는 환경을 통해 핵심어와 공기어사이의 의미 관계를 살펴보았다. 또한 100만 어절 코퍼스에서 관찰된 수치와 실험에서 관찰된 관찰치사이의 상관성을 피어슨의 상관계수로 측정하였다. 그러한 측정 결과 실제 코퍼스에서 관찰되는 현상은 논리 모형과 상관성이 있었고, 제한된 환경에서 실시한 결과는 확률 모형과 상관성이 있었다. 이 실험결과는 논리 모형이 우선적으로 의미 분류에 관여하나, 만약 논리 모형이 적용되지 않을 경우 확률 모형이 관여함을 보여 준다. 아울러 의미 결정 모형의 관점에서는 논리 모형이 정확하게 직관모형을 예측할 수 있었고, 확률 추론 모형도 직관모형을 근사치에 가깝게 예측할 수 있었다.
  • Research result and Utilization method
  • 본 연구 결과는 일차적으로 자연언어처리의 제일 난제라 할 수 있는 중의성 해소에 기여할 수 있고, 아울러, 언어학적 연구방법론의 발전에 기여할 수 있다고 본다. 직관에 대한 연구를 출발점으로 통계적 방법을 연결시키는 방식은 성찰을 주 방법론으로 택하는 전통적 언어학 연구에다가 대규모 자료를 통한 통계적 기법을 방법론으로 취하는 최근의 전산언어학적 연구 방법론을 서로 상보하는 방식으로, 양쪽 분야 모두에 기여할 수 있다고 본다.
    의미 중의성 해소는 언어처리에서 빠질 수 없는 기본 기술이다. 이 작업은 마지막 단계의 완성물을 만드는 작업은 아니지만, 중간단계의 작업으로 언어처리 전반에 걸쳐서 응용의 효과가 높은 측면을 갖는다. 특히 기계번역과 정보검색 영역에 필요한 기여를 할 수 있을 것으로 기대된다.
    본 연구에서의 연구 결과는 화자 직관에 대한 심리적 모형에 대한 연구로서, 실제 자연언어처리에서 활용되는 여러 기법을 바탕으로한 모형을 제시하고 있다. 이러한 심리적 모형이 실제 자연언어처리에서 보다 효율적인 중의성 해소 시스템 개발하는데도 직접 활용되거나 아니면 참고가 될 수 있을 것으로 본다.

  • Index terms
  • 의미 중의성 해소, 언어 직관 실험, 부울 논리 모형, 최대우도추정치 모형, 베이지안 확률 모형, 코퍼스
  • List of digital content of this reports
데이터를 로딩중 입니다.
  • This document, it is necessary to display the original author and you do not have permission
    to use copyrighted material for-profit
  • In addition , it does not allow the change or secondary writings of work
데이터 이용 만족도
자료이용후 의견
입력
트위터 페이스북
NRF Daejeon
(34113) 201, Gajeong-ro, Yuseong-gu, Daejeon, Korea
Tel: 82-42-869-6114 / Fax: 82-42-869-6777
NRF Seoul
(06792) 25, Heonreung-ro, Seocho-gu, Seoul, Korea
Tel: 82-2-3460-5500 / Fax: 82-2-3460-5759
KRM Help Center
Tel : 042-710-4360
E-mail : krmcenter@nrf.re.kr / Fax : 042-861-4380