연구성과물검색
유형별/분류별 연구성과물 검색
HOME ICON HOME > Search by Achievements Type > Reports View

Reports Detailed Information

https://www.krm.or.kr/krmts/link.html?dbGubun=SD&m201_id=10011773&local_id=10014628
다국어 어휘부의 인지언어학적 연구
Reports NRF is supported by Research Projects( 다국어 어휘부의 인지언어학적 연구 | 2005 Year 신청요강 다운로드 PDF다운로드 | 배선미(한국과학기술원) ) data is submitted to the NRF Project Results
Researcher who has been awarded a research grant by Humanities and Social Studies Support Program of NRF has to submit an end product within 6 months(* depend on the form of business)
  • Researchers have entered the information directly to the NRF of Korea research support system
Project Number A00055
Year(selected) 2005 Year
the present condition of Project 종료
State of proposition 재단승인
Completion Date 2009년 05월 20일
Year type 결과보고
Year(final report) 2009년
Research Summary
  • Korean
  • 본 연구는 카이스트 전문용어언어공학연구센터에서 개발한 다국어 어휘의미망인 코어넷 버전 1.0을 이용하여 한국어 및 중국어 어휘개념지도를 구축하고, 이를 바탕으로 양 언어의 어휘부에 대한 인지언어학적 비교 분석을 하는 것이다. 코어넷은 언어 및 품사 간에 동일한 개념체계를 공유하고 있어, 개념을 기반으로 한 각 언어 어휘들의 개념분포에 대한 교차비교에 보다 용이한 구조를 지니고 있다. 현재 코어넷 버전 1.0에서 한국어 어휘의미망은 21,318개 명사가 51,612개 의미로, 1,758개 동사가 5,290개 의미로, 813개 형용사가 2,081개 의미로 분석되어 있으며, 중국어 어휘의미망은 20,647개 명사가 37486개 의미로, 288개 동사가 911개 의미로, 80개 형용사가 129개 의미로 분석되어 각각 2,937개의 개념에 할당되어 있다. 현 개발된 코어넷 브라우저를 이용하여 개념과 어휘 간의 배정․할당된 관계를 파악할 수 있지만, 어휘들의 개념분포와 유형을 체계적으로 조망하기는 어렵다. 예를 들어, 한국어 명사가 가장 많이 속한 개념은 무엇이며, 구체명사는 얼마나 되고, 그 중에서도 ‘사람’을 나타내는 명사는 얼마나 되는 지, 중국어도 그러한지 등에 대한 정보를 한 눈에 파악하기 힘들다. 또한 한국어 명사는 분포하지만 중국어 명사는 비어 있는 개념은 무엇인지, 이들은 중국어에서 다른 품사로 어휘화되는 것인지, 아니면 어떤 품사로도 어휘화되지 않는 개념들인지 파악하기가 힘들다. 따라서 이들을 체계적으로 연구하기 위해서는 다양한 의미계층 구조로 의미분류가 되어 있는 다국어 어휘의미망을 이용하여 각 언어의 어휘별, 품사별, 계층별 어휘개념 분포 분석을 토대로 한중 어휘개념지도를 구축이 필요하며, 이를 토대로 양 언어의 어휘부 비교를 하고자 한다. 이를 위해, 본 연구에서는 한국어 및 중국어 각각의 어휘개념지도와 이를 바탕으로 한 한-중 어휘개념지도 구축을 위한 기초 연구를 하였으며, 연구된 개념분포를 바탕으로 한국어 및 중국어 어휘개념지도를 각각 구축하였다. 이와 같은 방법의 연구는 양 언어 어휘부에 대한 구조적 파악을 쉽게 해 주고, 언어별/품사별 교차 비교 분석도 가능하게 해 주며, 코어넷 다음 버전에 대한 방향을 제시해 준다. 아울러, 본 연구에서는 중한 어휘의미망을 기계번역이나 외국어 교육에서 활용하기 위해 대역에서의 문제점과 대역율 개선 방안도 제안하였다.
  • English
  • This research aims to represent Korean-Chinse conceptual map and to compare Korean and Chinse lexicon using multilingual lexical semantic network CoreNet v 1.0. A multi-lingual lexical semantic wordnet called CoreNet has been developed by KAIST KORTERM since 1994. This wordnet is originated from NTT thesaurus. Korean wordnet in CoreNet has 2,937 semantic categories which reflect the necessary concepts identified in the Korean language. Korean wordnet and Chinese wordnet share a common hierarchical semantic category. Moreover, the same semantic categories are applied to nouns, adjectives and verbs in CoreNet, whereas different concept systems are applied to nouns and predicates in NTT thesaurus. Korean wordnet in CoreNet consists of 51,612 senses for 21,318 nouns, 5,290 for 1,758 verbs, and 2,081 for 813 adjectives and Chinese wordnet of 37,486 senses for 20,647 nouns, 911 for 288 verbs, and 129 for 80 adjectives. CoreNet browser v 1.0. allows one to easily navigate lexical semantic network of Korean words and of Chinese words through the concept itself, the concept identification number or the word.
    However, the browser doesn’t permit one to represent lexical concept distributions. That is to say, which are the most distributed concepts in Korean nouns, verbs and adjectives Which are the common distributedconcepts between Korean nouns and verbs How many nouns belong to the concept <HUMAN BEING> in Korean How many nouns belong to the concept <TIME> in Korean Do Chinese words have the same concept distributions with Korean words What are the commonly distributed conceptsbetween Korean nouns and Chinese nouns Which concepts have different lexical concept distributions between Korean and Chinese words etc. Since CoreNet is constructed based on a shared semantic hierarchy among languages and theirpart of speeches, Korean and Chinese lexicon are easily cross-comparable according to the depth levels and semantic categories, if Korean-Chinese conceptual map is constructed.
    The conceptual map allows one to structurally understand the structure of Korean wordnet and Chinese wordnet, to easily compare Korean and Chinese lexicon based on concepts, and to proceed to the next version of each wordnet. One can continue the depth levels until 12 levels; also expand another part of speeches, and even multi cross-part of speeches like abstract Korean nouns-verbs and Chinese nouns-verbs, etc. We respectively connect concept distributions of nouns, verbs, and adjectives and studied their multiple relations to construct conceptual map of Korean and Korean-Chinese wordnet. In addition, we analyzed problems in Chinese-Korean translation for Chinse wordnet and proposed several solutions to improve translation quality.
Research result report
  • Abstract
  • 본 연구과제는 다국어 어휘의미망 ‘코어넷’의 한국어 및 중-한 어휘의미망을 중심으로 한국어 및 중국어 어휘의 개념 분포분석 및 검증하고, 한국어 및 중국어, 나아가 한-중 어휘개념지도의 구축을 목표로 한다. 아울러, 본 연구에서는 한국어와 중국어 어휘 개념지도 비교분석을 통한 인지언어학적 비교연구와 이를 토대로 한 기계번역이나 외국어 교육 등에서의 실질적인 다국어 어휘의미망의 활용을 위해 중한 어휘의미망에서의 대역율 개선을 모색하는 방안을 모색해 보고자 한다.
    먼저, 한국어 및 중국어 각각의 어휘개념지도, 그리고 이를 바탕으로 한 한-중 어휘개념지도 구축을 위한 기초 연구를 하였다. 이를 위해 각 어휘의미망에서 단계별 개념분포 연구 및 품사 간 교차 개념 분포, 그리고 특정 품사로만 어휘화되는 개념 등을 연구를 하였다. 또한 연구된 개념분포를 바탕으로 한국어 및 중국어 어휘개념지도를 각각 구축하였다. 이와 같이 구축된 한국어 및 중국어 개념지도를 바탕으로 한-중 어휘개념지도 구축하여 한국어와 중국어 양 언어 간의 어휘부 비교를 시도해 보았다. 보다 정확한 양 언어의 명사 어휘들 간의 어휘 공백을 비교하고 그 원인을 규명하기 위해서는 동사의미망과 형용사의미망 등 여러 품사에 대해 언어 교차적으로, 그리고 사회문화적으로 비교․분석을 해야 할 것으로 판단되었다. 또한 다국어 어휘의미망을 기계번역이나 외국어 교육에서 적극적으로 활용하기 위해 현 구축된 중한어휘의미망의 대역 문제 개선을 위해 세 가지 유형-일대일 대역, 유사어 대역, 상위어 대역-으로 구분하여 분석하였고, 이에 대한 문제점 분석과 향후 대역율 개선방안도 모색해 보았다.
    본 연구에서는 어휘개념지도의 표상에 있어, 지면상의 제약으로 명사의 개념분포에 대해 구체개념 축과 추상개념 축을 구분하여 작성하였다. 향후, 어휘개념지도로의 표상에서 쉽게 확대 및 축소하여 볼 수 있는 다차원의 지도 제작 시스템의 개발을 통해 어휘의 개념 분포와 각 개념에 속한 어휘에 대한 효율적인 표현에 대한 연구가 본 연구의 연장선상에서 필요하다.
  • Research result and Utilization method
  • 1. 연구결과: 어휘개념지도 구축을 이용한 양 언어의 어휘부를 비교해 보면 다음과 같다. (1) 한국어는 추상명사가 60%로 구체명사 40%보다 많은데 반해, 중국어는 구체명사가 53%로 추상명사 47%보다 더 많다. 3단계와 4단계의 누적 분포를 보면 한국어는 추상개념 축에 속하는 ‘일<추상>’과 ‘인간활동’에 가장 많은 명사가 분포되어 있는 반면, 중국어는 구체개념 축에 있는 ‘물건’과 ‘무생물’에 가장 많은 명사가 분포되어 있어 명사의 개념 분포에 있어 큰 차이를 보이고 있다. (3) 한국어 동사와 중국어 동사는 각각 5,290개와 748개로 그 개수의 차이에도 불구하고 동사의 개념 분포 비율에 있어서 거의 비슷한 양상을 보이고 있다. ‘일<추상>’의 개념에 약 94% 정도의 동사들이 분포되어 있으며, ‘추상적 관계’에는 약 5%의 동사만이 분포되어 있다. 또한 ‘추상물’의 개념에는 모두 1% 정도로만 분포되어 있다. (4) 형용사의 경우에 있어서는 중국어 형용사는 ‘같음, 친근, 유사, 다루기<기타 양상>등의 개념에 많이 분포되어 있으며, 한국어는 ’부정<취향>, 부정<기질>, 정도, 색채‘ 등의 개념에 많이 분포되어 있다. 중국어 형용사는 주로 ’추상적 관계‘와 ’일<추상>‘의 하위개념에 속하는 개념들로 한국어 형용사의 개념분포와 그다지 다르지 않다.
    2. 연구결과의 학문적 활용방안 (1) 코어넷의 유지보수 효과: 기 구축 다국어 어휘 의미망의 개념노드 분화의 적절성과 개념과 어휘 간의 적절한 배 정․할당을 검증하고 수정․보완하는 효과 (2) 범세계적 어휘의미망, 온톨로지, 시소러스, 시맨틱 웹 등 차세대 자연언어처리 및 언어공학 분야에 새로운 동향 적용 연구에 활용 (3) 국내외 기 구축 다국어 의미망에 대한 다각도의 연구개발 및 연구 분야 확장 동기 부여 (4) 코어넷의 구조적․계층적 분석을 통해 연구된 다국어 어휘개념지도 관련 논문을 학진 등재(후보)지 또는 SCI 급 국제 전문학술지에 게재함으로써 관련 분야 전문연구자 들의 연구활동 심화에 기여 3. 교육과의 연계 활용 방안 (1) 한국어 명사, 동사, 형용사의 개념지도를 통해 품사간의 의미적 분포의 공통점과 특이점을 이해하고, 한국어 교육에서 인지언어학적 자료를 제공 (2) 한국어 및 중국어에 대한 개념 기반 외국어 교육 자료로 활용 (3) 연구성과를 대학에서 지식처리 방법론, 전산어휘론 등의 교과과정에 반영
  • Index terms
  • 다국어 어휘의미망, 어휘의미망, 어휘개념지도, 개념분포, 한국어 어휘의미망, 중국어 어휘의미망, 한국어와 중국어 어휘부 비교, 어휘의미망을 이용한 번역, 어휘의미망을 이용한 교육, 온톨로지, 시소러스, multilingual semantic network, lexical network, lexical conceptual map, concept distribution, Korean Word Net, Chinese-Korean Word Net, comparision of Korean and Chinese lexicons, translation using multilingual semantic network, education using multilingual semantic network, ontology, thesaurus
  • List of digital content of this reports
데이터를 로딩중 입니다.
  • This document, it is necessary to display the original author and you do not have permission
    to use copyrighted material for-profit
  • In addition , it does not allow the change or secondary writings of work
데이터 이용 만족도
자료이용후 의견
입력