연구성과물검색
유형별/분류별 연구성과물 검색
HOME ICON HOME > 연구과제 검색 > 연구과제 상세정보

연구과제 상세정보

다국어 어휘부의 인지언어학적 연구
  • 연구자가 한국연구재단 연구지원시스템에 직접 입력한 정보입니다.
사업명 전문연구인력지원사업 [지원년도 신청 요강 보기 지원년도 신청요강 한글파일 지원년도 신청요강 PDF파일 ]
연구과제번호 2005-075-A00055
선정년도 2005 년
연구기간 3 년 (2006년 01월 01일 ~ 2008년 12월 31일)
연구책임자 배선미
연구수행기관 한국과학기술원
과제진행현황 종료
과제신청시 연구개요
  • 연구목표
  • 본 연구과제인 다국어 어휘부의 인지언어학적 연구는 다국어 어휘의미망 ‘코어넷(CoreNet)’의 한국어 및 중-한 다국어 어휘의미망을 중심으로 크게 다음과 같은 네 가지의 연구목표를 가지고 수행한다.

    1. 어휘의 개념 분포 분석 및 검증: 코어넷의 한국어 어휘의미망과 중국어 어휘의미망의 어휘의 개념 분포 분석을 통해 어휘망의 계층적 개념노드 분화와 어휘와 개념 간의 배정의 적절성을 검증하고 이를 수정·보완한다

    2. 개념지도 구축: 다국어 어휘의미망 코어넷의 한국어 어휘의미망과 중-한 어휘의미망을 토대로 한국어 어휘 개념지도 및 중국어 어휘 개념지도를 구축한다. ‘어휘 개념지도'란 어휘들이 갖고 있는 개념을 한 눈에 알아볼 수 있도록 그 분포와 유형을 체계적으로 조망한 지도를 말한다. 예를 들어, 한국어와 중국어 어휘 개념지도가 구축되면 한국어에는 추상명사가 얼마나 되며, 수량과 시간을 나타내는 형용사는 얼마인지, 한국어에서 가장 많은 어휘가 속한 개념은 무엇인지, 중국어도 그러한지 등에 대한 정보를 한 눈에 파악할 수 있게 된다.

    3. 어휘부에 대한 인지언어학적 비교 연구: 한국어와 중국어의 어휘 개념지도를 비교 분석하여 한국어와 중국어의 인지언어학적 공통점과 차별성을 연구한다. 이를 토대로 인간의 머릿속에 있는 어휘부와 개념 간의 인지언어학적 메커니즘의 규명을 추구한다.

    4. 인지언어학적 연구의 적용 연구: 다국어 어휘부에 대한 인지언어학적 연구가 한국어 및 외국어 교육에서의 교육적 활용 방안과 한국어와 중국어 간의 용어 국제 표준화를 위한 기초 자료로서의 활용, 다른 시소러스와의 상호보완 적용 및 인공 두뇌 개발과 같은 응용 분야에서의 활용방안을 연구한다.
  • 기대효과
  • (1) 중국어 어휘부(어휘의미망)에 대한 개념 기반 어휘연구 자료 제공 및 한국어와 중국어 용어 간의 국제 표준화의 기초 자료로 활용
    (2) 한국어 어휘 개념지도 구축으로 인해 한국어 어휘들이 갖고 있는 개념들을 한 눈에 체계적으로 조망하여 개념 기반 한국어 어휘 분석을 이용한 한국인의 인지적 언어사고 활동을 이해하는 교육적 효과
    (3) 한국어 명사, 동사, 형용사의 개념지도를 통해 품사간의 의미적 분포의 공통점과 특이점을 이해하고, 한국어 교육에서 인지언어학적 자료를 제공
    (4) 중국어 어휘 개념지도 구축으로 인해 중국어 어휘들이 갖고 있는 개념들을 체계적으로 파악함으로써 한국어와 중국어의 인지적 언어사고 활동의 공통점과 차이점을 이해하고, 개념 기반 중-한 어휘 분석을 이용한 중국인의 인지적 언어사고 활동을 이해하는 교육적 효과
    (5) 개념지도의 비교분석을 통해 한국어와 중국어의 인지언어학적 보편성과 차별성 파악함으로써 한국어와의 공통점과 다른 특이점을 이해하고, 인지언어학적 특성에 따른 한국인의 중국어 교육을 위한 자료 및 중국인의 한국어 교육을 위한 자료를 제공
    (6) 기 구축 다국어 어휘 의미망의 개념노드 분화의 적절성과 개념과 어휘 간의 적절한 배정·할당을 검증하고 수정·보완하는 효과
    (7) 개념체계를 공유하는 코어넷의 향후 개발 완료될 독일어 또는 영어 버전에 적용하여, 다국어에 대한 인지언어학적 비교분석 기반 마련
    (8) 인공두뇌의 개념기반 언어적 지식 처리 메커니즘을 제공.
    (9) 인간 두뇌의 인지언어학적 지식처리 메커니즘에 기반한 인공두뇌 개발 기술에 적용 효과: 자동통역, 기계번역, 대화형 질의응답 도우미 등에서 인지언어학적 추론 관계 적용 자료 제공
    (10) 국내외 온톨로지, 시소러스와의 비교 분석을 통해 기 구축 다국어 어휘의미망과 매핑 가능성 진단 효과
    (11) 국내외 다국어 워드넷(워드넷, 하우넷, 유로워드넷 등)의 국제 표준화 등을 위한 심화연구 동기부여 효과
    (12) 언어학, 전산언어학, 언어정보학, 인지과학 등 학제 간 분야를 가로지르는 연구의 방법론 제시 효과
  • 연구요약
  • 본 연구는 다국어 어휘의미망 코어넷의 한국어 어휘의미망과 중-한 어휘의미망을 토대로 한국어 어휘 개념지도 및 중국어 어휘 개념지도를 구축함으로써, 한국어와 중국어의 어휘의 개념분포를 밝히고, 나아가 한국어와 중국어 어휘부와 개념 간의 인지언어학적 메커니즘을 밝히고자 한다. 이 연구의 연차별 내용은 연구 수행의 효율성과 편의성을 고려하여 잠정적으로 다음과 같이 전개한다.

    I. 1차년도 (2006년)
    (1) 한국어 어휘의 개념 분포 분석 및 검증
    가. Top-down 방식의 개념체계와 어휘망의 구조적 분석
    - 명사 개념 분포 연구
    - 동사 개념 분포 연구
    - 형용사 개념 분포 연구
    - 명사-동사-형용사 간의 교차적 개념 분포 연구
    나. 어휘 의미망의 계층별 개념노드 분화의 적절성 검증 및 교정
    - 계층별 명사 의미망의 분화 검증 및 교정
    - 계층별 동사 의미망의 분화 검증 및 교정
    - 계층별 형용사 의미망의 분화 검증 및 교정
    다. Bottom-Up 방식의 개별 어휘와 개념노드의 의미적 적절성 검증 및 교정
    - 명사와 개념노드의 의미적 검증 및 교정
    - 동사와 개념노드의 의미적 검증 및 교정
    - 형용사와 개념노드의 의미적 검증 및 교정
    (2) 한국어의 개념지도 구축
    가. 한국어 명사 개념지도
    나. 한국어 동사 개념지도
    다. 한국어 형용사 개념지도
    라. 한국어의 품사 교차적 개념지도

    II. 2차년도 (2007년)
    (1) 중국어 어휘의 개념분포 분석 및 검증
    가. Top-down 방식의 개념체계와 어휘망의 구조적 분석
    - 명사 개념 분포 연구
    - 동사 개념 분포 연구
    - 형용사 개념 분포 연구
    - 명사-동사-형용사 간의 교차적 개념 분포 연구
    나. 어휘 의미망의 계층별 개념노드 분화의 적절성 검증 및 교정
    - 계층별 명사 의미망의 분화 검증 및 교정
    - 계층별 동사 의미망의 분화 검증 및 교정
    - 계층별 형용사 의미망의 분화 검증 및 교정
    다. Bottom-Up 방식의 개별 어휘와 개념노드의 의미적 적절성 검증 및 교정
    - 명사와 개념노드의 의미적 검증 및 교정
    - 동사와 개념노드의 의미적 검증 및 교정
    - 형용사와 개념노드의 의미적 검증 및 교정
    (2) 중국어의 개념지도 구축
    가. 중국어 명사 개념지도
    나. 중국어 동사 개념지도
    다. 중국어 형용사 개념지도
    라. 중국어의 품사 교차적 개념지도

    III. 3차년도 (2008년)
    (1) 한국어와 중국어의 언어 교차적 개념지도
    가. 명사 개념지도
    나. 동사 개념지도
    다. 형용사 개념지도
    라. 언어와 품사 간의 다중 교차 개념지도
    (2) 한국어와 중국어 어휘부에 대한 인지언어학적 비교 연구
    가. 어휘부과 개념 간의 인지언어학적 유사성
    나. 어휘부과 개념 간의 인지언어학적 차별성
    다. 한국어와 중국어 어휘부와 개념 간의 인지언어학적 메커니즘
    (3) 다국어 어휘부와 개념 간의 인지언어학적 연구의 적용
    가. 언어학적․외국어 교육적 응용 연구
    나. 국제 표준화에 대한 적용 연구
    다. 코어넷의 독일어 및 영어 어휘의미망의 적용 연구
    다. 워드넷 등 다른 시소러스와 상호보완 적용 연구
    라. 인공두뇌 개발 기술에 적용 연구

    본 연구는 어휘의미망의 구축 방안의 연장선에서 다국어 어휘의미망 코어넷을 전체적으로 조망하고 향후 개발 및 유지보수에 있어 방향제시를 할 뿐만 아니라, 다국어적 인지언어학적 접근을 통해 언어 간의 인지언어학적 사고활동의 차이를 연구하고, 이 연구 결과의 언어학적․외국어 교육적 응용과 국제 표준화, 다른 시소러스와의 상호보완 적용 및 인공 두뇌 개발에서 활용 가능성을 모색하는 데 의의가 있다.
  • 한글키워드
  • 다국어 어휘의미망,한국어 어휘의미망,다국어 어휘부,인공 두뇌,온톨로지,시소러스,워드넷,언어학,인지언어학,전산언어학,국제 표준화,한국어 및 중국어 교육,개념 분포,다중 교차 개념지도,개념지도,개념체계,중-한 어휘의미망
  • 영문키워드
  • Chinese-Korean Word Net,Thesaurus,Conceptual System,Intelligent Machines,Conceptual Map,Ontology,Multilingual Lexicon,Concept Distribution,Korean Word Net,Multilingual Word Net,WordNet,Linguistics,Cognitive Linguistics,Computational Linguistics,International Standardization,Education for Chinese,Education for Korean,Multi-cross Conceptual Map
결과보고시 연구요약문
  • 국문
  • 본 연구는 카이스트 전문용어언어공학연구센터에서 개발한 다국어 어휘의미망인 코어넷 버전 1.0을 이용하여 한국어 및 중국어 어휘개념지도를 구축하고, 이를 바탕으로 양 언어의 어휘부에 대한 인지언어학적 비교 분석을 하는 것이다. 코어넷은 언어 및 품사 간에 동일한 개념체계를 공유하고 있어, 개념을 기반으로 한 각 언어 어휘들의 개념분포에 대한 교차비교에 보다 용이한 구조를 지니고 있다. 현재 코어넷 버전 1.0에서 한국어 어휘의미망은 21,318개 명사가 51,612개 의미로, 1,758개 동사가 5,290개 의미로, 813개 형용사가 2,081개 의미로 분석되어 있으며, 중국어 어휘의미망은 20,647개 명사가 37486개 의미로, 288개 동사가 911개 의미로, 80개 형용사가 129개 의미로 분석되어 각각 2,937개의 개념에 할당되어 있다. 현 개발된 코어넷 브라우저를 이용하여 개념과 어휘 간의 배정․할당된 관계를 파악할 수 있지만, 어휘들의 개념분포와 유형을 체계적으로 조망하기는 어렵다. 예를 들어, 한국어 명사가 가장 많이 속한 개념은 무엇이며, 구체명사는 얼마나 되고, 그 중에서도 ‘사람’을 나타내는 명사는 얼마나 되는 지, 중국어도 그러한지 등에 대한 정보를 한 눈에 파악하기 힘들다. 또한 한국어 명사는 분포하지만 중국어 명사는 비어 있는 개념은 무엇인지, 이들은 중국어에서 다른 품사로 어휘화되는 것인지, 아니면 어떤 품사로도 어휘화되지 않는 개념들인지 파악하기가 힘들다. 따라서 이들을 체계적으로 연구하기 위해서는 다양한 의미계층 구조로 의미분류가 되어 있는 다국어 어휘의미망을 이용하여 각 언어의 어휘별, 품사별, 계층별 어휘개념 분포 분석을 토대로 한중 어휘개념지도를 구축이 필요하며, 이를 토대로 양 언어의 어휘부 비교를 하고자 한다. 이를 위해, 본 연구에서는 한국어 및 중국어 각각의 어휘개념지도와 이를 바탕으로 한 한-중 어휘개념지도 구축을 위한 기초 연구를 하였으며, 연구된 개념분포를 바탕으로 한국어 및 중국어 어휘개념지도를 각각 구축하였다. 이와 같은 방법의 연구는 양 언어 어휘부에 대한 구조적 파악을 쉽게 해 주고, 언어별/품사별 교차 비교 분석도 가능하게 해 주며, 코어넷 다음 버전에 대한 방향을 제시해 준다. 아울러, 본 연구에서는 중한 어휘의미망을 기계번역이나 외국어 교육에서 활용하기 위해 대역에서의 문제점과 대역율 개선 방안도 제안하였다.
  • 영문
  • This research aims to represent Korean-Chinse conceptual map and to compare Korean and Chinse lexicon using multilingual lexical semantic network CoreNet v 1.0. A multi-lingual lexical semantic wordnet called CoreNet has been developed by KAIST KORTERM since 1994. This wordnet is originated from NTT thesaurus. Korean wordnet in CoreNet has 2,937 semantic categories which reflect the necessary concepts identified in the Korean language. Korean wordnet and Chinese wordnet share a common hierarchical semantic category. Moreover, the same semantic categories are applied to nouns, adjectives and verbs in CoreNet, whereas different concept systems are applied to nouns and predicates in NTT thesaurus. Korean wordnet in CoreNet consists of 51,612 senses for 21,318 nouns, 5,290 for 1,758 verbs, and 2,081 for 813 adjectives and Chinese wordnet of 37,486 senses for 20,647 nouns, 911 for 288 verbs, and 129 for 80 adjectives. CoreNet browser v 1.0. allows one to easily navigate lexical semantic network of Korean words and of Chinese words through the concept itself, the concept identification number or the word.
    However, the browser doesn’t permit one to represent lexical concept distributions. That is to say, which are the most distributed concepts in Korean nouns, verbs and adjectives Which are the common distributedconcepts between Korean nouns and verbs How many nouns belong to the concept <HUMAN BEING> in Korean How many nouns belong to the concept <TIME> in Korean Do Chinese words have the same concept distributions with Korean words What are the commonly distributed conceptsbetween Korean nouns and Chinese nouns Which concepts have different lexical concept distributions between Korean and Chinese words etc. Since CoreNet is constructed based on a shared semantic hierarchy among languages and theirpart of speeches, Korean and Chinese lexicon are easily cross-comparable according to the depth levels and semantic categories, if Korean-Chinese conceptual map is constructed.
    The conceptual map allows one to structurally understand the structure of Korean wordnet and Chinese wordnet, to easily compare Korean and Chinese lexicon based on concepts, and to proceed to the next version of each wordnet. One can continue the depth levels until 12 levels; also expand another part of speeches, and even multi cross-part of speeches like abstract Korean nouns-verbs and Chinese nouns-verbs, etc. We respectively connect concept distributions of nouns, verbs, and adjectives and studied their multiple relations to construct conceptual map of Korean and Korean-Chinese wordnet. In addition, we analyzed problems in Chinese-Korean translation for Chinse wordnet and proposed several solutions to improve translation quality.
연구결과보고서
  • 초록
  • 본 연구과제는 다국어 어휘의미망 ‘코어넷’의 한국어 및 중-한 어휘의미망을 중심으로 한국어 및 중국어 어휘의 개념 분포분석 및 검증하고, 한국어 및 중국어, 나아가 한-중 어휘개념지도의 구축을 목표로 한다. 아울러, 본 연구에서는 한국어와 중국어 어휘 개념지도 비교분석을 통한 인지언어학적 비교연구와 이를 토대로 한 기계번역이나 외국어 교육 등에서의 실질적인 다국어 어휘의미망의 활용을 위해 중한 어휘의미망에서의 대역율 개선을 모색하는 방안을 모색해 보고자 한다.
    먼저, 한국어 및 중국어 각각의 어휘개념지도, 그리고 이를 바탕으로 한 한-중 어휘개념지도 구축을 위한 기초 연구를 하였다. 이를 위해 각 어휘의미망에서 단계별 개념분포 연구 및 품사 간 교차 개념 분포, 그리고 특정 품사로만 어휘화되는 개념 등을 연구를 하였다. 또한 연구된 개념분포를 바탕으로 한국어 및 중국어 어휘개념지도를 각각 구축하였다. 이와 같이 구축된 한국어 및 중국어 개념지도를 바탕으로 한-중 어휘개념지도 구축하여 한국어와 중국어 양 언어 간의 어휘부 비교를 시도해 보았다. 보다 정확한 양 언어의 명사 어휘들 간의 어휘 공백을 비교하고 그 원인을 규명하기 위해서는 동사의미망과 형용사의미망 등 여러 품사에 대해 언어 교차적으로, 그리고 사회문화적으로 비교․분석을 해야 할 것으로 판단되었다. 또한 다국어 어휘의미망을 기계번역이나 외국어 교육에서 적극적으로 활용하기 위해 현 구축된 중한어휘의미망의 대역 문제 개선을 위해 세 가지 유형-일대일 대역, 유사어 대역, 상위어 대역-으로 구분하여 분석하였고, 이에 대한 문제점 분석과 향후 대역율 개선방안도 모색해 보았다.
    본 연구에서는 어휘개념지도의 표상에 있어, 지면상의 제약으로 명사의 개념분포에 대해 구체개념 축과 추상개념 축을 구분하여 작성하였다. 향후, 어휘개념지도로의 표상에서 쉽게 확대 및 축소하여 볼 수 있는 다차원의 지도 제작 시스템의 개발을 통해 어휘의 개념 분포와 각 개념에 속한 어휘에 대한 효율적인 표현에 대한 연구가 본 연구의 연장선상에서 필요하다.
  • 연구결과 및 활용방안
  • 1. 연구결과: 어휘개념지도 구축을 이용한 양 언어의 어휘부를 비교해 보면 다음과 같다. (1) 한국어는 추상명사가 60%로 구체명사 40%보다 많은데 반해, 중국어는 구체명사가 53%로 추상명사 47%보다 더 많다. 3단계와 4단계의 누적 분포를 보면 한국어는 추상개념 축에 속하는 ‘일<추상>’과 ‘인간활동’에 가장 많은 명사가 분포되어 있는 반면, 중국어는 구체개념 축에 있는 ‘물건’과 ‘무생물’에 가장 많은 명사가 분포되어 있어 명사의 개념 분포에 있어 큰 차이를 보이고 있다. (3) 한국어 동사와 중국어 동사는 각각 5,290개와 748개로 그 개수의 차이에도 불구하고 동사의 개념 분포 비율에 있어서 거의 비슷한 양상을 보이고 있다. ‘일<추상>’의 개념에 약 94% 정도의 동사들이 분포되어 있으며, ‘추상적 관계’에는 약 5%의 동사만이 분포되어 있다. 또한 ‘추상물’의 개념에는 모두 1% 정도로만 분포되어 있다. (4) 형용사의 경우에 있어서는 중국어 형용사는 ‘같음, 친근, 유사, 다루기<기타 양상>등의 개념에 많이 분포되어 있으며, 한국어는 ’부정<취향>, 부정<기질>, 정도, 색채‘ 등의 개념에 많이 분포되어 있다. 중국어 형용사는 주로 ’추상적 관계‘와 ’일<추상>‘의 하위개념에 속하는 개념들로 한국어 형용사의 개념분포와 그다지 다르지 않다.
    2. 연구결과의 학문적 활용방안 (1) 코어넷의 유지보수 효과: 기 구축 다국어 어휘 의미망의 개념노드 분화의 적절성과 개념과 어휘 간의 적절한 배 정․할당을 검증하고 수정․보완하는 효과 (2) 범세계적 어휘의미망, 온톨로지, 시소러스, 시맨틱 웹 등 차세대 자연언어처리 및 언어공학 분야에 새로운 동향 적용 연구에 활용 (3) 국내외 기 구축 다국어 의미망에 대한 다각도의 연구개발 및 연구 분야 확장 동기 부여 (4) 코어넷의 구조적․계층적 분석을 통해 연구된 다국어 어휘개념지도 관련 논문을 학진 등재(후보)지 또는 SCI 급 국제 전문학술지에 게재함으로써 관련 분야 전문연구자 들의 연구활동 심화에 기여 3. 교육과의 연계 활용 방안 (1) 한국어 명사, 동사, 형용사의 개념지도를 통해 품사간의 의미적 분포의 공통점과 특이점을 이해하고, 한국어 교육에서 인지언어학적 자료를 제공 (2) 한국어 및 중국어에 대한 개념 기반 외국어 교육 자료로 활용 (3) 연구성과를 대학에서 지식처리 방법론, 전산어휘론 등의 교과과정에 반영
  • 색인어
  • 다국어 어휘의미망, 어휘의미망, 어휘개념지도, 개념분포, 한국어 어휘의미망, 중국어 어휘의미망, 한국어와 중국어 어휘부 비교, 어휘의미망을 이용한 번역, 어휘의미망을 이용한 교육, 온톨로지, 시소러스, multilingual semantic network, lexical network, lexical conceptual map, concept distribution, Korean Word Net, Chinese-Korean Word Net, comparision of Korean and Chinese lexicons, translation using multilingual semantic network, education using multilingual semantic network, ontology, thesaurus
  • 연구성과물 목록
데이터를 로딩중 입니다.
데이터 이용 만족도
자료이용후 의견
입력