연구성과물검색
유형별/분류별 연구성과물 검색
HOME ICON HOME > 연구성과물 유형별 검색 > 보고서 상세정보

보고서 상세정보

https://www.krm.or.kr/krmts/link.html?dbGubun=SD&m201_id=10006725&local_id=10011708
한국어 형용사 어미 활용 전자사전 : INTEX Nooj와의 호환성을 고려하여
이 보고서는 한국연구재단(NRF, National Research Foundation of Korea)이 지원한 연구과제( 한국어 형용사 어미 활용 전자사전 : INTEX Nooj와의 호환성을 고려하여 | 2004 년 신청요강 다운로드 PDF다운로드 | 정고스란(연세대학교) ) 연구결과물 로 제출된 자료입니다.
한국연구재단 인문사회연구지원사업을 통해 연구비를 지원받은 연구자는 연구기간 종료 후 6개월 이내에 결과보고서를 제출하여야 합니다.(*사업유형에 따라 결과보고서 제출 시기가 다를 수 있음.)
  • 연구자가 한국연구재단 연구지원시스템에 직접 입력한 정보입니다.
연구과제번호 A00090
선정년도 2004 년
과제진행현황 종료
제출상태 재단승인
등록완료일 2006년 04월 24일
연차구분 결과보고
결과보고년도 2006년
결과보고시 연구요약문
  • 국문
  • 본 연구에서는 한국어의 성상 형용사 3113개와 형용사와 결합할 수 있는 831 개의 어미를 대상으로 실제 활용형을 언어학적으로 분석한 후 이들을 전산 처리하는 방안을 강구하여 보았다. 어미에 대한 연구로는 선어말 어미와 어말 어미를 분리하여 각각 816개와 15개를 추출하였으며 이들을 형태적으로 분석한 결과 단순형, 결합형, 반복형 세가지 유형으로 나눌 수 있었다. 반복형은 본래형과 축약형으로 다시 분리되는데, 빈칸을 포함하는 본래형은 통사론의 대상이어서 본 연구에서는 제외되었으며 축약형만이 본 연구의 대상이 되었다. 어간에 대한 연구로는 3113개 성상 형용사를 어간 마지막 모음 및 자음의 음운적 환경에 따라 18개의 형태 무리로 분리하였다. 이 형태 무리에 831개의 어미들을 모두 대입하여 최종적으로 18개의 활용 형식을 확정하였다. 이러한 언어학적 연구를 바탕으로 전산학적으로는 인텍스/누즈 시스템과의 호환성을 고려한 한국어 (성상) 형용사 사전을 구축하였다. 한국어의 복잡한 활용 방식에 합당한 사전을 구성하기 위하여 선택한 형태 문법 기술 방식에 따라 프랑스어에서와는 다른 사전 모형을 제시하였다. 또한 모든 활용형을 기계적으로 처리할 수 있는 11개의 그래프 형식의 형태 문법 변환기를 제시하였다.
  • 영문
  • In this paper, we analyzed inflexional forms of 3113 songsang adjectives whose roots can be attached with 831 suffixes and developed in electronic descriptions. Regarding to suffixes, we extracted 15 non terminal and 816 terminal suffixes. We also observed that they behavior into 3 different morphological forms: simple forms, complex forms and repetitive forms. Repetitive forms can be original forms and/or contracted forms. Original forms contain a space in their own sequence and can be analyzed in syntactical level. So we didn’t treat these forms in this paper. On the other hand, contracted forms don't contain the space, because it is disappeared after contraction. So only contracted forms (with simple and complex foms ) are studied in this paper whose analyse is concenturated to the morphological research. Regarding to roots, we divided 3113 songsang adjectives into 18 classes according to phonological environment. Then we attached 831 suffixes to these 18 classes in order to constitute their inflextional classes. We applied these linguistic results to develop into electronic dictionary in order to integrate to INTEX/NooJ system. Because Korean inflexional system is so complicated, we could’nt realise inlextional grammar based dictionary like French which has relatively simple inflextional system. We finally developed morphological grammar based dictionary and 11 transducer (in the forms of graphs) of final state grammar based on morphological grammar of NooJ system. These transducers represent our 18 inflextionnal classes and their all inflected forms.
연구결과보고서
  • 초록
  • 본연구에서는 성상 형용사 3113개와 이와 결합할 수 있는 어미 831개를 대상으로 실제 언어에서 사용되는 형식인 활용형을 언어학적으로 분석하고 또 전산 처리할 수 있는 방안을 강구하였다. 언어학적인 분석을 위해서는 활용형식의 어간 분야와 어미 분야에 대한 독립적이면서도 통합적인 기술을 시도하였다. 어미분야는 일정한 원칙에 따라 수집한 후 이를 형태적으로 분리하여 단순형, 결합형, 반복형으로 나누었다. 결합형과 반복형은 단순형으로부터 다른 요소들이 첨가된 형식이므로 활용 방식이 해당 단순형의 음운적 환경에 준한다. 따라서 이러한 분류는 활용 기술을 보다 더 단순화 및 체계화할 수 있게 해 준다. 어간에 대해서는 어간 끝 음소에 따라 18개의 어간 유형을 추출하였다. 이 어간 유형에 준하는 18개 활용 유형을 단순형 어미를 모두 대입함으로써 설정할 수 있었다. 전산학적으로는 먼저 형용사 기본형과 어미에 대한 표제어들의 형태 및 통사 정보를 수록한 전자 사전을 구축하였다. 이 전자 사전은 인텍스/누즈 시스템에 내장될 것을 고려하여 형용사 기본형 사전과 어미 사전을 구별하지 않고 하나의 사전으로 제시하였다. 또한 활용 형식이 형태단위로 분석되는 형태 문법 변환기 그래프를 구현하여 사전과의 상호교환적 시스템이 되도록 하였다.
  • 연구결과 및 활용방안
  • 본 연구에서는 다양하고 복합한 체계를 갖는 한국어 (성상) 형용사의 어간과 어미에 대한 형태적 접근을 제시하여 활용 기술을 최대한으로 단순화 및 체계화할 수 있었다. 3113개의 성상 형용사와 816개의 어말 어미 그리고 15개의 선어말 어미 사이의 형태론은 18개의 활용 유형, 3가지의 어미 구성 방식, 그리고 11개의 형태 문법 변환 그래프로 구현할 수 있었다.
    본 연구는 언어학적으로 인쇄형 활용 사전을 만들어 학교 문법 자료로 또는 외국어로서의 한국어 습득을 위한 자료로 활용될 수 있을 것이다. 전산학적으로는 사전과 그래프를 실제 말뭉치에 적용하여 정확한 표현을 포착하고, 활용형에 대한 대역 번역 등 다양한 활용 방안을 구상할 수 있다.
  • 색인어
  • 성상 형용사, 인텍스/누즈, 활용형, 기본형, 표제어, 전자사전, 유한한계 문법, 형태 문법 변환기, 단순형, 결합형, 반복형, 선어말 어미, 어말 어미
  • 이 보고서에 대한 디지털 콘텐츠 목록
데이터를 로딩중 입니다.
  • 본 자료는 원작자를 표시해야 하며 영리목적의 저작물 이용을 허락하지 않습니다.
  • 또한 저작물의 변경 또는 2차 저작을 허락하지 않습니다.
데이터 이용 만족도
자료이용후 의견
입력