연구성과물검색
유형별/분류별 연구성과물 검색
HOME ICON HOME > 연구과제 검색 > 연구과제 상세정보

연구과제 상세정보

이용자 참여형 전자사전 연구 - 독일어 오픈사전과 윅셔너리를 중심으로 -
study on user-participation electronic dictionary - focussing on the german open dictionary and the wiktionary -
  • 연구자가 한국연구재단 연구지원시스템에 직접 입력한 정보입니다.
사업명 신진연구자지원사업(인문사회) [지원년도 신청 요강 보기 지원년도 신청요강 한글파일 지원년도 신청요강 PDF파일 ]
연구과제번호 2017S1A5A8021924
선정년도 2017 년
연구기간 1 년 (2017년 05월 01일 ~ 2018년 04월 30일)
연구책임자 김경
연구수행기관 부산대학교
과제진행현황 종료
과제신청시 연구개요
  • 연구목표
  • (가) 연구의 필요성
    주지하다시피 인공지능이나 자동번역 기술은 전자사전, 말뭉치, 온톨로지 등 언어자원 인프라가 있었기에 가능했다. 위키피디아와 위키 자매 사이트들은 웹 2.0 시대의 대표적 성공사례로 언급된다. 전세계 시민들이 자발적으로 참여해 온라인 공간에서 협업하고 그 결과물을 무료로 누릴 수 있다. 이용자 참여형 백과사전인 위키피디아의 성공은 애초에 집단지성의 가능성에 대해 부정적인 시각을 견지했던 연구자들을 각성시켰다. 이후 사전 연구자들은 위키피디아를 학문적 분석의 대상으로 삼게 되었다. 2002년부터 위키피디아의 백과사전적 정보에서 언어적 정보를 분리하기 시작해 윅셔너리가 만들어졌다. 그러나 윅셔너리에 대한 연구는 아직까지 전산학자, 자연어처리연구자들에 의한 일부 연구가 있을 뿐이고 특히 독일어 윅셔너리(이하 윅셔너리)에 대한 언어학적 관점이 반영된 연구는 Meyer/Gurevych의 2012년 그리고 2016년 연구 정도이다.
    윅셔너리의 집필자들은 모국어 화자들이 주류인 반면 네이버 독일어 오픈사전(이하 오픈사전)의 집필자들은 독일어가 외국어인 한국인 사용자이기 때문에, 제안 표제항의 체계성은 양과 질 모든 면에서 그 차이가 크다. 우리는 선행연구를 통해 오픈사전의 제안자들이 용례는 전혀 제시하지 않고, 대역어 한두 개를 입력하는 경우가 압도적으로 많음을 확인했다. 그러므로 우리는 이 연구에서 오픈사전의 경우 미시구조 전체를 분석하는 게 가능하지 않으므로 대역어의 정확성을 분석하는 의미정보 검토로 연구범위가 축소되었다.
    본 연구의 필요성은 다음과 같이 요약할 수 있다. 첫째, 이용자 참여형 사전제작은 웹 2.0 시대의 주류로 성장했고, 이에 따라 새로운 패러다임에 대한 이론사전학적 분석이 필요하다. 둘째, 전문가 제작 사전과의 비교를 통해 협업식 사전인 오픈사전과 윅셔너리의 오류와 문제점을 찾아내 기존 사전데이터의 정교화를 성취할 수 있다. 셋째, 용례와 용례번역의 경우 독-한 병렬말뭉치로 활용하여 말뭉치를 확장할 수 있는 실용적 연구이다. 중장기적으로는 독-한 언어자원화에 토대가 되어 자동번역, 인공지능 등 관련 연구에 기여할 수 있다.

    (나) 연구주제의 창의성
    본 연구는 세계 최대의 협업식 언어 사전인 윅셔너리와 네이버 독일어사전의 오픈사전을 언어학적, 사전학적 관점에서 분석한다는 점에서 기존에 없던 새로운 연구주제를 다룬다. 이는 본 연구자가 아는 한 독일어 사전연구에서 최초의 연구이다. 또한 본 연구는 윅셔너리와 전문가 제작 사전을 미시 및 접근구조에 중점을 두어 비교한다는 점에서 독일어/영어/러시아어 윅셔너리를 주로 정량적으로 비교한 Meyer/Gurevych (2012), 사전편찬과정에 대해 연구한 Meyer/Gurevych (2016)와 차별성을 갖는다. 둘째, 외국어 협업 사전의 분석은 우리말샘, 빅카인즈처럼 잠재적인 우수한 한국어 지식베이스의 개발, 활용에 시사점을 줄 수 있다. 셋째, 상대적으로 우수한 독일어 윅셔너리의 연구는 콘텐츠가 빈약한 한국어 윅셔너리의 보강, 확장을 고무할 수 있다. 끝으로 본 연구는 장기적 관점에서 독-한 언어자원화에 기여하는 학제적 연구로서의 독창성을 갖고 있다.

    (다) 선행연구와의 비교
    오픈사전을 다룬 연구는 국내외에 모두 없었다. 윅셔너리에 대한 국내 연구에서는 자연언어처리와 관련된 전산학 연구가 일부 있긴 하지만 본 연구자는 아직 언어학적 및 사전학적 관점에서 다룬 연구를 발견하지 못했다. 해외 문헌이 일부 있는데, 윅셔너리를 다른 온라인 사전들과 비교한 연구 (Mann 2010; Lew 2011), 영어 윅셔너리와 전문가 제작 사전을 비교한 연구 (Fuertes-Olivera 2009), 윅셔너리에서 의미 기술의 품질을 평가한 연구 (Hanks, 2012), 독일어 윅셔너리와 GermaNet을 비교한 연구 (Meyer/Gurevych, 2010), 러시아어 윅셔너리의 연구 (Krizhanovsky, 2010), 독일어/영어/러시아어 윅셔너리를 비교한 연구 (Meyer/Gurevych, 2012), 독일어 윅셔너리의 사전편찬 과정에 대한 연구 (Meyer/Gurevych, 2016) 등이 있다. 요약하자면 독일어 오픈사전과 윅셔너리에 대한 연구는 전무하다.
  • 기대효과
  • (1) 학문적․사회적 기여도
    본 연구의 학문적․사회적 기여도는 유럽 어문학/사전학/국어학 분야, 학문적 인프라 구축, 콘텐츠의 완성도와 이용편의성 제고에 있다. 본 연구는 새로운 사전제작 패러다임인 이용자 참여형 사전 (오픈사전, 윅셔너리)의 특성과 미시, 접근구조를 이론사전학적 시각에서 분석하는 시의적절한 연구이다. 지금까지의 특수 사전이나 특정 표현단위에 집중된 사전연구의 지평을 확장시키고 사전 연구의 공백을 메우는데 기여할 것이다. 특히 독일어사전에 국한된 이론이 아니라 한국어와 외국어 사전연구 (예: 학제간 전문용어 통일, 이용자 참여형 사전의 언어권별 비교, 접근구조 및 사전 정보 제시방법)에도 시사점을 줄 수 있을 것이다.
    이 연구의 결과물은 언어학 및 사전학 관련분야 연구를 위한 인프라를 구축하는 데 활용될 수 있고 일반인의 이해의 지평을 넓히는 데에도 기여할 것이다. 본 연구의 결과물은 학회지에 게재하여 누구나 손쉽게 활용할 수 있도록 제공할 것이다.
    이용자 참여형 사전은 다수 사용자의 집단지성이 연결되므로 콘텐츠의 완성도가 더욱 높을 것이다. 아울러 사용자 요구가 더 많이 반영된 정보 제시방법을 사용하면 검색 상황에서 더욱 이용자 편의적일 것이다.

    (2) 인력양성 방안
    본 연구의 인력양성 방안은 전자사전 제작 전문성 증진, 국어 및 외국어 사전학의 후속세대, 전자사전 및 정보공학의 신진 개발인력로 요약된다. 이 연구는 사전의 미시 및 접근구조를 파악할 수 있게 하여 사전제작자의 검색구조 개선, 정보제시 방법 효율화에 기여한다. 이를 통해 사전제작자로서의 전문성을 확보할 수 있도록 한다.
    이용자 참여형 사전의 특성과 미시 및 접근구조의 개선을 모색하는 본 연구는 한국어 및 외국어 사전학 학문후속세대들을 대상으로 한 기존 커리큘럼의 지평을 확장시키고, 이론사전학의 연구성과를 축적할 수 있다.
    본 연구의 결과물은 네이버, 다음 포털 등의 전자사전 개발자들이 기존 정보 제시방법을 지속적으로 개선하는 작업을 고무하며, 정보공학, 전산학, 컴퓨터언어학 분야의 신진 개발인력들이 사전 제작현장에서 실무능력을 배양하는데 기여한다.

    (3) 교육⋅후속연구와의 연계 활용 방안
    본 연구의 교육⋅후속연구와의 연계 활용 방안으로는 교재 및 사전 개발, 관련 강의 개설, 병렬말뭉치 제작과 언어자원화의 토대자료를 들 수 있다. 본 연구의 결과물은 학술 논문의 형태로 발표되고 후일의 사전학 강의 교재의 일부로 출판할 수 있다. 아울러 장래의 전자사전 플랫폼 개발을 위한 지침으로 활용할 수 있다.
    이 연구는 이용자 참여형 사전이라는 새로운 패러다임에 관한 연구로서 기존 ‘이론사전학’ 강의의 빈틈을 메울 수 있고, 해당 강의 개설과 커리큘럼 보강에 도움을 줄 것이다.
    본 연구에서 사용한 용례와 용례번역은 중간결과물로 제출해 독-한 병렬말뭉치 제작과 독-한 언어자원화의 토대자료로 사용할 수 있게 할 것이다.
  • 연구요약
  • (가) 연구목적
    본 연구의 목적은 다음과 같이 요약할 수 있다. 첫째, 이용자 참여형 사전제작은 웹 2.0 시대의 주류로 성장했고, 이에 따라 새로운 패러다임에 대한 이론사전학적 분석이 필요하다. 둘째, 전문가 제작 사전과의 비교를 통해 협업식 사전인 오픈사전과 윅셔너리의 오류와 문제점을 찾아내 기존 사전데이터의 정교화를 성취할 수 있다. 셋째, 용례와 용례번역의 경우 독-한 병렬말뭉치로 활용하여 말뭉치를 확장할 수 있는 실용적 연구이다. 중장기적으로는 독-한 언어자원화에 토대가 되어 자동번역, 인공지능 등 관련 연구에 기여할 수 있다.
    본 연구는 세계 최대의 협업식 언어 사전인 윅셔너리와 네이버 독일어사전의 오픈사전을 언어학적, 사전학적 관점에서 분석한다는 점에서 기존에 없던 새로운 연구주제를 다룬다. 이는 본 연구자가 아는 한 독일어 사전연구에서 최초의 연구이다. 또한 본 연구는 윅셔너리와 전문가 제작 사전을 미시 및 접근구조에 중점을 두어 비교한다는 점에서 독일어/영어/러시아어 윅셔너리를 주로 정량적으로 비교한 Meyer/Gurevych (2012), 사전편찬과정에 대해 연구한 Meyer/Gurevych (2016)와 차별성을 갖는다. 둘째, 외국어 협업 사전의 분석은 우리말샘, 빅카인즈처럼 잠재적인 우수한 한국어 지식베이스의 개발, 활용에 시사점을 줄 수 있다. 셋째, 상대적으로 우수한 독일어 윅셔너리의 연구는 콘텐츠가 빈약한 한국어 윅셔너리의 보강, 확장을 고무할 수 있다. 끝으로 본 연구는 장기적 관점에서 독-한 언어자원화에 기여하는 학제적 연구로서의 독창성을 갖고 있다.

    (나) 연구내용
    본 연구는 크게 이용자 참여형 사전의 특성, 오픈사전의 분석, 윅셔너리의 분석 이렇게 세 부분으로 구성된다. 우리의 선행연구에 따르면 오픈사전의 경우 대역어만 제시한 경우가 많아 미시구조 분석까지 수행하기 어려워 보여서 본 연구에서는 주로 대역어 제시의 정확성 여부를 평가할 것이다. 대역어 오류의 경우 대안을 제시하면서 개선방안을 제시한다.
    윅셔너리는 비교적 체계적인 미시구조를 갖추고 있으므로 미시구조와 접근구조를 분석할 것이다. 이때 온라인사전의 장점인 다중접근경로가 어떻게 구현되었는지도 살펴볼 것이다. 분석 결과를 토대로 윅셔너리 자체를 위한 개선점을 제안하고, <네이버>의 입장에서 윅셔너리의 장점을 어떻게 수용할지 활용방안을 모색할 것이다. 이 연구의 주된 내용은 이용자 참여형 사전인 오픈사전과 윅셔너리의 사전콘텐츠 품질을 검토하고 개선방안을 모색하는 것이다.

    (다) 연구방법 및 추진전략
    우리의 선행연구에서는 오픈사전의 경우 표제어의 다수 등록순으로 3명까지 선정하여, 그들이 제안한 표제항을 검사한다. 주요 품사 (명사, 동사, 형용사/부사)에서 1인당 3~4개씩 선정해 총 10개 표제어의 표제항을 분석한다. 본 연구에서는 다수 등록순으로 총6명으로 분석대상을 확대할 것이다. 필요하다고 판단될 경우 예시 표제항을 추가할 수도 있다. 상위 6명이 등록한 표제어는 전체 등록 표제어의 약 79%에 해당한다.
    윅셔너리에서는 3개 주요 품사 (명사, 동사, 형용사/부사)에서 품사별로 각각 5개씩 총 15개 표제어의 표제항을 분석할 것이다. 역시 연구 진행과정 중에 필요하다고 판단될 경우 예시 표제항을 추가할 수도 있다. 본 연구에서 중점을 두는 부분은 윅셔너리의 미시 및 접근구조의 특징이다. 기존의 언어사전과는 달리 윅셔너리가 여러 이질적인 언어 정보를 미시구조에서 제시하기 때문이다. 또한 접근구조에 관해서도 윅셔너리는 4개나 되는 접근구조를 갖고 있다. 이러한 향상된 접근구조를 통해 의미적 검색과 주제적 검색을 사용할 수 있는데, 이것은 한국의 여러 언어사전들도 참고할 필요가 있다.
    본 연구의 잠정적인 목차는 다음과 같다. 연구 수행 중 일부 순서가 재조정될 수도 있다.

    목 차
    1. 서론
    2. 이용자 참여형 사전
    3. 독일어 오픈사전
    3.1. 오픈사전의 분석
    3.2. 오픈사전의 분석결과 및 개선방안
    4. 독일어 윅셔너리
    4.1. 윅셔너리의 미시구조와 접근구조
    4.2. 윅셔너리의 분석결과
    4.3. 윅셔너리의 개선 및 활용방안
    5. 결론
결과보고시 연구요약문
  • 국문
  • 본 연구에서는 협업식 사전인 오픈사전과 윅셔너리을 이론사전학적 시각에서 분석하며, 크게 이용자참여형 사전인 오픈사전과 윅셔너리의 분석 이렇게 두 부분으로 구성된다.
    오픈사전 분석 결과, 기존에 동일한 내용이 있음에도 불구하고 중복 등록한 오류가 제일 많았다. 올바로 지적한 경우는 비교적 낮은 편이다. 그밖에도 대표형 오류도 비율이 꽤 높은 편이다. 여기에는 관사 오류, 다중어 오류, 대문자 오류, 동사원형 오류, 표제어 설정 오류, 단·복수 오류, 형용사 원급 오류, 투명한 조어 오류 등이 있다.
    윅셔너리는 여러 이질적인 언어 정보를 미시구조에서 제시하고, 접근구조도 4개나 가지고 있다. 이러한 향상된 접근구조를 통해 의미적 검색과 주제적 검색을 사용할 수 있는데, 분석 결과 이 두 가지 정보는 하이퍼링킹이 제한적이어서 모듈형 미시구조(예: elexiko, DWDS 등)와 같은 전자사전 특유의 효율적 검색구조는 구현하지 못한 상태이며, 이 점에서 개선이 요구된다.
    결과물인 용례와 용례번역은 네이버사와 공유하여 학생들과 시민들이 개선된 사전 콘텐츠를 이용하는데 기여한다. 이 연구는 일차적으로 이용자참여형 사전인 오픈사전과 윅셔너리의 사전콘텐츠 품질을 검토하고, 개선방안을 제안을 제시하며, 중장기적으로는 독-한 병렬말뭉치와 언어자원화 가능성 및 활용성(예: 자동번역, 인공지능)을 모색한다.
  • 영문
  • In this study, we analyze collaborative dictionaries, for example “open dictionary” and “wiktionary” under the lexicographical perspective. Our study consists of two parts, analysis of the above mentioned two dictionaries.
    As a result of the "open dictionary" analysis, the most common error was duplicate registration despite the same contents. The case of correctly pointed out is relatively low. In addition, the error rate of canonical form is quite high. These include article errors, multi-word errors, capital letters errors, verb form errors, lemmatizing errors, single and multiple errors, adjective positive errors, and transparent word formation errors etc.
    The “wiktionary” presents several heterogeneous language information in a microstructure and has four access structures. This improved access structure allows us to use semantic search and subject search. The analysis results show that the two types of information are limited in hyperlinking, so that efficient search structure is unimplemented such as modular microstructure in electronic dictionary (e.g. elexiko, DWDS etc.). The improvement is required in this respect.
    The resulting german examples and korean example translations are shared with Naver and contribute to the improved use of dictionary contents by students and citizens. This study first examines the quality of the dictionary content of the "open dictionary" and the "wiktionary", which are user - participation dictionaries, and proposes suggestions for improvement. In the medium and long term, we will explore German - Korean parallel corpus and the possibilities and usability of language resources (e.g. automatic translation, artificial intelligence).
연구결과보고서
  • 초록
  • 본 연구의 목적은 다음과 같이 요약할 수 있다. 첫째, 사용자 참여형 사전제작은 더이상 변방이 아니라 웹 2.0 시대의 주류로 성장했다. 이에 따라 새로운 패러다임에 대한 이론사전학적 분석이 필요하다. 둘째, 전문가 제작 사전과의 비교를 통해 협업식 사전인 오픈사전과 윅셔너리의 오류와 문제점을 찾아내 기존 사전데이터의 정교화를 고무할 수 있다. 셋째, 용례와 용례번역의 경우 독-한 병렬말뭉치로 활용하여 말뭉치를 확장할 수 있는 실용적 연구이다. 중장기적으로는 독-한 언어자원화에 토대가 되어 자동번역, 인공지능 등 관련 연구에 기여할 수 있다.
    본 연구는 크게 이용자참여형 사전의 특성, 오픈사전의 분석, 윅셔너리의 분석 이렇게 세 부분으로 구성된다. 우리의 선행연구에 따르면 오픈사전의 경우 대역어만 제시한 경우가 많아 미시구조 분석까지 수행하기 어려웠다. 그래서 125개 표제어를 대상으로 표제어, 대역어 제시의 정확성 여부를 평가한다. 대역어 오류의 경우 대안적인 대역어를 제시하고 알맞은 용례와 용례번역도 추가한다.
    윅셔너리는 비교적 체계적인 미시구조를 갖추고 있으므로 미시구조와 접근구조를 분석한다. 이때 온라인사전의 장점인 다중접근경로가 어떻게 구현되었는지도 살펴본다. 분석 결과를 토대로 윅셔너리 자체를 위한 개선점으로 모듈형 미시구조와 검색구조의 개선을 제안한다. 용례가 빈약한 <네이버>를 보강하기 위해 <윅셔너리>의 용례를 선별적으로 번역해서 추가할 수 있는 방안을 모색하고 결과물은 네이버사와 공유하여 학생들과 시민들이 개선된 사전 콘텐츠를 이용하도록 돕는다. 이 연구는 일차적으로 이용자참여형 사전인 오픈사전과 윅셔너리의 사전콘텐츠 품질을 검토하고, 개선방안을 제안으로서 제시하며, 중장기적으로는 독-한 병렬말뭉치와 언어자원화 가능성 및 활용성을 모색한다.
    우리의 본 연구에서는 오픈사전의 경우 특정한 시간 간격을 기준으로 125개의 표제어를 선정하여, 표제항의 정보부류들을 검토한다. 오픈사전 분석 결과, 기존에 동일한 내용이 있음에도 불구하고 중복 등록한 오류가 125건 중 60건(48%)이나 된다. 기존 <네이버>에 누락된 표제어, 대역어, 용례 등을 올바로 지적한 경우는 모두 17건(13,5%)으로 비교적 낮은 편이다. Hafenpromenade 처럼 투명한 조어는 등재 필요성이 낮지만, Ausländeranteil 처럼 투명한 조어임에도 Duden 온라인에 등재된 단어라면 오픈사전에서도 등재를 권고한다. 대표형 오류도 비율이 꽤 높은 편이다. 여기에는 관사 오류, 다중어 오류, 대문자 오류, 동사원형 오류, 표제어 설정 오류, 단·복수 오류, 형용사 원급 오류 등이 있다.
    윅셔너리에서는 3개 주요 품사 (명사, 동사, 형용사/부사)에서 품사별로 각각 3개씩 총 9개 표제어의 표제항을 분석한다. 본 연구에서 중점을 두는 부분은 윅셔너리의 미시 및 접근구조의 특징이다. 기존의 언어사전과는 달리 윅셔너리가 여러 이질적인 언어 정보를 미시구조에서 제시하기 때문이다. 또한 접근구조에 관해서도 윅셔너리는 4개나 되는 접근구조를 갖고 있다. 이러한 향상된 접근구조를 통해 의미적 검색과 주제적 검색을 사용할 수 있는데, 이것은 한국의 여러 언어사전들도 참고할 필요가 있다. 하지만 윅셔너리의 의미 정보와 주제 정보는 각각 제시되어 있는 수준이어서 모듈형 미시구조(예: elexiko, DWDS 등)와 같은 전자사전 특유의 효율적 검색구조는 구현하지 못한 상태이다. 이 점에서 개선이 요구된다. 하지만 윅셔너리의 용례는 오픈사전의 경우와 마찬가지로 <네이버>의 용례를 풍성하게 해주는 데 활용성이 있음을 확인하였다.
  • 연구결과 및 활용방안
  • 오픈사전 분석 결과, 기존에 동일한 내용이 있음에도 불구하고 중복 등록한 오류가 125건 중 60건(48%)이나 된다. 기존 <네이버>에 누락된 표제어, 대역어, 용례 등을 올바로 지적한 경우는 모두 17건(13,5%)으로 비교적 낮은 편이다. Hafenpromenade, Weitspucken, Märchenanfänge(Märchenanfang의 오류)처럼 투명한 조어는 등재 필요성이 낮지만, Ausländeranteil 처럼 투명한 조어임에도 Duden 온라인에 등재된 단어라면 오픈사전에서도 등재를 권고한다. 대표형 오류도 비율이 꽤 높은 편이다. 여기에는 관사 오류(예: die See 등. 총 22건), 다중어 오류(예: Danach folgt der Hamburger mit elf Prozent, Anforderungen erfüllen, im deutschsprachigen Raum 등. 총 17건), 대문자 오류(예: karauschen 등. 총 14건), 동사원형 오류(예: segnetest 등. 총 8건), 표제어 설정 오류(예: Demenziell 등. 총 6건), 단·복수 오류(예: karauschen 등. 총 6건), 형용사 원급 오류(예: oberst 등. 총 4건) 등이 있다.
    기존 <네이버>에 누락된 표제어, 대역어, 용례 등을 올바로 지적한 경우는 모두 17건(13,5%)으로 비교적 낮은 편이다. 하지만 기존 사전의 오류와 빈틈을 메꿔준다는 의미에서 소중한 자료이다. Startelf, Ödnis, Ausländeranteil, Geiselhaft, Berufswunsch, Unwort, zweideutig, (Ein)Maulschlüssel, Notenwert, Herbstlaub, Blister, Mittelmächte, hautverträglich. 본 연구자가 대역어, 주석 등을 약간 수정하였고, 아울러 용례를 추가하였다(참고. 부록 2. 오픈사전의 용례와 용례번역). 위 17개 표제어에 관련된 자료들은 네이버사에 개선, 수정을 요청할 것이다.
    오픈사전의 개선방안은 다음과 같이 요약할 수 있다. 첫째, 오픈사전의 개선도 중요하지만 더 중요한 것은 기존 사전 데이터이다. 그러므로 <네이버>는 기존 사전콘텐츠 자체의 개선에 보다 주안점을 두어야 한다. 둘째, 입력기가 개선되어야 한다. 언어별 특성을 고려한 입력기(템플릿)가 있다면 검색 오류를 유발하는 대표 표제어 설정 문제를 해결할 수 있다. 현재 개정위원에게 오픈사전의 개정을 위한 입력기가 배포되어 있는데, 꼭 필요한 영역만 남기는 작업이 추가적으로 요구된다. 셋째, 대역어 제시뿐만 아니라 용례 정보의 제시가 필요하다. 단순한 대역어 제시로는 용법 및 문맥 상황을 정확히 파악하기 어렵기 때문에 용례와 용례번역을 함께 제시하도록 해야 한다. 본 연구에서는 한국독어독문학회에 사전 개전작업을 흔쾌히 찬성한 deutschlandradio 언론기관의 자료를 주로 용례로 사용했다. 넷째, 오픈사전에 제안된 내용은 지금처럼 실시간 업데이트하는 것이 아니라 전문가의 감수를 거친 후 반영되어야 한다. 2018년 10월 현재 학회에서 선정된 14명의 개정위원이 오픈사전 감수작업을 진행중이다.
    본 연구에서 분석된 윅셔너리의 특징은 다음과 같다. 윅셔너리의 미시정보는 이질적인 언어적 정보 (어원, 음성, 형태, 통사, 의미, 대역어 및 그림 정보)를 포함하지만 바로 이런 점 때문에 광범위한 이용자층을 갖는 확장형사전이다. 윅셔너리는 다양한 접근 경로를 제공하므로 이용자가 알파벳, 주제, 표지 또는 표현적 방법 등 향상된 검색기능을 사용할 수 있다. 하지만 수직적인 정보부류가 때때로 너무 긴 경우도 있어서 DWDS처럼 탭을 활용하는 모듈형 미시구조 수준까지 접근구조를 개선할 필요가 있다.
    윅셔너리에서는 3개 주요 품사 별로 각각 3개씩 총 9개 표제어의 표제항을 분석하였다. Anzug 표제항(https://de.wiktionary.org/wiki/Anzug)을 예시로 살펴보면 윅셔너리 사전 특유의 좌우측 2단 배열이 눈에 띈다. 좌측은 일련의 정보유형들이 수직적으로 나열되어 있다. 우측은 품사별 변화표와 사진이 있다. 사진 자료가 고정 성분이 아니라면 변화표는 항상 제시된다. 좌측 상단 표제어와 문법정보(품사, 성) 아래에 수직적으로 배열된 정보 유형은 Worttrennung(분철), Aussprache(발음), Bedeutungen(의미), Herkunft(어원), Synonyme(동의어), Gegenwörter(반의어), Oberbegriffe(상위어), Unterbegriffe(하위어), Beispiele(용례), Redewendungen(관용어), Charakteristische Wortkombinationen(연어), Wortbildungen(조어), Übersetzungen(대역어), Dialektausdrücke(방언), Referenzen und weiterführende Informationen(참고자료), Ähnliche Wörter(비슷한 단어)이다. 윅셔너리의 용례의 활용과 관련해서, 위의 Anzug 표제어 분석과 동일한 방법으로 9개 표제어를 분석했으며 그 결과로서 ‘부록 3’에 용례, 용례 번역을 제안하였다.
    부록 2, 3에서 일련의 용례와 용례번역을 제안했는데, 이런 자료는 단기적으로는 우수한 교과서, 이중어 사전을 제작하는 밑거름이 되고 장기적으로는 독-한 병렬말뭉치 구축과 자동번역기 개발 등의 토대자료로 활용할 수 있다.
  • 색인어
  • 사용자 참여형 사전편찬, 협업식 사전편찬, 윅셔너리, 오픈사전, 미시구조, 접근구조, 독-한 병렬말뭉치, 언어자원, 대역어, 템플릿
  • 연구성과물 목록
데이터를 로딩중 입니다.
데이터 이용 만족도
자료이용후 의견
입력