오픈사전 분석 결과, 기존에 동일한 내용이 있음에도 불구하고 중복 등록한 오류가 125건 중 60건(48%)이나 된다. 기존 <네이버>에 누락된 표제어, 대역어, 용례 등을 올바로 지적한 경우는 모두 17건(13,5%)으로 비교적 낮은 편이다. Hafenpromenade, Weitspucken, Märc ...
오픈사전 분석 결과, 기존에 동일한 내용이 있음에도 불구하고 중복 등록한 오류가 125건 중 60건(48%)이나 된다. 기존 <네이버>에 누락된 표제어, 대역어, 용례 등을 올바로 지적한 경우는 모두 17건(13,5%)으로 비교적 낮은 편이다. Hafenpromenade, Weitspucken, Märchenanfänge(Märchenanfang의 오류)처럼 투명한 조어는 등재 필요성이 낮지만, Ausländeranteil 처럼 투명한 조어임에도 Duden 온라인에 등재된 단어라면 오픈사전에서도 등재를 권고한다. 대표형 오류도 비율이 꽤 높은 편이다. 여기에는 관사 오류(예: die See 등. 총 22건), 다중어 오류(예: Danach folgt der Hamburger mit elf Prozent, Anforderungen erfüllen, im deutschsprachigen Raum 등. 총 17건), 대문자 오류(예: karauschen 등. 총 14건), 동사원형 오류(예: segnetest 등. 총 8건), 표제어 설정 오류(예: Demenziell 등. 총 6건), 단·복수 오류(예: karauschen 등. 총 6건), 형용사 원급 오류(예: oberst 등. 총 4건) 등이 있다.
기존 <네이버>에 누락된 표제어, 대역어, 용례 등을 올바로 지적한 경우는 모두 17건(13,5%)으로 비교적 낮은 편이다. 하지만 기존 사전의 오류와 빈틈을 메꿔준다는 의미에서 소중한 자료이다. Startelf, Ödnis, Ausländeranteil, Geiselhaft, Berufswunsch, Unwort, zweideutig, (Ein)Maulschlüssel, Notenwert, Herbstlaub, Blister, Mittelmächte, hautverträglich. 본 연구자가 대역어, 주석 등을 약간 수정하였고, 아울러 용례를 추가하였다(참고. 부록 2. 오픈사전의 용례와 용례번역). 위 17개 표제어에 관련된 자료들은 네이버사에 개선, 수정을 요청할 것이다.
오픈사전의 개선방안은 다음과 같이 요약할 수 있다. 첫째, 오픈사전의 개선도 중요하지만 더 중요한 것은 기존 사전 데이터이다. 그러므로 <네이버>는 기존 사전콘텐츠 자체의 개선에 보다 주안점을 두어야 한다. 둘째, 입력기가 개선되어야 한다. 언어별 특성을 고려한 입력기(템플릿)가 있다면 검색 오류를 유발하는 대표 표제어 설정 문제를 해결할 수 있다. 현재 개정위원에게 오픈사전의 개정을 위한 입력기가 배포되어 있는데, 꼭 필요한 영역만 남기는 작업이 추가적으로 요구된다. 셋째, 대역어 제시뿐만 아니라 용례 정보의 제시가 필요하다. 단순한 대역어 제시로는 용법 및 문맥 상황을 정확히 파악하기 어렵기 때문에 용례와 용례번역을 함께 제시하도록 해야 한다. 본 연구에서는 한국독어독문학회에 사전 개전작업을 흔쾌히 찬성한 deutschlandradio 언론기관의 자료를 주로 용례로 사용했다. 넷째, 오픈사전에 제안된 내용은 지금처럼 실시간 업데이트하는 것이 아니라 전문가의 감수를 거친 후 반영되어야 한다. 2018년 10월 현재 학회에서 선정된 14명의 개정위원이 오픈사전 감수작업을 진행중이다.
본 연구에서 분석된 윅셔너리의 특징은 다음과 같다. 윅셔너리의 미시정보는 이질적인 언어적 정보 (어원, 음성, 형태, 통사, 의미, 대역어 및 그림 정보)를 포함하지만 바로 이런 점 때문에 광범위한 이용자층을 갖는 확장형사전이다. 윅셔너리는 다양한 접근 경로를 제공하므로 이용자가 알파벳, 주제, 표지 또는 표현적 방법 등 향상된 검색기능을 사용할 수 있다. 하지만 수직적인 정보부류가 때때로 너무 긴 경우도 있어서 DWDS처럼 탭을 활용하는 모듈형 미시구조 수준까지 접근구조를 개선할 필요가 있다.
윅셔너리에서는 3개 주요 품사 별로 각각 3개씩 총 9개 표제어의 표제항을 분석하였다. Anzug 표제항(https://de.wiktionary.org/wiki/Anzug)을 예시로 살펴보면 윅셔너리 사전 특유의 좌우측 2단 배열이 눈에 띈다. 좌측은 일련의 정보유형들이 수직적으로 나열되어 있다. 우측은 품사별 변화표와 사진이 있다. 사진 자료가 고정 성분이 아니라면 변화표는 항상 제시된다. 좌측 상단 표제어와 문법정보(품사, 성) 아래에 수직적으로 배열된 정보 유형은 Worttrennung(분철), Aussprache(발음), Bedeutungen(의미), Herkunft(어원), Synonyme(동의어), Gegenwörter(반의어), Oberbegriffe(상위어), Unterbegriffe(하위어), Beispiele(용례), Redewendungen(관용어), Charakteristische Wortkombinationen(연어), Wortbildungen(조어), Übersetzungen(대역어), Dialektausdrücke(방언), Referenzen und weiterführende Informationen(참고자료), Ähnliche Wörter(비슷한 단어)이다. 윅셔너리의 용례의 활용과 관련해서, 위의 Anzug 표제어 분석과 동일한 방법으로 9개 표제어를 분석했으며 그 결과로서 ‘부록 3’에 용례, 용례 번역을 제안하였다.
부록 2, 3에서 일련의 용례와 용례번역을 제안했는데, 이런 자료는 단기적으로는 우수한 교과서, 이중어 사전을 제작하는 밑거름이 되고 장기적으로는 독-한 병렬말뭉치 구축과 자동번역기 개발 등의 토대자료로 활용할 수 있다.