연구성과물검색
유형별/분류별 연구성과물 검색
HOME ICON HOME > 연구과제 검색 > 연구과제 상세정보

연구과제 상세정보

언어평가 및 언어치료를 위한 학령전기아동의 한국어 코퍼스 구축 및 어휘 데이터베이스 개발
  • 연구자가 한국연구재단 연구지원시스템에 직접 입력한 정보입니다.
사업명 공동연구지원사업
연구과제번호 2011-32A-B00202
선정년도 2011 년
연구기간 3 년 (2011년 05월 01일 ~ 2014년 04월 30일)
연구책임자 김수진
연구수행기관 나사렛대학교
과제진행현황 종료
공동연구원 현황 차재은(경기대학교)
김정미(나사렛대학교)
윤미선(나사렛대학교)
장문수(서경대학교)
과제신청시 연구개요
  • 연구목표
  • 본 연구는 언어발달의 결정적 시기로 알려져 있는 학령 전기 아동의 언어에 대한 코퍼스를 구축하여 향후 의사소통에 어려움이 있는 아동의 언어 평가 및 언어 교육의 기초 자료를 제공하고 연구 기반을 제공하는 것을 목적으로 한다. 이를 위해서는 자료 수집 기준과 분석 과정이 전략적이고 체계적이어야 한다. 이 연구는 데이터베이스의 수집 기준과 분석프로그램 및 관련 응용프로그램 개발을 포괄하는 것으로 아동 언어의 이해를 증진시키는 동시에 평가와 교육의 이정표를 제공하는 데 그 목적이 있다.

    가. 대규모의 아동 언어 코퍼스 구축: 아동이 사용하는 언어의 총체적 양상 파악
    외국에서는 아동기 초기의 어휘 발달에 대한 연구가 40여년 이상 활발히 이루어져 왔다. 반면 한국의 아동 언어 연구는 아동학이나 언어학 분야에서 꾸준히 연구되어 왔으나, 자료구축 상황이 제한적이고 자료의 수가 빈약하여 실제 활용하는 데에는 어려움이 있다. 더구나 기존의 국어 연구와 DB 자료는 문어에 편중되어 있어서 실제 언어 현실과 유리되는 경향이 있다. 따라서 구어 자료를 주로 다루는 응용 분야에서 기존의 연구 결과들을 활용하는 데는 한계가 있다. 언어를 매개로 한 이론언어학 분야와 응용언어학 분야의 연구자들은 많은 시간과 경비를 코퍼스 구축에 투입하고 있으나 분야들 간의 개념적 차이와 다양한 요구로 구축된 자료를 공유하지 못하고 있다. 이에 이론언어학 전공자들과 응용분야 전공자들이 협력적으로 대규모로 자료를 구축하여 아동 언어와 관련된 분야에서 활용할 수 있도록 해야 할 것이다.

    나. 입출력, 맥락, 상황별 구어 자료 구축 필요
    구어 연구의 활성화를 위해서는 구어 자료 구축이 선행되어야 한다. 구어 자료는 문어 자료에 비해 구축 과정이 까다롭기 때문에 방법론에 대한 기초 연구가 좀 더 보완될 필요가 있다. 또한 지금까지 구어 자료 구축은 언어학적 층위별로 구축되었지만, 화자의 변인별, 주제나 상황별 구어 자료 구축도 요구되고 있다. 구어는 화자의 연령, 성별, 계층에 따라 다른 양상을 보이지만 구축된 대부분의 구어 코퍼스는 주로 표준어를 구사하는 성인 언어를 중심으로 이루어져 있다. 이에 본 연구에서는 언어 습득에서 가장 중요한 시기인, 2세 이후 유아부터 학령전기인 5세까지 아동, 즉 24개월에서 60개월의 아동을 대상으로 어휘 발달 양상을 확인할 수 있는 데이터베이스를 구축하는 동시에, 아동의 출력 언어에 영향을 미치는 입력 언어인, 성인의 구어 데이터베이스를 동시에 구축하고자 한다.

    다. 코퍼스에 기반한 어휘 데이터베이스 구축: 입력/산출 어휘의 분석을 통한 다양한 진단 및 프로그램 개발 유도
    어휘습득 양상을 살펴보면 어린 아동에게 있어 입력을 의미하는 수용어휘와 출력을 의미하는 표현어휘의 양은 일치하지 않으며, 어휘는 성인기에 이르기까지 지속적으로 확장된다. 최근 이러한 어휘 분야에 있어 임상적, 학문적 욕구와 필요성으로 인해 표준화된 어휘검사인 수용․표현 어휘력 검사가 개발되었다(김영태․홍경훈․김경희, 2009). 이 검사는 우리말 사전 문헌 연구를 통한 초기 검사문항들의 개발을 시작으로 발전시킨 것으로 개발자들은 초기 검사문항 개발과정에서 참고한 코퍼스가 대부분 학령기 이후의 문어자료에 기초하고 있음을 지적하면서 특히 아동 언어의 데이터베이스 부재를 문제점으로 지적하고 있다. 따라서 아동의 구어를 포함하는 아동언어 데이터 코퍼스가 구축된다면 이를 근거로 한 언어발달분야와 언어병리학 분야의 기초연구뿐 아니라 검사도구 및 치료도구의 개발을 크게 활성화시킬 것으로 기대된다.

    라. 기존 코퍼스의 한계 보완 및 관련된 응용 프로그램 개발
    지금까지 한국어 정보처리 연구는 문어 중심이며 지극히 성인 중심이었다. 세종 코퍼스의 경우에도 아동을 대상으로 한 것은 구연을 전제로 한 동화책을 유사구어로 구분하고 1만어절도 채 되지 않는 극히 일부의 코퍼스만을 포함하고 있다. 이 연구를 통해 아동이 산출하고, 아동에게 입력되는 다양한 언어자료 코퍼스를 구축하여 기존 코퍼스의 공백을 보완할 수 있을 것이다.
    수집된 자료는 음성자료로 변환하고 철자전사와 발음전사를 실시하고 다양한 형태소 분석기와 구문분석기를 활용하여 어휘 수준을 넘어서서 문법적, 연어적, 은유적 의미표현도 분석하여 실제로 의사소통 장면에서 활용할 수 있는 데이터베이스를 제공하고자 한다. 이러한 분석 과정에서 정리된 최적 분석모형은 기존의 산발적 상황에서 수집된 자료들도 재분석할 수 있는 틀로 활용될 수 있을 것이다.
  • 기대효과
  • 본 연구의 결과는 학령전기아동 언어에 관한 체계화되고 수량화된 최초의 자료로서 아동 언어발달연구, 언어병리학, 일반아동의 언어교육, 다문화가족아동의 언어교육 등에 다음과 같은 기대효과를 갖는다.

    가. 아동 언어발달 연구 촉진
    아동 언어 데이터베이스 구축은 주로 성인의 언어를 중심으로 체계적으로 이루어져왔다. 반면에 아동의 구어를 중심으로 한 코퍼스는 그동안 언어발달과 언어장애를 연구하는 학자들 중심으로 개별적으로 이루어져 체계적인 데이터베이스로 구축되지 못했다. 학제 간 그리고 연구자 간에도 자료의 공유도 거의 이루어지지 않아 학문적 발전을 저해하는 요인으로 작용하였다. 최근 외국에서는 CHILDES와 같은 구어데이터베이스를 기초로 다양한 언어권에서 아동언어습득에 대한 연구가 매우 활발하다(Brodsky, Waterfall & Edelman2007; Norio, Yasushi & Miyata, 1998; Marcus, G. F., 1995). 또한 언어습득에 있어서 부모나 성인과 같은 입력언어의 영향을 살펴보기 위하여, CHILDES와 같은 수량화된 자료가 사용되고 있다(Frazier, Gelman & Wellman, 2008; Goodman, Dale, & Ping, 2008). 따라서 우리나라 아동과 부모를 대상으로 한 구어 데이터베이스가 구축된다면 그 기초자료를 바탕으로 우리나라 아동의 언어발달에 대한 체계적인 연구가 활발해질 것이며 또한 언어병리학, 국어교육, 아동학, 심리학 등 학제 간 교류가 활발해질 수 있을 것이다. 뿐만 아니라 해외학자들과의 교류 또한 용이해질 것이다.

    나. 언어장애아동 평가도구 및 중재 프로그램 개발
    학령전기 언어장애아동의 평가와 중재는 구어를 중심으로 이루어진다. 따라서 언어 평가도구와 중재프로그램의 개발에 가장 필요한 것은 일반아동이 사용하는 구어발달의 이정표이다. 일반아동들이 일상적인 의사소통에서 사용하는 어휘, 구문, 형태소에 대한 수량화된 정보는 언어 평가도구와 언어 중재프로그램을 개발하는 데에 매우 중요하다. Kirk et al. (1995)은 청각장애아동의 평가를 위한 낱말재인검사개발시 기존의 검사항목이 일반 아동들의 어휘빈도를 반영하고 있지 않다는 단점을 보완하기 위하여 CHILDES(MacWhinney & Snow, 1985)의 자료를 기초로 낱말재인검사를 개발하였다. 우리나라의 경우, 청각장애아동을 위한 낱말재인검사가 다양하게 개발되어있으나 이러한 아동들의 구어자료를 바탕으로 개발된 검사는 없으며 아동의 발음을 평가하는 조음음운검사 또한 아동의 구어자료를 바탕으로 개발되지 못하였다. 따라서 아동구어데이터베이스는 언어장애아동의 언어평가도구 개발에 큰 기여를 하게 될 것이다.
    Maekawa & Storkel(2006)은 CHILDES의 자료를 이용하여 일반아동의 표현어휘습득에 음소배열 확률(phonotatcic probability), 이웃밀도(neighborhood density), 단어 빈도, 낱말길이와 같은 변인의 영향을 살펴보았다. 일반아동의 어휘습득에 미치는 변인에 대한 정보는 자연히 언어발달장애아동의 중재프로그램 개발에 매우 중요한 역할을 한다. 이와 같이 아동 구어데이터베이스 구축은 언어발달장애아동의 평가와 중재에 결정적인 역할을 한다. 뿐 만 아니라 언어장애전문가들이 언어의 하위수준에서 준거참조검사를 제작하거나 언어치료목표를 설정할 때에도 아동구어데이터베이스는 매우 유용하게 사용될 수 있다. 따라서 아동구어데이터베이스가 체계적으로 구축된다면 언어발달장애아동을 연구하고 평가도구와 중재프로그램을 개발하는 연구자뿐 아니라 임상현장에 있는 언어장애전문가들이 언어장애아동의 의사소통능력을 평가하고 향상시키는 데 큰 기여를 하게 될 것이다.

    다. 일반아동의 언어교육에 활용
    일반아동을 위한 교육프로그램에서 언어교육은 중요한 지위를 차지한다. 언어능력은 인지능력과 밀접하게 관련되어 초등학교 이후의 학습성취와 연결된다. 연령에 적절하고 타당도 높은 교재나 프로그램은 아동이 실제로 사용하고 있는 언어에 기초를 두어야 한다. 따라서 아동 언어데이터베이스는 일반아동을 위한 도서, 교재, 방송 프로그램 등의 개발 과정에 필요한 기본자료를 제공할 것이다.

    라. 다문화가족의 언어 교육에 활용
    최근 다문화 인구가 급증하면서 다문화가족에 대한 다양한 지원이 이루어지고 있는데, 그 중 하나가 다문화가족에 대한 언어지원서비스이다. 각 지역에 있는 다문화가족지원센터에는 언어발달지도사들이 상주하면서 다문화가족 아동의 언어발달정도를 평가하고 언어촉진프로그램을 운영하고 있다. 다문화가족 아동의 언어목표를 설정하고 치료목표를 계획하는 데에 아동 구어데이터베이스는 매우 유용하다.
  • 연구요약
  • 본 연구의 내용및 방법은 연차별로 세 단계로 나누어 볼 수 있다. 1차년도에는 아동 어휘 데이터베이스에 관한 선행 연구를 검토하고 기존에 구축된 자료를 수집하여 분석하는 작업을 수행한다. 또 코퍼스 구축에 필요한 표준화 시안을 개발한다. 2차년도에는 표준화 시안에 따라 코퍼스 구축을 보완하고 아동 어휘 DB를 모형 수준에서 만드는 작업을 진행한다. 3차년도에는 어휘 DB의 구축을 완료하고 응용 프로그램을 개발하여 활용 방안을 모색한다.
    가. 1년차: 문헌 연구와 선행 자료 수집
    1) 문헌 연구
    먼저 국내 학술지, 학위 논문, 단행본에서 학령기 아동의 어휘에 대한 연구를 분석하여 학령 전기 한국 아동의 어휘 목록을 수집한다. 그리고 기존에 구축된 아동 언어 코퍼스의 규모, 입력 프로토콜 및 자료의 특성 등을 분석한다.
    2) 선행 자료 수집과 코퍼스 표준화 시안 개발
    수집된 어휘 목록과 코퍼스 시스템을 분석하고 가장 효율적으로 어휘 자료의 입력과 출력을 할 수 있는 코퍼스 시스템을 개발한다. 코퍼스 시스템 개발 시 구어/ 문어, 빈도, 입력/출력, 품사, 의미 부류를 고려하도록 한다. 연구팀이 개발한 코퍼스 시스템의 타당도를 검증하기 위하여 focus group interview를 실시하고 결과를 시스템 개발에 반영하는 작업을 반복한다.
    3) 어휘 자료 수집
    어휘 자료는 입력 어휘 vs. 출력 어휘, 문어 vs. 구어에 따라 수집한다. 입력 어휘는 아동에게 제공되는 어휘이며, 출력 어휘는 아동이 산출하는 어휘를 의미한다. 출력어휘로서의 문어는 본 연구의 대상이 학령전기 아동이므로 제외된다.

    ㄱ. 입력 어휘: 문어 자료
    학령전기 아동을 대상으로 하는 동화책을 수집한다. 대상으로 하는 동화책은 출처(예: 창작동화, 전래동화, 번역동화 등) 및 장르(예:동화-상상, 동화-생활 등) 별로 균형을 맞추고 최근 5년간 많이 읽힌 도서 목록에서 100 권 이상을 선정한다.
    ㄴ. 입력 어휘: 구어 자료(독백)
    최근 5년 간의 유아 용 방송 프로그램 중 50개 자료(각 30분 기준)의 내용을 전사한다. 방송 프로그램의 선정은 장르별(예: 만화영화, 교육, 드라마 등)로 균형을 맞춘다.
    ㄷ. 입/출력 어휘: 구어 자료(대화)
    구어 자료의 입출력 어휘는 아동 본인의 말은 출력 어휘로, 대화 상대방인 유치원 교사와 부모의 말은 입력 어휘로 분류하여 전사한다. 아동의 출력 어휘의 자료 수집은 (1) 학령 전기 아동 80명을 대상으로, (2) 일주일 간격으로 3회, (3) 하루 중 깨어있는 시간 6시간 동안 녹음기를 착용하고 생활하도록 한다. 대상 아동 80명은 (1) 24~35개월 20명, 36~47개월 20명, 48~59개월 20명, 60~71개월 20명으로, (2) 성별이 1:1 되도록 하며, (3) 중산층 거주 지역에 거주하는 아동으로, (4) 표준화 언어검사에서 자신의 생활연령 범주에 속하는 아동으로 한다. 입력 어휘는 (1) 유치원 교사 20명, 어머니 20명을 대상으로, (2) 일주일 간격으로 3회, (3) 아동과 상호작용하는 2시간 동안 녹음기를 착용하고 녹음하도록 한다. 대상 성인은 대상 아동의 유치원 교사와 어머니 중 각각 24~47 개월 10명, 48~71개월 10명으로 총 40명이 되도록 한다.

    나. 2년차: 코퍼스 및 어휘 데이터베이스 구축
    1) 코퍼스 구축 및 정련
    수집된 자료를 대상으로 코퍼스를 구축한다. 문어 자료는 세종 코퍼스의 표준화 방안을 참조하여 관련 정보를 태깅하여 입력하며 구어 녹음 자료는 디지털화하여 파일로 변환한다. 음성 자료는 wav파일로 변화하여 음성 분석을 위한 자료로 활용하고 녹화된 자료는 동영상 파일로 만들어 활용하도록 한다.

    2) 코퍼스에서 어휘 데이터베이스에 필요한 정보 추출
    이렇게 정련된 음성 코퍼스를 태깅하고 해당 언어 정보를 추출하기 위해서 글잡이, MonoConc for Windows Version 1.2, Extract_Tool 등의 코퍼스 분석 프로그램과 여러 기관에서 개발된 다양한 형태소 분석기, 구문 분석기를 활용한다. 어휘데이터베이스는 단어 단위를 넘어서 어휘적, 문법적 연어(collocation)나 은유 표현까지 포괄할 수 있도록 추출한다.

    3) 모형 수준의 데이터베이스 설계
    코퍼스에서 추출된 언어 자료를 바탕으로, 의사소통 장애 아동의 어휘 평가 및 교육에 적합한 어휘 DB를 모형 수준에서 설계하고 전문가 자문 회의 등의 검증과정을 거친다.

    다. 3년차 : 어휘 DB 구축 및 구축된 DB 활용 방안 연구
    1) 어휘 데이터베이스 구축
    입력/출력, 대화 참여자, 화용 정보 등을 참조할 수 있는 어휘 DB를 구축한다. 또 아동학, 언어병리학, 일반 국어학적 연구에 이용될 수 있는 형태로 DB를 확장한다.
    2) 활용 방안 연구
    구축된 DB를 언어병리학, 한국어교육 분야 등에서 이용할 수 있는 형태로 정련하고 이를 활용하기 위한 프로그램도 모형 수준에서 개발한다.
    3) 연구 평가 및 정리
  • 한글키워드
  • 구어,다문화아동,데이터베이스,말뭉치,아동언어,어휘발달,자발화,입력언어,언어평가,언어치료,언어장애,언어습득,언어발달지체,언어교육,어휘평가,표현어휘,포맷,태깅,코퍼스,출력언어,전산언어,전사,어휘분석,어휘,수용어휘,동화
  • 영문키워드
  • analysis of spontaneous production,child language,computerized system,formatting,database,corpus,coding,language acquisition,word,vocabulary,transcription,spoken language,reformatting,lexical development,language impairment
결과보고시 연구요약문
  • 국문
  • 1. 코퍼스 구축 및 정련
    기존에 구축된 아동 언어 코퍼스를 보다 정교하게 수정하고, 정련 작업을 진행하였다. 2차년까지 구축된 만 2세부터 5세까지 연령 당 20명씩 총 80명의 음성파일 자료를 2, 3차 전사하고 정련하는 데 집중하였다. 그 결과, 총 80명 중 29명(6명은 부분 전사)명분의 2차 전사와, 총 80명 중 80명분의 300발화 3차 전사 즉, 60명분의 정련과정을 완료하였다.

    2. 코퍼스에서 어휘 데이터베이스에 필요한 정보 추출 및 코퍼스 기반 연구 발표
    코퍼스에서 어휘 데이터베이스에 필요한 정보를 추출하기 위하여 전사지원도구의 버전을 지속적으로 수정하였으며, 언어분석프로그램을 개발하였다. 언어분석프로그램을 통하여 아동의 어휘발달에 관한 분석을 실시하였다. 이 과정을 통해 구어 연구에 핵심적인 연구 성과를 이루었다. 구체적인 성과는 다음과 같다.

    ㄱ. 아동 구어 데이터베이스 구축 및 정련을 실시하였음.
    ㄴ. 2차년도의 전사지원도구(CosmoScriBe 2.4)가 3차년도에는 KSTARS라는 이름으로 변경되어 1.2.3로 개선되었음. 이전 체계의 문제점을 극복하고, 정교화하였음.
    ㄷ. 80명 아동 발화의 일부를 추출하여 정련과정을 거치고, 이러한 자발화를 토대로 하여 형태소 분석 및 품사별 어휘 빈도를 추출함. 또한 정련된 자발화를 활용해 아동발화의 음운변동, 음운 특성, 어휘 발달 특성 등에 대하여 논문을 통해 발표함.
    ㄹ. 국제학술대회에서 4편의 논문과 국내학회에서 6편의 논문을 발표하였음.
    ㅁ. 연구재단 등재지에 8편의 논문을 발표하였고 2편은 현재 심사가 진행중임.

    3. 연구 평가 및 정리
    3년 계획 중 3차년은 구축된 코퍼스 자료를 정련하고 활용하는 것에 집중되어 있다. 그 성과물로 수집된 음성자료를 가지고 2차 정련까지 실시하였으며, 기초 자료를 정련하였다(NAS/ Readme/ Header system). 전사 코퍼스 80명분에서 29명분의 2차 전사를 완료하였으며 또한 80명분에서 약 300발화씩은 3차 전사까지 완성되었다. 언어발달, 언어교육, 프로그램 활용 등의 여러 분야와 관련된 연구가 진행되고 있다.
    코퍼스자료의 구축은 향후에도 더 많은 분석절차에 의해서 실증적인 연구와 지식을 축적할 수 있는 기초라고 할 수 있다. 이 과제를 통해 이러한 자료의 구축과 연구진의 융합연구과정에 대한 실전경험의 축적이 가장 큰 성과라고 할 수 있겠다.
  • 영문
  • The Development of Korean Corpus and Lexical Database for Language assessment and intervention of Preschoolers


    The purpose of this project is to establish the lexical database based on the Korean children's language corpus for the assessment and intervention for preschooler with communication disorders. In the first year of this research we developed the system for refining the database, the corpus transcribing tool, the protocol for sampling children's spoken corpus, and the transcript-entry conventions. In the first and second year 800-hour spoken language samples of 80 two- to five-year-old children, 20 children from each age group, have been recorded and the information on the participants has been organized. The transcription software tool, KSTARS was devised, which is composed of transcription and morphological analysis modules. The voice data were translated into text, and the morphological analysis were implemented. In the third year 248-hour transcriptions were revised into the second transcripts. The 300 utterances of each of 80 children were refined into third transcripts. Analyzing the 27,485 utterances and 65,783 eojeols extracted from the refined corpus, we construct the lexical databases in reference to the input and output lexicons and the conversation participants', pragmatic and grammatical informations. From the lexical databases the researchers evaluated the types and tokens of predicates and substantives in the vocabulary of typically developing preschoolers. 17 studies from this project were presented at various domestic and international conventions and published at the KCI journals. Eight masters have been produced with respect to the analysis of the corpus and development of the programme. This research have implications in that the children's spoken language corpus from the natural conversation context was established. The lexical database deserves to be used in various research fields such as the child language development, the education, the child education and the psychology.
연구결과보고서
  • 초록
  • 1. 코퍼스 구축 및 정련
    기존에 구축된 아동 언어 코퍼스를 보다 정교하게 수정하고, 정련 작업을 진행하였다. 2차년까지 구축된 만 2세부터 5세까지 연령 당 20명씩 총 80명의 음성파일 자료를 2, 3차 전사하고 정련하는 데 집중하였다. 그 결과, 총 80명 중 29명(6명은 부분 전사)명분의 2차 전사와, 총 80명 중 80명분의 300발화 3차 전사 즉, 60명분의 정련과정을 완료하였다.

    2. 코퍼스에서 어휘 데이터베이스에 필요한 정보 추출 및 코퍼스 기반 연구 발표
    코퍼스에서 어휘 데이터베이스에 필요한 정보를 추출하기 위하여 전사지원도구의 버전을 지속적으로 수정하였으며, 언어분석프로그램을 개발하였다. 언어분석프로그램을 통하여 아동의 어휘발달에 관한 분석을 실시하였다. 이 과정을 통해 구어 연구에 핵심적인 연구 성과를 이루었다. 구체적인 성과는 다음과 같다.

    ㄱ. 아동 구어 데이터베이스 구축 및 정련을 실시하였음.
    ㄴ. 2차년도의 전사지원도구(CosmoScriBe 2.4)가 3차년도에는 KSTARS라는 이름으로 변경되어 1.2.3로 개선되었음. 이전 체계의 문제점을 극복하고, 정교화하였음.
    ㄷ. 80명 아동 발화의 일부를 추출하여 정련과정을 거치고, 이러한 자발화를 토대로 하여 형태소 분석 및 품사별 어휘 빈도를 추출함. 또한 정련된 자발화를 활용해 아동발화의 음운변동, 음운 특성, 어휘 발달 특성 등에 대하여 논문을 통해 발표함.
    ㄹ. 국제학술대회에서 4편의 논문과 국내학회에서 6편의 논문을 발표하였음.
    ㅁ. 연구재단 등재지에 8편의 논문을 발표하였고 2편은 현재 심사가 진행중임.

    3. 연구 평가 및 정리
    3년 계획 중 3차년은 구축된 코퍼스 자료를 정련하고 활용하는 것에 집중되어 있다. 그 성과물로 수집된 음성자료를 가지고 2차 정련까지 실시하였으며, 기초 자료를 정련하였다(NAS/ Readme/ Header system). 전사 코퍼스 80명분에서 29명분의 2차 전사를 완료하였으며 또한 80명분에서 약 300발화씩은 3차 전사까지 완성되었다. 언어발달, 언어교육, 프로그램 활용 등의 여러 분야와 관련된 연구가 진행되고 있다.
    코퍼스자료의 구축은 향후에도 더 많은 분석절차에 의해서 실증적인 연구와 지식을 축적할 수 있는 기초라고 할 수 있다. 이 과제를 통해 이러한 자료의 구축과 연구진의 융합연구과정에 대한 실전경험의 축적이 가장 큰 성과라고 할 수 있겠다.
  • 연구결과 및 활용방안
  • 본 연구의 결과는 학령전기 아동의 구어에 관한 체계화되고 수량화된 자료로서 아동 언어발달연구, 언어병리학, 일반아동의 언어교육, 다문화 가족 아동의 언어교육 등에 다양하게 활용될 수 있다.

    가. 아동 언어발달 연구 촉진

    아동의 구어를 중심으로 한 코퍼스는 그동안 언어발달과 언어장애를 연구하는 학자들 중심으로 개별적으로 이루어져 체계적인 데이터베이스로 구축되지 못했다. 학제 간 그리고 연구자 간에도 자료의 공유가 거의 이루어지지 않았다. 최근 외국에서는 CHILDES, SALT & PEPPER와 같은 구어 데이터베이스를 기초로 다양한 언어권에서 아동 언어 습득에 대한 연구가 매우 활발하다(Brodsky, Waterfall & Edelman, 2007; Flipsen, 2006; Norio, Yasushi & Miyata, 1998; Price, Hendricks, & Cook, 2010). 또한 언어습득에 있어서 부모나 성인과 같은 입력 언어의 영향을 살펴보기 위하여, CHILDES, SALT와 같은 수량화된 자료가 사용되고 있다(Frazier, Gelman & Wellman, 2008; Goodman, Dale, & Ping, 2008). 따라서 우리나라 아동과 부모를 대상으로 한 구어 데이터베이스가 구축된다면 그 기초 자료를 바탕으로 우리나라 아동의 언어발달에 대한 체계적인 연구가 활발해질 것이며 또한 언어병리학, 국어교육, 아동학, 심리학 등 학제 간 교류가 활발해질 수 있을 것이다.

    나. 언어장애아동 평가도구 및 중재 프로그램 개발

    학령전기 언어장애아동의 언어평가와 중재는 구어를 중심으로 이루어진다. 따라서 언어 평가 도구와 중재 프로그램의 개발에 가장 필요한 것은 일반아동이 사용하는 구어 발달의 이정표이다. 일반아동들이 일상적인 의사소통에서 사용하는 어휘, 구문, 형태소에 대한 수량화된 정보는 언어 평가 도구와 언어 중재 프로그램을 개발하는 데에 매우 중요하다. Kirk et al. (1995)은 청각장애아동의 평가를 위한 낱말재인검사개발시 기존의 검사 항목이 일반아동들의 어휘 빈도를 반영하고 있지 않다는 단점을 보완하기 위하여 CHILDES(MacWhinney & Snow, 1985)의 자료를 기초로 낱말재인검사를 개발하였다. 우리나라의 아동 구어 데이터베이스는 한국어를 사용하는 언어장애아동의 말 언어 평가 도구 개발에 큰 기여를 하게 될 것이다.
    Flipsen(2006)은 SALT 자료를 기반으로 하여 아동의 자발화에서의 명료도 평가방법 네 가지를 비교하여 타당도와 신뢰도를 갖춘 말 평가 방법을 제안하고 있다. Maekawa & Storkel(2006)은 CHILDES의 자료를 이용하여 일반아동의 표현어휘 습득에 음소배열 확률(phonotatcic probability), 이웃밀도(neighborhood density), 단어 빈도, 낱말길이와 같은 변인의 영향을 살펴보았다. 일반아동의 어휘습득에 미치는 변인에 대한 정보는 자연히 언어발달장애아동의 중재 프로그램 개발에 매우 중요한 역할을 한다. 이와 같이 아동 구어 코퍼스 구축은 언어발달장애아동의 평가와 중재에 결정적인 역할을 한다. 그뿐만 아니라 언어장애 전문가들이 언어의 하위수준에서 준거참조검사를 제작하거나 언어치료 목표를 설정할 때에도 아동 구어 데이터베이스는 매우 유용하게 사용될 수 있다. 따라서 아동 구어 데이터베이스가 체계적으로 구축된다면 언어발달장애아동을 연구하고 평가 도구와 중재 프로그램을 개발하는 연구자뿐 아니라 임상 현장에 있는 언어장애전문가들이 언어장애아동의 의사소통능력을 평가하고 향상시키는 데 큰 기여를 하게 될 것이다.

    다. 일반 아동의 언어 교육에 활용

    일반 아동을 위한 교육 프로그램에서 언어 교육은 중요한 지위를 차지한다. 언어 능력은 인지능력과 밀접하게 관련되어 초등학교 이후의 학습 성취와 연결된다. 연령에 적절하고 타당도 높은 교재나 프로그램은 아동이 실제로 사용하고 있는 언어에 기초를 두어야 한다. 따라서 아동 언어 데이터베이스는 일반 아동을 위한 도서, 교재, 방송 프로그램 등의 개발 과정에 필요한 기본 자료를 제공할 것이다.

    라. 다문화 가족의 언어 교육에 활용
    일상적인 의사소통 상황에서 사용하는 어휘와 구문 중심으로 이들에 대한 평가와 교육이 이루어진다면, 타당도 높고 실생활에 매우 유용한 의사소통 중재가 실현될 것이다.
  • 색인어
  • 아동언어, 어휘, 코퍼스, 자발화, 언어발달, 전사, 형태소 분석
  • 연구성과물 목록
데이터를 로딩중 입니다.
데이터 이용 만족도
자료이용후 의견
입력