이번 연구는 IT종합정보포털인 ITmedia에서 2017년 1월 1일-2017년 12월 31일의 IT관련 기사를 분석 자료로 하여 어휘를 추출・분석한다. ITmedia는 IT관련 기사를 2004년부터 현재에 이르기까지 연도별, 월별, 일별 분류가 가능하여 지난 기사까지도 모두 볼 수 ...
이번 연구는 IT종합정보포털인 ITmedia에서 2017년 1월 1일-2017년 12월 31일의 IT관련 기사를 분석 자료로 하여 어휘를 추출・분석한다. ITmedia는 IT관련 기사를 2004년부터 현재에 이르기까지 연도별, 월별, 일별 분류가 가능하여 지난 기사까지도 모두 볼 수 있다. ITmedia는 일본의 IT전문 뉴스로서 스마트폰의 앱으로도 설치하여 볼 수 있는 사이트로 매일 새롭게 올라오는 일본의 최신 IT관련 정보를 한눈에 볼 수 있는 자료라 생각한다.
어휘 분석에 사용할 KH Coder라는 것은 樋口耕一가 개발한 소프트웨어로, 텍스트형(문장형) 데이터를 통계적으로 분석하기 위한 프리소프트웨어이다. 앙케이트의 자유기술・인터뷰기록・신문기사 등, 여러 가지 사회조사데이터를 분석하기 위해 제작되었다. IT관련 기사를 모두 추출하여 KH Coder를 이용하여 어휘를 분석한다. 분석된 어휘를 바탕으로 어종별 분류와 어구성별 분류를 실시하고 전체 어휘수(述べ語数)와 반복되어 나오는 어휘(異なり語数)의 출현빈도를 세어 가장 많이 나오는 어휘부터 제시하여 어휘 학습에서 우선순위를 결정할 수 있게 된다.
본 연구의 핵심이 될 본론에 해당하는 부분이 될 어휘 분류는 크게 어종별 분류와 어구성별 분류이다.
◉어종별 분류 (고유성분, 비고유성분, 혼종어)
①고유성분 : 히라가나어휘 ⇒ 「はな」 「ワンワン」
(和語) 한자어휘 ⇒ 「山、高い」
②비고유성분 : 한자어휘 ⇒ 「工業、大根、愛、当然」
(외래성분) 가타카나어휘 ⇒ 「ミルク、クラス」
로마자어휘 ⇒ 「SL」
③혼종어 : ⇒ 「あんパン、表玄関、極細ボールペン」
◉어구성별 분류 (단순어와 합성어)
①단순어(1차어) ⇒ 「日、光る」와 같은 X, Y의 구조
②합성어(다차어) : 복합어(복합법) ⇒ 「川上」 (X+X), 「ちちはは」 (X・Y)
첩어(중복법) ⇒ 「山々」 (X+X, Y+Y), 「二度と再び」 (X+X')
파생어 ⇒ 「お山」 (x+X), 「子ども、」 접미사계 (Y+y)
이상의 어휘 분류를 기준으로 하여 어종별 분류와 어구성별 분류를 실시하고 각 분류 내에서 품사별 분류를 다시 실시한다. 일본어의 품사는 10품사로 동사, 형용사, 형용동사, 명사, 부사, 연체사, 접속사, 감동사, 조동사, 조사가 여기에 해당한다. 10품사 중 부사, 연체사, 접속사, 감동사, 조동사, 조사는 IT관련 어휘와의 직접적인 관계가 약하다고 판단되므로 연구 범위에서 제외하고, 동사, 형용사, 형용동사, 명사만을 조사의 범위로 제한한다. 어종별과 어구성별로 분류하고 하위 분류로 각각의 동사, 형용사, 형용동사, 명사로 분류하여 전체 어휘수(述べ語数)와 반복되어 나오는 어휘수(異なり語数)를 조사하여 일본IT관련어휘의 어휘학습의 우선 순위를 선정할 수 있는 효과를 거둘 수 있다.
또한, IT관련 명사 어휘 중 일본에서의 용어와 한국에서의 용어가 차이를 보이는 것을 따로 모아 고유어휘, 한자어휘, 가타카나어휘로 분류하여 일본어어휘와 대응하는 한국어어휘를 살펴본다. 가타카나로 표기된 외래어의 경우, 한국에서 사용되는 어휘와 일본어에 사용되는 어휘의 대응 양상을 조사하고 일본어어휘에 대응하는 한국어어휘가 없는 경우 적절한 한국어어휘를 제안함으로써 일본IT기업의 취업을 위해 준비하는 학습자들에게 좋은 정보가 될 수 있을 것으로 생각된다.