본 연구는 2년간 진행된다. 1년차 1차 3개월은 평화지수 작성을 위한 협력과 갈등 그리고 이 두 측정변수를 활용하여 작성되는 평화지수에 대한 조작정의 작성, 이에 필요한 갈등, 협력, 평화에 대한 연구를 진행한다. 2차 3개월은 작성된 조작정의를 바탕으로 빅데이터에 ...
본 연구는 2년간 진행된다. 1년차 1차 3개월은 평화지수 작성을 위한 협력과 갈등 그리고 이 두 측정변수를 활용하여 작성되는 평화지수에 대한 조작정의 작성, 이에 필요한 갈등, 협력, 평화에 대한 연구를 진행한다. 2차 3개월은 작성된 조작정의를 바탕으로 빅데이터에서 필요한 자료를 추출할 수 있는 통계프로그램 명령처리를 실행하여 생산된 자료의 오류에 대한 수정작업을 실행한다. 통상 컴퓨터가 처리하는 과정에 발생할 수 있는 오류에 대해 전문가들이 직접 확인하고 이를 해결하는 과정이 요구된다. 3차 3개월은 확보된 시계열 자료의 타당성과 신뢰성을 검정하고 통계학적 적절성인 단위근 검증, 정상성 검증, 백색소음 검증 등을 통해 시계열 분석에 요구되는 자료의 특성을 확보한다. 4차 3개월은 확보한 시계열 자료들을 활용하여 예비분석을 실시하고 자료의 정상적 활용가능성을 검증한다.
자세하게, 첫째, 1차 3개월은 계량연구에 필수적으로 요구되는 이론적 준비단계이다. 국제관계연구에서 협력, 갈등, 평화는 일반적인 개념이라고 할 수 있지만 남북관계, 한일관계에 이러한 개념이 어떤 형태로 적용될 수 있는지에 대한 이론적 검토와 논의가 필요하다. 학술적 개념의 확립과 그 개념에 대한 적절한 조작정의는 연구의 승패를 좌우할 수 있는 만큼 이에 대한 확실한 논의를 통해 이론적 대응 방안을 마련한다.
둘째, 2차 3개월은 시계열 분석을 포함한 데이터 작성에 사용하는 STATAⓇ를 활용하여 GDELT에서 자료를 추출하는 과정이다. GDELT는 1979년부터 2013년까지의 기간 동안 신문기사를 단순한 형태로 변경한 자료의 크기만 3기가바이트에 도달할 정도로 방대한 양이 포함되어 있으며 이 자료는 2000년을 기점으로 자료의 양이 극적으로 증가했다. 전 세계 뉴스자료를 종합했을 때 1979년 자료는 1년 동안 발생한 전체 자료 크기가 10메가바이트 수준이었으나 2000년에는 100메가바이트로 급증하였고, 2008년은 320메가바이트, 2011년에는 820메가바이트로 데이터의 양이 증가하고 있다. 보도의 양 자체가 80배 가까이 증가했기 때문에 시계열 자료의 시기별 특성을 수평적으로 비교하는 것은 이론적 의미가 크지 않지만 전체시기에 대한 자료를 확보하는 것은 과학적 접근의 시도라는 점에서 의미가 크다.
프로그램을 구성하는 작업의 특성상 하나의 프로그램을 구성하여 반복해서 적용할 수 있다는 장점에도 불구하고 방대한 양의 자료를 시계열 간격설정, 유관 양자관계 추출, 사건의 분리, 사건의 빈도 측정, 분리된 사건에 가중치의 적용, 각각의 변수의 누적과 같은 복수의 과정을 통합하는 작업은 상당한 시간이 소요된다.
셋째, 3차 3개월은 개념정의와 시계열 자료작성의 두 과정을 통합하는 작업이다. 작성된 시계열 자료는 이론적으로 개념을 적절하게 반영해야하지만 통계학적 기준을 충족시켜야 한다. 통계학적 적절성 검증을 충족시키지 못하는 시계열 자료는 분석이 실질적인 의미가 없게 되는 문제점이 있다. 이러한 문제를 해결하는 과정에 데이터에 대한 차변 또는 로그를 취하여 동일한 자료를 변경하기도 하지만 이 과정을 통해서도 문제가 해결되지 못하는 경우 변수에 대한 보다 적극적인 변형이 요구되기도 한다. 이 과정에 대한 국제정치상의 이론적 및 통계적 정당성이 부여될 수 있는 학문적 노력을 기울일 것이다.
넷째, 4차 3개월은 세 과정을 통해 확보한 시계열 자료들을 활용하여 예비분석을 실시하고 통계학적 분석이 양자관계에서 가지는 이론적 및 정책적 적실성이 어느 정도 있는지에 대한 예비조사와 이에 대한 논의 및 검토 과정을 진행한다.
2차 연도에는 작성된 시계열 자료를 통하여 개별 양자관계에 대한 분석을 시도한다. 공동연구자들이 특화된 양자관계에 대해 이론적 배경, 기존연구, 가설수립, 계량분석, 분석의 논의, 정책제언으로 구성되는 연구를 수행하는데 2년차는 두 시기로 분리하여 첫 번째 6개월은 사례분석기법을 두 번째 6개월은 통계분석기법을 적용하여 연구를 진행한다.
구체적으로 첫째, 1차 6개월은 사례분석 기법을 적용하여 국제관계의 전통적 연구방법을 시계열 자료에 적용하여 자료의 타당성과 신뢰성을 확보하고 정책제안을 통한 설명의 적실성을 입증함으로써 자료의 효율성을 제고한다. 본 연구의 한반도 주변 주요 양자관계 조합은 ① 남북관계, ② 한미관계, ③ 한일관계, ④ 한중관계, ⑤ 미중관계로 설정하고 각각에 대해 지역전문가들이 인지하고 있는 양자관계의 주요사건이 본 연구에 적절히 반영되어 있는지 집중적으로 살펴본다.
둘째, 2차 6개월은 통계분석 기법을 적용하여 각각의 양자조합에 적용할 수 있는 시계열 분석모델을 설정하고 이를 실시한다. 공동연구자 중 1명은 데이터 작성과 분석에 집중한다.