연구과제 상세정보

https://www.krm.or.kr/krmts/link.html?dbGubun=SD&m201_id=10086114&res=y

인문 “스몰 데이터” 연구 방법론과 사례 연구: 19세기말 영국 정기간행물 비평 담론 - 주간지 『런던』을 중심으로
A Methodological Case Study in “Small Data” in Humanities: Discourse of Criticism in the Nineteenth-Century British Periodicals – The Weekly <London>

연구자가 한국연구재단 연구지원시스템에 직접 입력한 정보입니다.

사업명	신진연구자지원사업& #40;인문사회& #41; [지원년도 신청 요강 보기 ]
연구과제번호	2019-S1A5A8-2019S1A5A8034398
선정년도	2019 년
연구기간	2 년 6 개월 (2019년 05월 01일 ~ 2021년 10월 31일)
연구책임자	윤미선
연구수행기관	순천향대학교
과제진행현황	종료

과제신청시 연구개요

연구목표
인문학의 중요한 연구 분야로 부상한지 적지 않은 시간이 흘렀음에도 불구하고 디지털 인문학은 국내의 인문학 연구 환경에서는 여전히 낯선 분야이다. 본 연구는 디지털 인문학이 어떤 방식으로 기존의 인문학 연구에 새로운 통찰을 가져다 줄 수 있는지 영문학 분야에 ...

인문학의 중요한 연구 분야로 부상한지 적지 않은 시간이 흘렀음에도 불구하고 디지털 인문학은 국내의 인문학 연구 환경에서는 여전히 낯선 분야이다. 본 연구는 디지털 인문학이 어떤 방식으로 기존의 인문학 연구에 새로운 통찰을 가져다 줄 수 있는지 영문학 분야에서 가능한 데이터 분석적 연구를 사례로 제시하고 방법론을 검토함으로써 이를 통해 디지털 인문학에 대한 의식을 고취하고 이와 같은 방법론을 확산하는 것을 목표로 한다. 동시에 영문학 분과에서 시작된 정기간행물 연구가 역사학, 비평 이론, 과학사와 미디어학, 정보 공학까지 포괄하는 학제간 연구, 융합 연구의 출발점이 될 수 있음을 널리 이해시키고자 한다.
본 지원자가 주목하는 방법론은 “스몰 데이터” 연구라고 이름 할 수 있다. 빅데이터 시대를 맞아 인문학에서도 과거의 자료에 대해 의미 있는 양적 연구의 가능성이 높아졌다. 그러나 한편으로는 양적 연구가 “숫자”로 잡히지 않는 인간의 삶을 치밀하게 천착하는 인문학에서 별다른 의미를 생성하지 못할 뿐 아니라 그 정신과 배치될 수 있다는 회의도 만만치 않다. 이에 본 연구는 무작위적 데이터 대신 경계가 특정되는 데이터를 선택하여 양적 연구 뿐 아니라 질적, 비판적 분석을 겸할 수 있는 “스몰 데이터” 연구야말로 정보화 시대의 인문학적 대안임을 보여주고자 한다.
의미심장하게도 “스몰 데이터”적 연구의 기반은 디지털화가 깊이 진행되기 이전에 닦여졌다. 영문학 분야에서 발전한 19세기 정기간행물 연구는 1970년대를 거치며 이미 널리 알려진 작가 위주 연구의 한계를 인지하고, 당대의 상상을 초월하여 번성했었던 문학 생산 시스템의 물적 기반으로서 19세기 영어권의 정기간행물을 문헌적으로 복원하는데 노력을 기울였다. 정기간행물 연구는 1980년대와 90년대를 거치며 신역사주의와 문화유물론을 만났고 2000년대 들어 “미디어적 전회”를 맞음으로써 문학 연구가 담론과 지식의 계보학은 물론 문화사적, 미디어사적 연구로 확장하는데 일조를 하였다. 이 과정에서 발전한 질적, 비판적 분석 방법론은 디지털 시대의 양적 데이터 연구를 비판적으로 수정하는 데에 적격이다.
본 연구가 사례로 채택하는 비평 주간지『런던』(London, 1877-1879)은 그 중요성에도 불구하고 단명했으며 편집자인 시인 헨리(W. E. Henley, 1849-1903) 가 아직 무명이었기 때문에 그 본산인 영·미에서도 아직까지 독자적인 주목을 받지 못했다. 이에 이 잡지를 거의 새로 발굴하다시피 하여 일정 부분 연구를 진행해 온 본 연구자의 독창성과 학문적 기여는 매우 크다고 자부한다. 이제 본 연구를 통해 주제 연구에서 나아가 간행물 전체를 데이터로 바라보는 연구로 도약한다면 영문학과 정기간행물 연구 분야를 넘어서서 전체 인문학 발전에 있어서 그 의미는 더욱 크다고 하겠다.
결국 디지털 인문학 연구의 수행에는 디지털 기술 숙련 이전에 인문학이 데이터적 시야를 요구한다는 사실을 깊이 받아들이는 것이 필요하다는 뜻이다. 본 연구는 19세기의 문학 비평과 문화, 더 나아가 영어권에서의 비평이라는 제도를 이해하는 일에서 데이터 분석적 접근이 얼마나 필수불가결한 것인지를 드러냄으로써 이러한 시각의 필요성을 명확히 보여줄 것이다.

기대효과
1) 디지털 인문학의 필요성에 대한 의식 제고
2) 빅데이터에 바탕을 둔 양적 연구와 대비되는 인문학 “스몰 데이터” 방법론의 확산
3) 19세기 영국 문학과 더 나아가서는 근대 유럽의 역사, 철학 연구에서 정기간행물 연구의 필수불가결함에 대한 인식 고취
4) 프린트 ...

1) 디지털 인문학의 필요성에 대한 의식 제고
2) 빅데이터에 바탕을 둔 양적 연구와 대비되는 인문학 “스몰 데이터” 방법론의 확산
3) 19세기 영국 문학과 더 나아가서는 근대 유럽의 역사, 철학 연구에서 정기간행물 연구의 필수불가결함에 대한 인식 고취
4) 프린트 미디어와 디지털 연구 방법론을 포괄적으로 다루는 학제간 · 융합적 연구의 필요성을 공유하고 장기 집단 연구 프로젝트 기획을 고무시킴

연구요약
본 연구는 디지털 인문학에서 빅데이터와 대비되는 개념으로서 “스몰 데이터” 방법론을 영문학 분야에서 제공 가능한 두터운 사례 연구를 통해 제시한다.
“스몰 데이터”의 대상이 되는 중심 사례로는 1877년에 창간되었다가 1879년에 폐간된 영국의 비평 주간지 『런던 ...

본 연구는 디지털 인문학에서 빅데이터와 대비되는 개념으로서 “스몰 데이터” 방법론을 영문학 분야에서 제공 가능한 두터운 사례 연구를 통해 제시한다.
“스몰 데이터”의 대상이 되는 중심 사례로는 1877년에 창간되었다가 1879년에 폐간된 영국의 비평 주간지 『런던』을 선택하고 분석적 비교 대상으로 19세기 중반 이전에 창간된 주류 비평주간지 다수와 『런던』의 편집자 헨리가 이후 편집했던 다른 비평지들인 『내셔널 옵저버』(National Observer, 1888-1897)와『뉴 리뷰』(New Review, 1891-1896)를 포함한다.
『런던』이 “스몰 데이터” 연구의 대상으로 적절한 이유는 먼저 데이터 분량이 적당하기 때문에 디지털 기술에 기대어 이루어지는 양적 연구를 일일이 텍스트를 읽고 분석하는 전통적 질적 해석과 조우시키기 용이하다는 점이다. 이보다 더욱 핵심적인 것은 본 연구자와 기존의 영문학 연구가 이 데이터를 의미 있는 것으로 판단하였다는 것이다.
『런던』은 비평주간지, 더 나아가서는 19세기 영어권의 정기간행물 역사에서 실험적인 위치를 차지한다. 기존의 비평주간지들의 전통을 이어받아 정치, 사회적 이슈에 대한 긴밀한 비평을 전개했지만 향후 등장할 문학·예술 전문 잡지를 예견하며 문학·예술난의 비평을 독자적 분과로 만드는 데에 큰 노력을 기울였기 때문이다. 특히 진지한 문학의 반열에 채 오르지 못 했던 소설을 장르로 나누고 시리즈 비평을 실음으로써 문학 비평을 조직화했다. 비록 『런던』은 단명했지만 이때 발전된 비평 용어와 분류법이 이후 영문학이 학제로 자리 잡는 과정에서 끼친 영향은 결코 작지 않다. 따라서 『런던』의 비평담론을 연구하는 것은 여러 사례 중 하나의 개별 사례를 연구하는 것을 넘어선다. 물론, 이것이 보편 사례가 되는 것은 아니다. “스몰 데이터”의 개념에는 바로 개별과 보편 사이에서 이 양자를 매개하는 특수성 자체를 중요하게 생각하는 관점이 담겨 있다.
데이터 연구의 가설과 모델은 위와 같은 선행 질적 연구의 바탕에서 세워질 것이다. 먼저, 『런던』에는 세 종류의 비평이 존재한다. 작품에 대한 본격 비평, 작가 카테고리에 따른 시리즈 비평, 그리고 주간 서평이다. 각 종류에서 주로 사용하는 비평은 용어부터 다르다는 것이 본 연구의 가설이다. 이 가설은 전통적인 해석학적 연구에 따라 세워졌는데, 이 해석이 실제로 그러한지 여부는 두터운 독해를 바탕으로 하는 전통적 방법 내에서 검증될 수 있는 것은 아니다. 이때 간행물 텍스트 전체를 데이터로 다루어 디지털 기술을 이용해 그 언어적 특성을 캐는 텍스트 마이닝(text mining) 기법을 사용한다면 비평적 용어의 종류와 출현 빈도, 함께 묶이는 단어, 수사전략 등의 실체가 드러남으로써 위 가설의 타당성 여부가 밝혀질 것이다. 해석의 객관성이 새로운 차원에서 드러나는 것이다.
이때의 객관성은 소위 자연과학의 객관성과는 다르다. 자연과학에서의 객관성도 기존 실험 제도의 틀과 실험자의 바이어스에 기댄다는 것이 현재의 학문적 관점이다. 이 점을 상기해 봤을 때 빅데이터만을 근거로 사실성 자체를 판단하는 정보 과학의 경향은 비판받아 마땅하다. 본 연구는 “스몰 데이터” 방법론을 통해 이러한 경향 자체를 이중으로 비판하게 될 것이다. 먼저 연구대상의 선택과 설정된 가설 자체가 해석적 판단을 바탕에 둔다는 인식을 바탕으로 데이터 검증 결과를 통해 해석의 주관성이 아니라 채택한 판단의 틀을 재검토하는 것이다. 재검토에는 다시 해석적 방법이 개입될 수밖에 없다. 이 점이 바로 “스몰 데이터” 방법론이 인문학적 데이터 연구 방법론으로 타당한 이유이다. 두 번째로 본 연구는 『런던』이 전통적 비평의 해석적 방법을 쓰면서도 서평란을 통해 거시 데이터적 관점을 채택하여 스스로의 해석적 방법을 정당화하려 한 것에 대한 연구이기 때문에 19세기 비평의 인문학적 데이터 연구 방법론 자체에 대한 반성적 연구가 된다.

결과보고시 연구요약문

국문
본 연구는 영문학 분야의 디지털 인문학 연구로서, 먼저 19세기 영국의 정기간행물인 『런던』(London, 1877-79)의 문예란 ("The Bohemia")을 데이터화 했다. 그 후 a) 텍스트 마이닝을 통해 이 비평주간지가 생산했던 비평 담론의 성격을 분석하고 b) 이를 "꼼꼼히 읽기" ...

본 연구는 영문학 분야의 디지털 인문학 연구로서, 먼저 19세기 영국의 정기간행물인 『런던』(London, 1877-79)의 문예란 ("The Bohemia")을 데이터화 했다. 그 후 a) 텍스트 마이닝을 통해 이 비평주간지가 생산했던 비평 담론의 성격을 분석하고 b) 이를 "꼼꼼히 읽기" 결과에 비추어 해석함으로써 양적 분석의 의의를 구체적으로 살핀다. 마이닝의 구체적 기법으로는 통계 비교, 형태소 분석, 토픽 모델링, 문서 벡터화를 적용했으며, 엑셀, 구글 스프레드 시트, NLTK, LDA, Doc2Vec이 사용되었다. 분석 결과 『런던』의 문예란은 매주 출판되는 대중 시장용 도서에 대한 서평과 기획 및 주요 비평란에서 서로 다른 어휘와 비평 논리를 적용함으로써, 19세기말 소설의 고급 문학 장르 확립 과정에서 젠더 차이를 핵심으로 하는 문학장의 이중적 구조 생산에 기여했음이 확인되었다. 이 결과는 영문학 연구에서 애초부터 데이터 연구적 성격을 지녔던 정기간행물 연구의 의의를 드러내는 한편으로, 빅 데이터 분석 방법의 신뢰성을 높이는 시금석으로서 질적 분석이 가능한 범위의 텍스트를 대상으로 하는 “스몰 데이터”의 필요성과 효용을 밝힌다.

영문
This study is a work of digital humanities in the field of the 19th-century study of English Literature. Its object is the critical weekly <London> published between 1877 and 1879, especially its section for literature and culture, "The Bohemia." Firs ...

This study is a work of digital humanities in the field of the 19th-century study of English Literature. Its object is the critical weekly <London> published between 1877 and 1879, especially its section for literature and culture, "The Bohemia." Firstly, the texts were made into an analyzable data set. Secondly, they were text-mined with an aim to discern the characteristics of the weekly's critical discourse. The result of this quantitative analysis is interpreted against that of the close-reading based qualitative analysis, proving the relevance of the digital humanities approach in understanding the 19th-century critical discourse. The mining techniques applied in this analysis include comparative statistics, morphological analysis, topic modeling, and document vectorization. The programs used include MS Excel, Google Spreadsheet, NLTK, LDA, and Doc2Vec. As a result of the study, <London> has been proved to contribute to the construction of the English literary field in the late 19th century as the one with the dual structure based on the gender division. It commanded differentiated critical logic with differentiated critical terminologies in the special review section from that in the section for the mass(imagined as feminine)-reading book reviews. This finding reveals the importance of the periodical studies, a natural domain of data studies, in understanding the 19th-century English literature and culture. The result also confirms the need of the concept of "small data" that allows a comparison of the quantitative analysis result with that of a qualitative interpretation; it can work as a touchstone for relevant methodologies in the big-data study of discourse.

연구결과보고서

초록
본 연구는 영어영문학 분야의 디지털 인문학(Digital Humanities) 연구로서 19세기 영국의 정기간행물인 『런던』(London: A Conservative Weekly, 1877-79)을 대상으로 a) 이 비평주간지가 생산했던 담론의 성격을 문학 비평 영역에 초점을 두어 양적으로 분석하고 b) ...

본 연구는 영어영문학 분야의 디지털 인문학(Digital Humanities) 연구로서 19세기 영국의 정기간행물인 『런던』(London: A Conservative Weekly, 1877-79)을 대상으로 a) 이 비평주간지가 생산했던 담론의 성격을 문학 비평 영역에 초점을 두어 양적으로 분석하고 b) 이를 연구책임자가 기존에 수행했던 질적 연구와 비교하는 과정에서 양적 분석 방법론을 평가하여 양적 분석의 의의를 살피는 동시에 새롭게 필요한 방법론의 방향을 제시하는 것을 목적으로 한다. 이를 통해 빅 데이터와 대조되게 꼼꼼히 읽기(close reading)에 바탕을 두는, 질적 분석이 가능한 범위의 텍스트를 대상으로 하는 “스몰 데이터”의 개념을 정립하고, 확장성을 전제로 하는 데이터 기반 연구에서 그 효용을 드러내는 것 또한 연구의 목적으로 한다.
본 연구는 연구 기간 대부분을 데이터 셋 확립에 사용하고 이후 집중적으로 데이터 분석에 들어가는 방법론적 특징이 있다. 이에 따라 1년차에는 연구 보조원을 활용하여 분석 대상인 『런던』의 텍스트를 촬영한 이미지 파일을 OCR로 텍스트로 전환하는 과정을 거쳤다. 그리고 전환된 텍스트에 오류가 없도록 이를 검수하면서 "꼼꼼히 읽기"를 진행하는 한편으로 디지털 인문학 방법론에 대한 연구, 분석용 프로그램을 직접 코딩/수정할 수 있는 언어인 파이썬 학습 및 데이터 분석(텍스트 마이닝)을 위한 툴 활용 학습을 수행했다. 2년차에는 이러한 방법론적 연구를 지속적으로 수행하는 한편, 연구 보조원을 활용하여 1년차에 만들어진 텍스트를, 분석을 위한 범주 설정 후 이에 맞춰 엑셀화 하는 작업을 수행했다. 이후 연장된 기간인 3년차 (6개월 연장)에 들어서 엑셀화된 자료를 데이터 분석 전문가로부터 검수를 받아 오류를 수정하고 사용 가능한 "스몰 데이터" 데이터 셋으로 완성하였다. 공식 연구 기간을 마친 후 현재까지 구글스프레드싯, NLTK, DMS, Doc2Vec 등 통계 툴과 기계학습 알고리즘을 사용하여 데이터 분석을 진행 중이다. 분석에는 기초 통계 비교, 형태소 분석, 토픽 모델링, 문서 벡터화 방법론을 적용한다.
분석 결과는 잠정적으로 다음과 같은 내용을 포함한다. 1) "Mudie's" 타이틀 하의 서평 (대중 독서 시장 비평)과 기획 비평란에서 각각 출현하는 모든 형태소 (단어 + 문장기호)의 절대 빈도 및 상대 빈도 비교를 통한 핵심 어휘를 판별한 결과, 한 예로 "Mudie's"에는 작가를 나타내는 말로 writers로 복수가, 기획 비평에는 writer라는 단수가 더 다수 출현한다. 이는 사소한 차이가 아니라 『런던』이 대중 독서 시장용 저서의 저자를 하나의 경향성을 가진 집단으로 치는 경향이 있음을 드러내는 중요한 차이다. 이렇게 발견된 사실에 대한 해석은『런던』과 19세기 정기간행물 및 문학 문화에 대한 질적 이해를 통해서만 가능했지만, 한편으로 이 사실 자체는 예상했던 내용을 훌쩍 넘어서는 새로운 발견이다. 양적 접근을 통하지 않았다면 쉽게 생각지 못했을 『런던』의 이중적 비평 담론 실천의 언어적 증거를 구체적으로 찾게 된 것이다. 이는 질적 연구와의 상호 검증이 가능한 “스몰 데이터” 연구의 의의를 고스란히 보여준다.
2) LDA는 기계학습에 기반해서 데이터 전체에서 다루어진 주요 토픽을 핵심 어휘 클러스터를 통해 드러내준다. 이를 활용한 토픽 모델링 및 문서 벡터화를 통한 비평문들의 의미 양상을 분석한 결과, "Mudie's" 비평과 본격 비평란의 차이가 가시적으로 드러났다. 가령 『런던』의 본격 비평란의 데이터 전체를 7개의 군으로 분류하면 1)군으로 writer, man, james, novel이 들어간 클러스터가 나타난다. 이는 writers, lady, Chapman and Hall 등이 하나의 클러스터로 나타난 "Mudie's"와는 구별되는 결과로, 미국 소설로 정의되는 James 소설의 비판적 수용과 함께 『런던』이 새로운 “남성적” 소설이 나아갈 바를 정의했다는 본 연구자의 작가 중심 선행 연구 결과에 해당되는 내용을 한눈에 드러내 주었다. 이는 예상치 못한 놀라운 결과였다. 한편, Doc2Vec을 활용하면 각 문서가 지니는 의미 형태의 평균치를 찾아냄으로써 유사한 문서 형태의 가짓수와 각 형태의 비중을 파악할 수 있다. “Mudie's” 항목에 해당하는 문서들은 특히 한 가지 의미 형태가 압도적으로 다수로 드러났는데, 이는 대중서 서평 항목이 거의 기계적인 규칙에 따라 쓰였다는 증거가 된다. 꼼꼼한 읽기 과정에서 두드러지게 분별되는 어떤 “경향성”이 주관적 판단에 의한 것이 아니라는 사실을 이렇게 통계적인 분석을 통해 교차 검증할 수 있는 것이다. 이또한 교차 검증 가능한 “스몰 데이터”가 담론에 대한 빅데이터 연구의 신뢰도를 고무하는 시금석이 될 수 있음을 바로 증명하는, 예상을 뛰어넘는 놀라운 결과라고 할 수 있다.

연구결과 및 활용방안
본 연구는 연구 결과로 1) 『런던』문예란 ("The Bohemia")의 데이터 셋 2) 텍스트 마이닝으로 얻어진 『런던』에 대한 양적 분석 결과를 "꼼꼼히 읽기"에 바탕을 둔 질적 분석결과와 대조 시켜 평가하는 19세기 비평 담론 연구 논문 3) 디지털 인문학 방법론을 평가하는 ...

본 연구는 연구 결과로 1) 『런던』문예란 ("The Bohemia")의 데이터 셋 2) 텍스트 마이닝으로 얻어진 『런던』에 대한 양적 분석 결과를 "꼼꼼히 읽기"에 바탕을 둔 질적 분석결과와 대조 시켜 평가하는 19세기 비평 담론 연구 논문 3) 디지털 인문학 방법론을 평가하는 메타 연구 논문을 생산한다.
위 결과물들은 영문학 분야에서 뿐만 아니라 국문학과의 학제간 연구에서 디지털 인문학의 필요성에 대한 인식을 제고할 것이다. 1) 수립된 데이터 셋은 디지털 인문학 교육과 연구 자문에 선행 예시 및 실습 자료로 활용될 수 있다. 이미 두 명의 영문학 후속 세대 연구자 2인이 보조원으로 연구에 참여하면서 데이터 셋을 확립하는 과정에 대해서 훈련을 받았으며 어떤 목적에 이러한 연구가 필요한지 인식을 새롭게 했다 2) 정기간행물 담론 연구는 디지털 인문학과 많은 문제 의식을 공유한다. 『런던』의 비평 담론을 양적으로 이해하는 것은 19세기 후반 영국 문학장을 이해하는 일환이다. 위 자료와 분석은 19세기 비평 담론 "빅데이터"와 그 연구의 일부가 될 것이다. 이를 위해 국내 및 국제 공동 연구를 기획할 수 있다. 3) 19세기 영국의 비평 담론은 20세기 전환기 한국의 문학 및 담론의 형성에 연관된다. 그 과정과 물리적 네트워크를 연구하는 학제간 연구의 초석으로 활용할 수 있다.

색인어
『런던』(1877-1879), 비평 담론, 디지털 인문학, 텍스트 마이닝, 형태소 분석, 클러스터링, 토픽 모델링, 문서 벡터화

이 연구과제의 신청시 심사신청분야(최대 3순위까지 신청 가능)
1순위 : 인문학 > 영어와문학 > 영문학 > 영미문학비평
2순위 : 인문학 > 영어와문학 > 영문학 > 18/19C영미소설

연구성과물 목록