연구과제 상세정보

https://www.krm.or.kr/krmts/link.html?dbGubun=SD&m201_id=10091619&res=y

대화분석을 통한 인간과 기계와의 실시간 상호작용 연구
Analyzing human-machine interaction through conversation analysis

연구자가 한국연구재단 연구지원시스템에 직접 입력한 정보입니다.

사업명	연구그룹형(국내형) [지원년도 신청 요강 보기 ]
연구과제번호	2019-S1A5A2A03-2019S1A5A2A03042244
선정년도	2019 년
연구기간	3 년 (2019년 07월 01일 ~ 2022년 06월 30일)
연구책임자	이요안
연구수행기관	서강대학교
과제진행현황	종료
공동연구원 현황	노은석(香港市立大學) 조은경(서강대학교) 서정연(서강대학교) 구명완(서강대학교)

과제신청시 연구개요

연구목표
(1) 대화분석을 이용한 대화 인터페이스의 개선
본 연구는 인문사회의 기반을 둔 대화분석(Conversation Analysis)의 연구방법을 이용하여 컴퓨터 공학 분야에서 개발된 대화 인터페이스에서 나타난 한계점을 분석하고 이를 보완하는 새로운 해결방식을 도출하여 대화 모 ...

(1) 대화분석을 이용한 대화 인터페이스의 개선
본 연구는 인문사회의 기반을 둔 대화분석(Conversation Analysis)의 연구방법을 이용하여 컴퓨터 공학 분야에서 개발된 대화 인터페이스에서 나타난 한계점을 분석하고 이를 보완하는 새로운 해결방식을 도출하여 대화 모델을 개발에 적용하는데 목적이 있다. 이를 위해서 다음의 세부목표를 설정하여 제시한다.

가) 공학적 자연어 처리와 국내외 대화 인터페이스 분석
사람과 기계의 대화 인터페이스를 발전시켜온 공학적 연구 내용과 방법을 세밀히 조사하여 규명한다. 공학에서는 자연어처리와 인공지능 혹은 상호작용 인터페이스의 분과에서 대화인터페이스를 연구해왔는데 이는 사람간의 대화를 연구한 대화분석(Conversation Analysis)과는 전혀 다른 이론과 방법론에 근거한다. 본 연구에서는 공학적 대화 인터페이스에 대한 선행연구와 대화 인터페이스를 개발 중인 실험실의 작업에 대한 관찰연구를 통하여 공학적 문제해결 방식을 조사하고 개발된 대화모듈의 장단점을 파악한다.

나) 휴먼 대화 데이터 및 휴먼-기계 대화 데이터베이스 구축과 분석
본 연구에서는 보다 정확한 분석을 위해 휴먼 데이터와 휴먼-기계 대화 데이터베이스를 비교 분석하여 향후 인터페이스를 개선하는 근거로 삼고자 한다. 공학적 접근 방식은 목표가 되는 언어기능을 정하고 이를 수행하는 언어의 범위를 한정하는데 이런 방식은 사람사이에 일어나는 복잡다단한 실시간 대화와는 거리가 있다. 이러한 간극을 줄이기 위해서 우선 사람사이의 대화와 사람과 기계의 대화에 관한 데이터베이스를 구축해야 한다. 특히 목적 지향성 시스템(예: 건물안내 혹은 서비스전화 응대)과 일반적인 대화를 수행하는 채팅으로 나누고 두 데이터베이스의 유사점과 차이점을 규명한다.

다) 대화분석에 근거한 데이터 형식화 및 대화모델개발
본 연구를 통해 구축된 데이터베이스를 인문사회학적 접근방식인 대화분석(CA) 방식으로 CA에서는 대화의 진행방식을 세밀히 전사(Transcribe)하여 대화참여자가 어떤 방식으로 말차례(Turn)을 주고받는지를 밝히는 순차분석(Sequential Analysis)이 중요하다. 순차분석은 말차례간의 관계에 집중하여 화자와 청자가 서로를 어떻게 대화의 내용과 형식을 조절해나가며 소통하는지를 조사하므로 참여자의 입장을 최대한 구현하는 연구방법이다. 또한 순차분석으로 발견된 대화의 규칙적 패턴(예: 말차례 (turn-taking), 수정(repair). 선호조직(prefernece))등이 공학적 인터페이스의 모듈로 인식되어 기계가 인식할 수 있는지를 적용해보고 문제점에 대한 개선방안을 모색하는 것이 세 번째 목표이다.

라) 교육자료 및 교육시스템 구축
현재 국내의 대화 인터페이스는 북미나 유럽에 비해 다소 뒤쳐져 있는 것으로 평가되고 있다. 따라서 영어로 되어 있는 인터페이스를 모델 삼아 국어 담화 데이터의 체계적 분류가 시급한데 본 연구를 통해 대화 인터페이스개발을 위한 말뭉치 자료를 학보하고 정리하고자 한다. 이러한 자료는 담화 연구에 관심이 있는 국내 학자들에게 유용할 것이며 특히 융합적 인재를 양성하기 위한 교육기관이나 프로그램 개발자에게도 인문사회의 연구방법과 공학적 연구방법을 비교할 수 있는 중요한 자료가 될 것이다.

마) 대화분석의 아젠다 확장
본 연구를 통하여 사람간의 상호작용에 국한되어 있던 대화분석의 연구대상을 사람과 기계와의 상호작용으로 확장시키는데 목적이 있다. 스마트폰이나 인터넷 등이 상용화되어 누구나 쉽게 사용하는 것처럼 미래에는 지능형 로봇이 다양화되어 이들과의 상호작용이 인간의 사회생활에 중요한 자리를 차지하게 될 것이다. 본 연구를 통해서 기계와의 상호작용이 어떤 방식으로 전개되는지 그리고 인간의 사회성에 어떤 방식으로 영향을 끼치는지를 규명하고자 한다.

기대효과
(1) 연구결과의 학문적․사회적 기여도
가) 대화 인터페이스 구축에 대화분석의 기여
기존의 공학적인 프로그래밍의 방법은 언어기능에 대한 범위를 정하고 대화 샘플을 정해나가는 하향식방법으로 프로그래밍화 해왔다. 하지만 30여년의 기술발전에도 불구하고 이러한 방 ...

(1) 연구결과의 학문적․사회적 기여도
가) 대화 인터페이스 구축에 대화분석의 기여
기존의 공학적인 프로그래밍의 방법은 언어기능에 대한 범위를 정하고 대화 샘플을 정해나가는 하향식방법으로 프로그래밍화 해왔다. 하지만 30여년의 기술발전에도 불구하고 이러한 방식은 실제 대화를 구현하는데 한계점을 드러내고 있다. 이는 공학적 기술발전의 문제이기 보다는 대화를 구현하는 방식이 실제 대화와의 괴리가 있기 때문이라고 여겨진다. 이에 반해 대화분석은 대화의 실제상황을 세밀히 분석하여 패턴을 도출해나가는 상향식 방식이기에 공학적 프로그래밍의 한계점을 극복할 수 있는 대안을 제시할 수 있다.

이를 위해서 대화분석에서 보여준 패턴 (말차례 방식: Turn-Taking, 선호(Preference), 수정 (Repair))등이 프로그래밍 언어로 바뀌어 시스템을 개발하는데 도움이 되는지를 모색한다. 이를 통하여 프로그래밍이 제시하는 언어사용의 범위를 확대하고 대화의 전개방식에 관한 새로운 변인들을 제시하여 기계 학습이 좀 더 세밀히 현실성 있게 구현할 수 있도록 유도한다.

나) 대화분석의 연구아젠다 확장
본 연구는 기존 CA에서 다루지 않았던 사람과 기계의 대화과정을 주요한 연구 아젠다로 부상시키는데 기여를 할 수 있을 것으로 예상된다. 현재까지는 기계가 인간의 대화에 어떻게 적응할 수 있는지를 조사하였지만 실제로 사람이 기계에 어떻게 적응하는지의 과정도 추적할 수 있다. 예컨대 말차례(Turn-Taking)의 배분이 달라지는지를 조사할 수도 있다(Pelikan & Broth, 2017). 현재 스마트폰이나 인터넷 등을 누구나 쉽게 사용하는 것처럼 미래에는 대화 인터페이스가 상용화되면 이들과의 상호작용이 인간의 사회생활에 중요한 역할을 하게 될 것이다. 본 연구를 통해 이러한 상호작용의 양식과 방법을 세밀히 조사한다면 대화형 인터페이스가 인간 사회생활의 구심점인 대화에 어떻게 작용하는지를 규명할 수 있게 된다.

(2) 인력양성 방안
본 연구가 성공적으로 이루어질 경우 인문사회의 학문적 내용이 공학적 프로그래밍의 설계에 구체적으로 포함되는 사례를 낳을 것으로 생각된다. 그러나 이러한 업적을 이루기 위해서는 대화분석관련 학생들과 프로그래밍에 종사하고 있는 학생들과 교수들과의 교류가 이루어져야 한다. 이를 위해서 본 연구에서 나온 자료를 바탕으로 교육 자료를 개발하여 후학양성에 이용하고자 한다. 이러한 교육자료는 온라인을 매개체로 사용될 것인데 대화를 CA의 기준으로 분류하고 정리한다면 학생들의 데이터 분석을 좀 더 용이하게 하는 효과가 있다.

본 연구를 통해 그동안 지지부진했던 융합연구와 관련한 학문후속세대의 양성에 진일보한 결과를 낳을 수 있다. 현재 서강대에서는 영문과 학생들이 공동연구자의 실험에 꾸준히 참여하는 프로그램을 운영해왔다. 본 공동연구를 통해 프로그램을 확대하여 인문사회의 기타 학생들에게 문호를 개방하여 공학적 마인드를 겸비한 학생들을 길러 낼 수 있을 것으로 생각된다.

예를 들어 책임연구자가 한국인 대화분석에 관한 서적에는 “기계와 인간의 대화”라는 주제의 장을 2개정도 만들 예정이다. 그리고 본 과제수행중에는 대화분석과 프로그래밍을 위한 인력을 연구보조원 중심으로 키워나가고 콜로키움과 학회를 통해 박사급 연구원 그리고 교수들과의 인적교류를 통해 담화분석이 이러한 분야에 어떤 기여를 할 수 있는지를 모색한다.

(3) 교육과의 연계가능성
책임연구자와 공동연구원은 2018년부터 인공지능 대학원과정에 관한 논의를 계속해 왔다. 융합과정으로 이루어진 과정은 특히 인문사회계열 학생들에게 언어학 기초과목과 대화분석 국어정보학의 과목을 수강한 후 인공지능의 공학계열의 수업을 수강하게 하는 것이다. 본 연구를 통해 대화분석과 대화 인터페이스에 대한 심도깊은 교류가 이루어지면 융합과정에 관한 보다 구체적인 행보(학사과정, 교육과정 및 평가등)를 지속할 수 있을 것이다.

연구요약
본 연구에서는 CA의 방법을 이용하여 사람간의 대화, 그리고 사람과 기계의 대화과정을 분석하여 나타난 문제점을 파악하고 이를 통하여 공학적 개선방법이 모색될 수 있는 연구결과를 도출하고자 한다.

가) 1년차: 공학적 자연어처리와 국내외 대화 인터페이스 분석
1 ...

본 연구에서는 CA의 방법을 이용하여 사람간의 대화, 그리고 사람과 기계의 대화과정을 분석하여 나타난 문제점을 파악하고 이를 통하여 공학적 개선방법이 모색될 수 있는 연구결과를 도출하고자 한다.

가) 1년차: 공학적 자연어처리와 국내외 대화 인터페이스 분석
1년차의 연구에서는 현재까지 발전해온 공학적 대화연구의 내용과 방법을 조사하고 CA의 연구방법과 비교하는데 다음의 네 가지 주요과제를 수행한다.

1) 공학적 대화 자료 선행연구와 대화분석 내의 기계어 선행연구
공학 분야의 자연어 대화분석에 대한 선행연구를 실시하는데 특히 목적지향성 대화와 채팅대화등 두 분야의 주요 연구 내용과 방법 그리고 산출된 결과의 장단점을 파악한다. 또한 CA내의 대화 인터페이스에 대한 연구를 파악하여 참고 할 수 있는 분석의 틀과 방법을 찾는다.

2) 공학실험실의 대화자료 처리방법의 학습 및 연구
선행연구조사를 바탕으로 본 연구에 참여하고 있는 두 공학실험실에 대한 관찰연구와 데이터 분석을 실시한다. 이를 통해 실험의 내용과 방법, 특히 대화정보 처리기능과 내용 그리고 시뮬레이션 및 모델과 프로그램밍 과정 등을 조사한다. 이러한 방법을 통해 공학적 접근방법을 통해 도출한 대화 인터페이스가 어떤 방식으로 개선 발전해 왔는지 조사한다.

3) 국내외 대화 시스템 사례연구
대화 인터페이스를 구축하기 위해서는 개발된 모듈을 구현하는 시스템이 개발되어야 한다. 본 연구에서는 주요한 챌린지대회에서 나온 데이터를 CA방법론을 이용해 분석한다. 이를 통하여 현재 개발 중인 시스템이 사람간의 대화와 어떤 유사성이 있고 어떤 문제에 봉착해 있는지를 파악할 수 있다.

4) 대화자료 전사와 분석 후 논문작성
수집된 데이터를 CA 방법으로 전사하고 분석한다.

나) 2년차: 휴먼대화 및 휴먼-기계대화 데이터베이스 구축과 분석
2년차에는 휴면 대화 데이터를 구축하여 이를 분석한 후 이를 공학실험실에서 도출한 대화 인터페이스와 비교분석한다. 이를 통해 나타난 유사점과 차이점을 도출하고 데이터를 분류하여 프로그래밍화하도록 하는데 목적이 있다.

1) 사람간의 대화연구: 목적성대화 및 채팅 데이터 수집
기계와 사람간의 원활한 대화를 위해서는 사람간의 데이터에 기반한 연구가 중요한 기초자료가 된다. 본 연구에서는 목적 지향성 대화의 예를 정하고 이를 실시간으로 수행하는 과정을 녹화 수집한다.

2) 사람과 기계와의 대화연구: 목적성대화 및 채팅 데이터 수집
현재 시중에 나와 있는 여러 인공지능 스피커(카카오미니, 엘지엑스붐, 아마존 에코 혹은 구글홈)과 피실험자들과의 상호작용을 촬영하고 이를 대화분석의 기법을 이용하여 분석한다. 또한 사람과 대화가 가능한 여러 기계나 인터넷, 상용화된 휴머노이드등을 구입하여 피실험자와 함께 상호작용하는 장면들을 녹취하여 분석한다.

3) 국제 대화 분류 방법의 한국어 적용 방법 연구
현재 선진외국의 대화분류의 기법을 한국어로 적용하는 방법에 대한 고찰이 필요하다. 국제어인 영어에 비해 한국어가 가지고 있는 특징에 따라 코퍼스를 분류하는 방법이 다를 수 있기 때문에 본 연구에서 수집된 데이터에 적합한 분류방법을 찾기 위한 기준을 마련하여 적용한다.

다) 3년차: 대화분석에 근거한 데이터 형식화 및 대화모델개발
1-2년차에서 수집된 정보와 전사된 자료를 통해 공학적 연구로 도출된 자료와 대화분석에서 나온 자료를 비교 분석하여 대화분석의 기법이 공학적 대화 모델 개발에 활용될 데이터를 분류하고 형식화 하여 주석한다.

1) 데이터비교분석 (공학실험실, 사람간 데이터및 사람과 기계 대화 데이터)
공학실험실에서의 데이터와 실제 상황에서 수집한 사람간의 대화 그리고 사람과 기계와의 데이터를 비교분석한다. 이를 통해 상향식 위주의 CA의 분석틀이 기존의 공학적 연구방법의 문제점을 해결하는데 도움이 되는지를 조사하고 이를 프로그래밍화 할 수 있는 방법을 강구한다.

2) 공학자연어 대화 처리를 위한 대화분석의 분류틀 개발
CA연구에서 찾아낸 분석의 틀(예: 말차례, 호의, 수정, Pre-sequence)등이 대화 인터페이스의 모듈설정에 기준이 되는지를 조사한다. 예를 들어 부탁하기의 경우 대화에 문제가 생겼을 때를 대비 수정(Repair)의 기준을 제시할 수 있다.

3) 대화분석의 분류틀에 대한 시험 및 평가
CA의 적용하여 대화 인터페이스인 목적성 대화나 채팅에 적용가능성을 모색한다. 두 실험실에서 CA의 분류 틀을 적용했을 때 어떤 문제가 생기는지를 파악하고 이를 극복할 수 있는 방법을 찾는다.

4) 대화자료 전사와 분석후 논문작성
수집된 데이터의 전사와 분석이 계속될 예정이다. 3년차에 모아진 데이터를 분석하여 논문 저서등을 작성하고 교육 자료를 만들어 배포한다.

결과보고시 연구요약문

국문
1. 연구 과정 개괄 (기존 Interface 데이터 수집과 분석)

대화분석(CA)은 언어의 형식과 기능에 주안점을 둔 언어학의 입장과는 달리 실시간 대화의 상호작용을 추적하여 화자와 청자가 각 말차례에서 어떤 선택을 하는지 그리고 이 선택이 향후 대화에 어떤 결과를 가져 ...

1. 연구 과정 개괄 (기존 Interface 데이터 수집과 분석)

대화분석(CA)은 언어의 형식과 기능에 주안점을 둔 언어학의 입장과는 달리 실시간 대화의 상호작용을 추적하여 화자와 청자가 각 말차례에서 어떤 선택을 하는지 그리고 이 선택이 향후 대화에 어떤 결과를 가져오는지를 조사한다. 이는 대화가 끝난 후 대화의 내외적인 요소의 연관관계로 사후 분석하는 기존의 연구와는 달리 다음 말차례간의 즉각적인 행위의 과정과 선택의 결과를 다음 말차례에서 찾아내므로 데이터 분석에 있어서는 상향식(Bottom-Up) 연구 방법이다.

대화분석에서는 대화를 녹화·녹취한 후 이를 전사(transcribe)한다. 따라서 많은 시간과 전문성이 요구되지만, 대화를 시간순으로 추적하므로 분석의 오류가 적다. 본 연구에서는 대화분석의 방법을 이용하여 사람 간의 대화, 그리고 사람과 기계의 대화과정을 분석하여 나타난 문제점을 파악하고 이를 기계학습의 모델로 사용하고자 하는 목표가 있다. 이를 위하여 다음의 연구 과정을 거쳤다.

(1) 대화분석과 공학 분야의 인터페이스 연구 방법 조사분석

대화분석은 1960년대 창시된 이후(Sacks, 1992)로 실시간 대화를 말차례 순서별로 세밀하게 추적하는 방식으로 지난 60여 년간 대화의 여러 양상을 체계적이고 일관성있게 분석해왔다(Potter & Hepburn, 2021; Sacks, 1992; Sidnell & Stivers, 2013). 2000년대 이후에는 사회학은 물론 언어학, 심리학, 교육학, 철학, 인류학은 물론 의학 등 상호작용이 일어나는 모든 사회과학의 영역에서 다양한 형태로 진화·발전하여 언어연구의 중추적 역할을 담당하고 있다. 본 연구팀은 대화분석의 연구를 요약하고 대화인터페이스에 적용할 패턴을 분류하였다 (turn-taking, adjacency pair, preference and repair). 본 연구팀은 2020년도에 Sogang CA-AI이라고 이름을 짓고 자연어 처리를 연구하는 연구자들의 관련 저서와 논문을 수집하고 항목화하고 조사하였다.

(2) 공학적 알고리즘에 의한 대화인터페이스 자료 분석

본 연구팀은 공동연구원의 융합연구팀과의 협업을 통해 인간과 기계가 목적 지향성 대화 데이터를 수집하고 이를 대화분석의 원리를 이용하여 분석하는 작업을 시작하였다. 이러한 과정을 거쳐 1년 차에 일정 관리와 날씨예보 그리고 연락처 관리 도메인이 담긴 1,860건의 대화를 수집하여 분석하였고 특히 말차례간의 연관관계를 추적하여 주요한 특징을 도출하였다.

(3) 개선된 실험

본 연구에서는 컴퓨터공학의 자연어처리 연구자들의 데이터가 사람 간 실시간 대화의 양상을 정확히 드러내지 못하는 점을 극복해야 한다는 점에 주목하였다. 따라서 사람 간 대화 샘플을 모집하여야 하고 이를 분석하여 기계학습에 필요한 새로운 태깅 시스템이 필요하다는 결론에 도달하였다. 따라서 Wizard of Oz 방식을 사용하여 130명이 참여하는 실험을 통해 15,000건의 말차례가 담긴 데이터 코퍼스를 구축하였다.

(4) 대화분석에 근거한 Tagging System 개발

이미 언급하였듯이 대화분석이 자연어 처리 연구에 기여할수 있는 영역은 현실성 있는 질 높은 데이터를 수집하고 이를 기계학습에 도움이 되도록 순차분석을 반영한 태깅시스템을 개발하는 것이다. 이를 위해서는 대화인터페이스를 순서대로 늘여놓고 이의 연관관계를 추적조사하여야 한다.

이렇게 하는 이유는 현재 자연어 처리연구의 추세를 반영하기 위해서이다. 현재 자연어 처리 연구에서는 단어 간 그리고 말차례간의 관계를 확률적으로 다음 대화를 이끌어 내는 방식을 취한다. 본 연구에서는 이러한 시스템에 기여하기 위해 사람간 대화에서 나타난 패턴을 반영한 태깅 시스템을 개발하였다. 이 분류시스템은 기존의 연구에서는 연구진들이 미리 만들어놓은 방식에 적용하는 방식을 선택한것과 달리 연구진이 4,300건의 말차례에 근거하여 모두 분석해나가면서 하나하나 개선하는 방식으로 만들었고 58개의 Dialog Acts와 이 Acts의 기능의 내용을 다루는 42개의 Entity로 구성되어 있으며 이를 통하여 기본적인 대화 인터페이스를 구축할 예정이다. 향후 이를 확장하여 tutoring 혹은 customer service등 다른 대화과제에 적용할 예정이다.

영문
The present study was organized to apply sequential analysis to natural language processing (NLP) research. Sequential analyis was developed by conversation analysis (CA) in order to trace turn by turn progression in real-time interaction. Note, howe ...

The present study was organized to apply sequential analysis to natural language processing (NLP) research. Sequential analyis was developed by conversation analysis (CA) in order to trace turn by turn progression in real-time interaction. Note, however, that conversational interface that are available today are mosey limited in realizing real-time progression of interaction. For this reason, CA’s methods that traces turn by turn progression provides a useful alternative in terms of data collection, tagging system and eventually machine learning.

We first examined NLP literature to identify its strengths and weaknesses while seeking ways to apply CA’s principle. In doing so, we first applied sequential analysis to conversational data developed by engineers, which amounts to 1,860 conversations. We also examined about 300 interactional data drawn from KLUE (Korean Language Understanding Evaluation) Benchmark. From this data, we learned the need to find quality data corpus that emulates spontaneous conversational interactions and to develop tagging systems that are based on the quality data and to demonstrate an alternative way to handle conversational data.

In order to gain realistic data, an experiment was designed in which 130 volunteers were engaged in conversational interaction with agents who acts as a system disgused as computer assistant (Wizard of Oz Method) for scheduling tasks. We then developed a tagging system that has 58 dialog acts and 42 entities. We are in the process of developing conversational interface that are firmly based on real-time interaction. With this system in place, we are planning to apply the same principle to other discourse tasks such as customer service and tutoring.

연구결과보고서

초록
본 연구는 인문·사회의 기반을 둔 대화분석(Conversation Analysis)의 연구 방법을 적용하여 컴퓨터공학 분야에서 개발해온 대화 인터페이스의 현황과 한계점을 분석하고 실시간 대화의 양상을 반영하는 방식으로 새롭게 대화 데이터를 수집하고 이를 분류하여 태깅하였다 ...

본 연구는 인문·사회의 기반을 둔 대화분석(Conversation Analysis)의 연구 방법을 적용하여 컴퓨터공학 분야에서 개발해온 대화 인터페이스의 현황과 한계점을 분석하고 실시간 대화의 양상을 반영하는 방식으로 새롭게 대화 데이터를 수집하고 이를 분류하여 태깅하였다. 이런 대안을 통해 대화인터페이스 개발에 의미협상(Meaning Negotiation)에 새로운 방향을 제시하고자 한다. 이 연구는 지난 60여 년간 체계적으로 조사한 대화분석(Conversation Analysis)의 순차분석(Sequential Analysis)을 활용하는데 이는 실시간 대화를 말차례 순서별로 추적하여 화자와 청자가 실시간 대화에서 어떤 선택을 하는지 그리고 후속 대화에 어떤 영향을 끼치는지를 조사하는데 그 특징이 있다.

본 연구에서는 대화분석을 활용하여 기존 엔지니어링에 기반한 대화인터페이스에서 도출한 1,860건의 대화와 KLUE (Korean Language Understanding Evaluation) Benchmark의 333건의 대화를 건별로 세밀히 분석하였다. 이를 근거로 현재 자연어 처리 연구분야에서 해결하지 못하는 연속성있는 대화를 설계하기 위해서 필요한 (1) 기계학습을 위한 질좋은 데이터 코퍼스 구축과 (2) 사람간 실시간 대화에서 도출한 규칙과 패턴을 적용한 태깅시스템을 개발하고 이를 근거로 (3) 다양한 목적성 대화의 설계에 새로운 방향을 제시하고자 한다.

우선 현실성 있는 대화를 구현하기 위해 Wizard of Oz의 방식으로 130여명이 참여한 목적성 대화의 실험을 수행하였고 여기서 도출된 데이터를 각 말차례별로 수차례 분석하여 대화분석의 원리를 이용하여 58개의 dialog Act와 42개의 entity로 구성된 한 새로운 태깅시스템을 개발하였다. 이를 기초로 Python을 이용하여 대화모쥴을 개발하고 있다. 대화분석에 근거한 시스템은 기계학습을 보다 고도화하기 위한 자료이며 이를 근거로 다른 대화 과제 (customer service, tutoring)를 분석하는 방향으로 확대 발전시키고자 한다.

연구결과 및 활용방안
1. 연구결과 활용계획

(1) 개발된 Tagging 시스템을 활용하여 기계학습을 위한 대화모쥴 생성과 확장

기존의 공학 분야의 자연어 처리 연구방법은 실시간 대화에 대한 언어기능의 범주를 미리 정하고 알고리즘을 적용하였는데 이는 실제 대화를 구현하는데 한계점을 드 ...

1. 연구결과 활용계획

(1) 개발된 Tagging 시스템을 활용하여 기계학습을 위한 대화모쥴 생성과 확장

기존의 공학 분야의 자연어 처리 연구방법은 실시간 대화에 대한 언어기능의 범주를 미리 정하고 알고리즘을 적용하였는데 이는 실제 대화를 구현하는데 한계점을 드러내고 있다. 이는 공학적 기술의 문제이기보다는 설계자들이 실제 대화가 어떻게 구성되는지에 대해 대화분석에서처럼 실증적으로 분석을 하지 않았기 때문이다. 대화분석은 말차례간의 연관성을 세밀히 추적하기 때문에 대화의 구체적인 규칙이나 추세를 파악하는 데 매우 유용하다. 따라서 대화분석에서 발견한 규칙을 대화 설계에 반영한 태깅시스템을 개발된 모듈을 활용하여 기계학습이 더욱 원활히 이루어지는 시스템을 개발할 예정이다. 이런 시스템을 활용하면 Customer Service나 Tutoring 등 다른 대화 과제로 확장하여 적용할 수 있다.

(2) “인간과 기계와의 대화 인터페이스”강좌 개설

본 연구 결과를 토대로 학부/대학원 학생들에게 Problem-Based Approach를 활용한 강좌를 제공하고자 한다. 현재 연구책임자 소속 학부에서는 2022년도 2학기부터 디지털 인문학 연계전공 프로그램을 시작하였는데 그 일환으로 “인간과 기계와의 대화 인터페이스” 강좌를 2023년 1학기부터 개설할 예정이다. 이 강좌에서는 말이 쌓여가는 실시간 대화를 인터페이스 설계과정에 사람간 실시간 대화방식을 조사해온 대화분석의 순차분석(Sequential Analysis)를 학습하고 이를 기계와의 인터페이스에 적용하게 한다. 이 강좌는 대화분석의 패턴을 이용하여 특수목적의 대화에 관한 태깅 시스템을 만들고 이를 기계학습에 필요한 설계까지 완성하는 캡스톤 디자인의 성격을 띠고 있다.

(3) 학문 후속세대 양성

본 연구를 통해 자연어 처리 분야에서 인문·사회 분야와 공학 분야의 연구자를 양성하고자 한다. 2019-2022년까지의 연구를 통해 Sogang CA-AI 연구팀의 일원이었던 두 학생이 미국과 스위스의 대학에 각각 전액 장학금을 받고 박사과정을 밟고 있다. 현재 연구팀의 대학원생이 4명 그리고 학부 연구생이 2명이 연구를 수행하고 있다. 앞으로도 후학을 끊임없이 발견하여 교육과 실습으로 이에 관한 작업을 할 것이다. 특히 강좌를 통해 활성화해 학부생들을 발굴하여 학문후속세대로 발전할수 있도록 유도할 예정이다.

(4) 인적네트워크 확장

본 과제의 필수 요건인 학술대회 및 심포지움을 통해 국내의 여러 자연어처리 및 인공지능 관련 연구팀과의 교류를 시도할 것이다. 인적 네트워크를 이용하여 공동학술제안 기술과 정보교환 등을 이루어 나갈 것이다. 특히 한국정보과학회, 한국인지과학회등의 학회와 연결하여 본 연구의 성과를 공유하고 협업해 나갈 예정이다.

대화분석 분야에서는 현재 인공지능과 기술혁신에 대한 오랫동안의 노하우가 축척되어 있는 상태이다. 특히 The International Institute for Ethnomethodology and Conversation Analysis (IIEMCA)는 대화분석의 세계적인 연구자들의 학술대회인데 대화분석, Technology, 사회학, 교육학등의 융합연구의 주제로 2024년 IIEMCA를 서울 본교에서 유치하였다. 이를 통해 대화분석을 이용한 인적 네트워크를 강화하고 특히 유럽에서 진행되고 있는 이 연구팀과의 교류를 활성화하고 이 분야의 연구를 활성화 할 예정이다.
(5) 대화분석의 연구아젠다 확장

본 연구는 기존 CA에서 다루지 않았던 사람과 기계의 대화 과정을 주요한 연구 아젠다로 부상시키는 데 이바지를 할 수 있을 것으로 예상된다. 현재까지는 기계가 인간의 대화에 어떻게 적응할 수 있는지를 조사하였지만 실제로 사람이 기계에 어떻게 적응하는지의 과정도 추적할 수 있다. 예컨대 말차례(Turn-Taking)의 배분이 달라지는지를 조사할 수도 있다(Pelikan & Broth, 2017). 현재 스마트폰이나 인터넷 등을 누구나 쉽게 사용하는 것처럼 미래에는 대화 인터페이스가 상용화되면 이들과의 상호작용이 인간의 사회생활에 중요한 역할을 하게 될 것이다. 본 연구를 통해 이러한 상호작용의 양식과 방법을 세밀히 조사한다면 대화형 인터페이스가 인간 사회생활의 구심점인 대화에 어떻게 작용하는지를 규명할 수 있게 된다.

색인어
자연어처리, 대화분석, 순차분석, 수정, 말차례, 음성인식, 의미분석, 기계학습, 말뭉치, 태깅시스템

이 연구과제의 신청시 심사신청분야(최대 3순위까지 신청 가능)
1순위 : 인문학 > 언어학 > 응용언어학
2순위 : 공학 > 컴퓨터학 > 자연언어 > 자연언어처리
3순위 : 인문학 > 한국어와문학 > 국어학 > 국어정보학

연구성과물 목록