연구과제 상세정보

https://www.krm.or.kr/krmts/link.html?dbGubun=SD&m201_id=10091754&res=y

이용자 자아상태와 커뮤니케이션 유형을 반영한 맞춤형 인공지능 스피커 시스템 개발 및 검증
Development and Test of a Customized AI Speaker System based on Users' Ego-State and Communication Styles

연구자가 한국연구재단 연구지원시스템에 직접 입력한 정보입니다.

사업명	연구그룹형(국내형) [지원년도 신청 요강 보기 ]
연구과제번호	2019-S1A5A2A03-2019S1A5A2A03040702
선정년도	2019 년
연구기간	4 년 (2019년 07월 01일 ~ 2023년 06월 30일)
연구책임자	장병희
연구수행기관	성균관대학교
과제진행현황	진행중
공동연구원 현황	최종환 김헌(중부대학교) 허경용(동의대학교) 강혜원(성균관대학교) 남춘성(인하대학교) 박현순(성균관대학교)

과제신청시 연구개요

연구목표
최근 2~3년간 스마트 스피커, 지능형개인비서(Intelligent Personal Assistant) 등으로 불리는 AI 스피커가 AI플랫폼 중에서도 괄목할만한 성장을 보여주고 있다. AI 스피커가 각광받으면서 자동음성인식기술(ASR), 자연어처리시스템(NLU), 음성합성기술(TTS)의 결합을 통 ...

최근 2~3년간 스마트 스피커, 지능형개인비서(Intelligent Personal Assistant) 등으로 불리는 AI 스피커가 AI플랫폼 중에서도 괄목할만한 성장을 보여주고 있다. AI 스피커가 각광받으면서 자동음성인식기술(ASR), 자연어처리시스템(NLU), 음성합성기술(TTS)의 결합을 통해 구현되는 음성기반인터페이스(VUI)가 빠른 처리 속도, 손 사용이 자유로운 ‘핸즈프리’시스템, 직관성, 톤, 음량, 강세 등의 풍부한 정보량을 통해 감정이입(empathy)이 용이하다는 차원에서 그래픽 기반 인터페이스(GUI)에서 나아간 차세대 인터페이스로서 주목받고 있다(Pearl, 2016,Amazon, 2019).
보이스 기반 대화형 인터페이스(VUI)는 일찍이 1950년대부터 가능성이 논의되어왔던 개념이지만, 2000년대 이후 음성 인식 및 합성 등 관련 기술이 실용화되면서 활용도가 나날이 증가하고 있다. 음성 대화형 인터페이스(VUI)는 이제 단순히 스마트폰과 PC에만 해당되는 것이 아니라, 과거보다 발전된 IoT기술 및 인공지능 기술과 결합하여 앞으로 더욱 더 많은 제품에서 사용자가 사용하게 될 인터페이스이다(Klein, 2016; 배혜진,박남춘, 2017).
AI 스피커의 VUI 지능정보기술의 집약체라고 할 만큼 다양한 융합기술을 탑재하고 있는 만큼 학제 간 융복합을 통한 기술 개선이 요구된다. 현재 상용화된 AI 스피커는 간단한 물음에 응답하는 수준에서 이용자 의사결정에 보조적 역할을 행한다. 따라서, AI 스피커의 효용성을 높이기 위해서는 고차원적 의사 결정에 필요한 데이터를 수집하고, 분석할 필요가 있다. 특히 AI 스피커는 보이스 기반 대화형 미디어라는 점에서 보다 정교한 디자인설계가 요구되는데, 시각적으로 사용자에게 다양한 선택지와 구체적인 정보를 제공할 수 있는 그래픽 기반 인터페이스(GUI)와 달리 음성 정보만을 통해 사용자와 상호작용을 해야 하기 때문이다.
특히, 대인간 커뮤니케이션과 마찬가지로 인간 대 컴퓨터 간 상호작용(Human-computer interaction)에서도 서로에 대한 이해가 요구된다. 본 연구는 AI 스피커가 인간의 심리적인 성격 유형 정보를 학습함으로서 이용자에 대해 더 많이 이해하고, 더 나은 서비스를 제공할 것으로 본다.
따라서, 본 연구에서는 AI 스피커의 매커니즘을 한층 도약시키기 위해 이용자의 성향 및 심리 요인에 바탕을 둔 대응 전략을 개발할 수 있는 방안을 제안하고자 한다. 이를 위해 구체적으로 첫째, AI 스피커가 인간의 심리적 특성을 반영할 수 있도록 인간의 성격 및 커뮤니케이션 유형을 교류분석이론에 근거하여 구분하고자 한다. 둘째, 이용자 성격 및 커뮤니케이션 유형에 관한 데이터를 AI 스피커가 학습 가능한 형태로 데이터화 시킬 것이다. 이후, AI 스피커가 이용자 반응을 추론하고 판단할 수 있는 능력을 학습을 통해 개선시키는 작업을 진행하고자 한다. 이처럼 이용자의 성격 및 커뮤니케이션 유형을 세분화하고, 이를 데이터화시켜 AI 스피커에 적용함으로서, 이용자별 맞춤형 AI 스피커 알고리즘 및 시스템 개발이 가능할 것이다.

기대효과
본 연구는 첫째, 통합적 융합기술(integrative technology)을 실현함으로써 국가경쟁력 재고에 기여할 수 있다. 융합적 연구는 인문사회과학 분야의 경쟁력을 높이는데 영향을 미칠 뿐만 아니라 국가 경쟁력을 높이는 국가 목표이기도 하다. 본 연구 과제는 커뮤니케이션 ...

본 연구는 첫째, 통합적 융합기술(integrative technology)을 실현함으로써 국가경쟁력 재고에 기여할 수 있다. 융합적 연구는 인문사회과학 분야의 경쟁력을 높이는데 영향을 미칠 뿐만 아니라 국가 경쟁력을 높이는 국가 목표이기도 하다. 본 연구 과제는 커뮤니케이션학, 상담심리학 등을 포함하는 인문사회과학 분야의 지식과 인공지능 및 프로그래밍으로 대표되는 컴퓨터 공학의 기술을 융합하는데 목표를 둔다. 특히 두 가지 이상의 학문 분야를 단순히 결합하는데 그치지 않고, VUI 페르소나 개발을 위한 융복합적 접근을 통해 통합적 융합기술(integrative technology)을 실현하고자 한다.
인문사회과학 지식과 컴퓨터 공학 간 통합적 융합기술 실현이 필요한 이유는 크게 두 가지이다. 첫 번째로 고령화 사회, 일인 가구 등장 등 사회 문제에 적절히 대응할 수 있는 도구로서 AI 스피커 기능의 개발 및 확장이 요구된다. 2015년 경제협력개발기구(OECD) 사회통합지표 분석서 대한민국은 ‘사회적 지원 네트워크’ 영역에서 10점 만점 중 0.2점으로 조사국 중 가장 낮은 점수를 받았다(김호기, 2016). 이는 곧 대한민국에서 사회적 ‘고독’은 사회 문제로 이어질 수 있음을 뜻한다. 그럼에도 불구하고 사회적 고독에 적절하게 대응할 수 있는 현실적 방안은 부족하다. 인간 대 인간 커뮤니케이션이 가장 이상적인 대처방안임이 분명하다. 그러나, 자신의 성격이나 심리를 이해하는 AI 스피커와 소통하고 지원을 받는 것이 인간이 지원을 넘어설 수는 없지만, 보조 장치로서 충분한 역할을 할 것으로 기대한다. 정리하자면, 점차 고독해지는 사회에 심리적 보조 장치로서 AI 스피커의 가능성을 확인하는데 본 연구 과제가 필요하다.
둘째, 인문사회과학분야의 이론적 타당성을 융합기술 개발연구를 통해 검증할 수 있다. 본 연구과제에서는 다양한 인문사회과학분야의 개념 및 이론적 프레임워크가 제시된다. 각 개념과 이론은 정성적, 정량적 방법론을 통해 꾸준히 검증되어왔지만, 실질적 유용성에 대한 분석은 미흡하다. 커뮤니케이션, 상담 심리학 등의 이론적 조건이 실제 현상에도 존재하는지, 그리고 현상 대응에 해당 지식이 활용되는지, 또한 이론적 지식이 기술을 통해 실제 이용 가능한 형태로 실현되는지를 확인할 수 있을 것이다. 또한 기술-기술 간의 융합이 주도하는 융합 연구의 틀에서 벗어나 지식-기술 간의 결합을 통해 인문사회과학분야의 필요성을 확인하고, 공학 분야처럼 기술 학문 분야의 확장 가능성을 확인할 수 있을 것이다. 결과적으로 융합적 접근은 인문사회과학의 지식과 기술의 결합이 사회문제를 해결하는데 얼마나 타당한지를 확인하는데 필수적이다.
또한 본 연구는 아시아 문화권의 고맥락적 소통 방식에 대응할 수 있는 VUI 페르소나 다변화를 위한 탐색적 연구를 통해 인공지능이 점점 사회적 개체로서 기능하는 현대 사회에서 AI 플랫폼과 인간의 상호작용의 질을 정서적 만족감 향상을 통해 한 단계 도약시킬 수 있다는 점이다.
AI 스피커가 실생활에서 자리 잡으면서, 기술 개발의 화두는 점차 사용자의 특성에 따른 개인화 방안에 맞춰지고 있다. AI 스피커 서비스의 시스템이 고도화될수록 결국 서비스 간의 차별화는 사회문화적 규범을 고려한 인간공학적 설계를 얼마나 효과적으로 구현해내느냐에 달려있다. 특히 한국 등 아시아 국가에서 의사소통 상황은 영어권에 비해 사회적 위계, 대화 상황에 따라 고도로 규범화된 고맥락적 소통의 형식을 띈다.
AI 스피커가 제공하는 대화형 서비스에 정서적 변인을 고려한 개인화 기능이 도입된다면, 고맥락적 소통에 익숙한 한국 및 아시아 이용자들의 이용 만족도를 개선하는데 효과적인 기여를 할 수 있다. 한국 사례에 관한 연구결과를 바탕으로 아시아, 중동 지역 사용자에게 적용할 수 있는 개인화 서비스 개발에 적용할 수 있다. 뿐만 아니라, 늘어나고 있는 의료용 케어로봇 시장 등 노년층이나 어린이 등 취약계층을 대상으로 하여 정서적 공감 기능이 향상된 AI 기반의 조력 서비스를 제공할 수 있다.

연구요약
본 연구는 우선 AI 스피커가 인간의 심리적 특성을 반영할 수 있도록 인간의 성격 및 커뮤니케이션 유형을 교류분석이론에 근거하여 구분한다. 이후 이용자 성격 및 커뮤니케이션 유형에 관한 데이터를 AI 스피커가 학습 가능한 형태로 데이터화 시킨다. 이후, AI 스피커 ...

본 연구는 우선 AI 스피커가 인간의 심리적 특성을 반영할 수 있도록 인간의 성격 및 커뮤니케이션 유형을 교류분석이론에 근거하여 구분한다. 이후 이용자 성격 및 커뮤니케이션 유형에 관한 데이터를 AI 스피커가 학습 가능한 형태로 데이터화 시킨다. 이후, AI 스피커가 이용자 반응을 추론하고 판단할 수 있는 능력을 학습을 통해 개선시키는 작업을 진행한다. 이용자의 성격 및 커뮤니케이션 유형을 세분화하고, 이를 데이터화시켜 AI 스피커에 적용함으로서, 이용자별 맞춤형 AI 스피커 알고리즘 및 시스템 개발이 가능할 것이다.

본 연구는 사회과학(주도)+ 공학 연구와 공학(주도)+사회과학 연구를 2트랙으로 진행함으로써　 통합적 융합기술(integrative technology) 실현을 목표로 한다. 본 연구에서 수행할 연구방법론은 아래와 같다.

■ 1차년도: AI 스피커 사용 시나리오에 따른 VUI 페르소나 유형 및 특성 탐색

AI 스피커에 대한 사용자들의 개념적 모델과 사용 상황에 대한 이해를 시도한다. 즉 가상의 사용자(persona)로 하여금 AI스피커를 사용하도록 상황을 설정하고 시나리오에 따른 사용자 심리적 요인 및 특정 행동, 그리고 그로 인해 요구되는 VUI 특성을 분석하여 VUI 페르소나 유형을 분류하고 모델을 도출한다.

O 사회과학(주도)+공학 연구
- 1단계: AI 스피커 사용 시나리오 및 VUI 페르소나 모델 구축(VUI 관련 연구 고유 특성을 반영)
- 2단계: 산·학·연 관계자를 통한 VUI 페르소나 모델의 검증/고도화(FGI, 델파이 설문조사)

O 공학(주도)+사회과학 연구
- 적용 가능한 화자식별 기술들을 조사하고 VUI 페르소나 화자 모델 분류를 위해 여러 발화자로부터 음성샘플을 얻어 VUI 페르소나 분류별 음성 메타데이터를 생성함.

■ 2차년도: AI스피커 사용 시나리오에 따른 VUI 페르소나 유형 및 특성 탐색

2차 년도에는 교류분석 이론에 따른 유형/연령/성별 AI 스피커 사용자 심층인터뷰를 진행하여 AI 스피커가 사용자들과 어떠한 방식으로 인터랙션 하는지 대화 전략을 구축하고 VUI 페르소나 대응 알고리즘에 적용한다.

O 사회과학(주도)+공학 연구
- VUI 페르소나 대화 대응 전략 변인 도출
- 심리상담가 및 대화전략 전문가 서베이 진행
- 선호 VUI 페르소나 상호작용 유형 탐색
- 교류분석에 근거한 이용자 집단의 선호 상호작용 유형 실험 연구

O 공학(주도)+사회과학 연구
- VUI 페르소나 화자 식별기 구성
- VUI 페르소나 등록 화자 자동 식별 기술 적용
- VUI 페르소나 등록 화자 대응 알고리즘 구현

■ 3차년도: VUI 페르소나 알고리즘 개발

3차 년도에는 1, 2차 년도에서 수행한 연구를 기반으로 VUI 페르소나 알고리즘을 개발하고 사용자에게 적용하는 실험을 통해 본 연구에서 실현하고자 하는 VUI 페르소나가 적용된 AI 스피커의 응대 알고리즘 개발 및 프로토타입 개발을 목표로 한다.

O 사회과학(주도)+공학 연구
- VUI 페르소나 이용 상황 참여관찰 및 사용자 심층인터뷰

O 공학(주도)+사회과학 연구
- VUI 페르소나 알고리즘 사용자 적용 실험
- VUI 페르소나 알고리즘 고도화

결과보고시 연구요약문

국문
본 연구는 이용자별 맞춤형 AI 스피커 개발에 기여하는 것이 목적이다. 본 연구의 단계는 다음과 같다. 첫째, 본 연구는 AI 스피커가 인간의 심리적 특성을 반영해 커뮤니케이션할 수 있는 방안을 모색한다. 둘째, 본 연구는 AI 스피커가 이용자 반응을 판단할 수 있는 작 ...

본 연구는 이용자별 맞춤형 AI 스피커 개발에 기여하는 것이 목적이다. 본 연구의 단계는 다음과 같다. 첫째, 본 연구는 AI 스피커가 인간의 심리적 특성을 반영해 커뮤니케이션할 수 있는 방안을 모색한다. 둘째, 본 연구는 AI 스피커가 이용자 반응을 판단할 수 있는 작업을 진행한다. 본 연구는 AI 스피커가 인간의 성격 유형 정보를 학습함으로써 이용자를 더 많이 이해하고, 더 나은 서비스를 제공할 수 있도록 기여하고자 한다.

영문
This research aims to contribute to the development of personalized AI speakers for individual users. The steps of this research are as follows. First, the study explores ways in which AI speakers can communicate by reflecting the psychological charac ...

This research aims to contribute to the development of personalized AI speakers for individual users. The steps of this research are as follows. First, the study explores ways in which AI speakers can communicate by reflecting the psychological characteristics of humans. Second, the research conducts tasks to enable AI speakers to assess user responses. Therefore, this research is to enhance the understanding of users by having AI speakers learn information about human personality types, thereby contributing to providing better services.

연구결과보고서

초록
본 연구는 AI 스피커의 매커니즘을 한층 도약시키기 위해 이용자의 성향 및 심리 요인에 바탕을 둔 대응 전략을 개발할 수 있는 방안을 제안하고자 한다. 이를 위해 구체적으로 첫째, AI 스피커가 인간의 심리적 특성을 반영할 수 있도록 인간의 성격 및 커뮤니케이션 유 ...

본 연구는 AI 스피커의 매커니즘을 한층 도약시키기 위해 이용자의 성향 및 심리 요인에 바탕을 둔 대응 전략을 개발할 수 있는 방안을 제안하고자 한다. 이를 위해 구체적으로 첫째, AI 스피커가 인간의 심리적 특성을 반영할 수 있도록 인간의 성격 및 커뮤니케이션 유형을 교류분석이론에 근거하여 구분했다. 둘째, 이용자 성격 및 커뮤니케이션 유형에 관한 데이터를 AI 스피커가 학습 가능한 형태로 데이터화 시켰다. 이후, AI 스피커가 이용자 반응을 추론하고 판단할 수 있는 능력을 학습을 통해 개선시키는 작업을 진행했다. 이를 통해 본 연구는 이용자의 성격 및 커뮤니케이션 유형을 세분화하고, 데이터화시켜 AI 스피커에 적용함으로서, 이용자별 맞춤형 AI 스피커 알고리즘 및 시스템 개발에 기여하고자 한다.

연구결과 및 활용방안
1. 연구결과

1) AI 스피커와의 커뮤니케이션 과정을 정서적 측면에서 분석
본 연구단은 한국연구재단 지원 기간, AI 스피커에 대한 이용자의 정서적 측면을 파악할 수 있는 데이터를 확보했다. 이를 통해 연구단은 자아상태 유형 및 커뮤니케이션 유형 등 정서적 요인을 ...

1. 연구결과

1) AI 스피커와의 커뮤니케이션 과정을 정서적 측면에서 분석
본 연구단은 한국연구재단 지원 기간, AI 스피커에 대한 이용자의 정서적 측면을 파악할 수 있는 데이터를 확보했다. 이를 통해 연구단은 자아상태 유형 및 커뮤니케이션 유형 등 정서적 요인을 연구과정에 투입함으로써 인간과 기계 간의 커뮤니케이션 과정 분석하는 과정에서 인지적 요인과 정서적 요인을 함께 고려하는 통합 모형을 제시할 수 있게 되었다.

2) 휴먼팩터를 고려한 AI 스피커 알고리즘 개발
기존 AI 스피커 혹은 챗봇 등의 알고리즘을 개발하는 과정에서는 주로 이용자가 제시하는 메시지의 외면적 의미를 지각하는 측면에서 초점을 맞추었다. 하지만 커뮤니케이션 과정에서 심리적 요인은 무시할 수 없다는 점에서 본 연구가 제시하는 자아상태 유형 및 커뮤니케이션 유형이라는 휴먼팩터는 AI 스피커 알고리즘에 새로운 시각을 제시할 수 있다.

2. 활용방안

1) 최신 기술 융합
연구단은 인접 분야와의 협업을 충실히 기할 예정이다. 최근 학문의 정체성은 크게 변화하고 있다. 산업적으로 주목받고 있는 자연어 처리(Natural Language Processing, NLP)는 언어학과 공학을, 머신러닝(machine learning)은 사회과학과 공학이 결합된 분야다. 학문의 범위가 다양해지고 있는 오늘날 연구자들은 인접 분야와의 협업이 어느 때보다 필요해졌다. 이러한 현상에 기반해 연구단은 학문 간 융합과 협업의 중요성을 인지하고, 연구단이 설립한 메타사회연구소를 중심으로 글로벌 연구 역량을 기를 것이다.

2) 사회 문제 해결
디지털 기반의 스마트 정보환경이 보편화되면서 사회적 약자를 둘러싼 소외 현상은 광범위하게 나타나고 있다. 이는 기존의 인터넷, PC 위주의 접근 문제와 달리 문화와 의사소통, 생활양식 등 전반적인 일상 영역에 깊숙이 영향을 미친다는 점에서 중요한 사회적 의제로 떠올랐다. 한국은 각종 정보 진흥 사업을 통해 다양한 민원행정서비스를 온라인으로 제공하고 있지만, 디지털 정보화 역량 및 활용 수준이 낮은 취약계층의 경우, 자신이 필요한 서비스를 찾아 신청하는 데 많은 제약이 따르는 상황이다. 본 연구단은 기술 향상을 면밀하게 파악해 사회적 문제를 해결하는 데 기여하고자 한다.

3) 연구 네트워크 확대 및 자생력 확보
본 사업의 책임연구원과 공동연구원은 한국엔터테인먼트학회, 한국방송학회 등에서 왕성하게 학술 활동을 펼치고 있다. 연구단은 지난 2022년 한국엔터테인먼트와 함께 공동 학술교류를 위한 업무협약을 가졌다. 또, 여론조사 기업 리얼미터와 함께 공동 프로젝트를 진행하기도 했다. 이렇게 마련한 학문적 네트워크를 활용하여 연구단 활동을 더욱 확산할 계획이다.

4) 학문후속세대 양성

본 연구단은 사회과학 분야에서도 미디어, 심리, 사회, 산업뿐만 아니라, 기술공학 등의 분야를 집중적으로 학습하고 있다. AI 분야는 산업 특성에 기반 한 인간의 협업 능력을 고도화한다는 측면에서 앞으로도 다학제적 접근이 필수로 요구되는 상황이다. 연구진들은 이러한 연구 환경 속에서 특정 분야의 연구만 지속하기보다 다학제적 접근을 유도하고자 한다. 구체적으로, KIST, 한국언론학회, 네이버, SKT 등 학계, 산업계 구성원들과 인적 네트워크를 쌓을 예정이다.

색인어
AI 스피커, 인간 컴퓨터 상호작용, 융합기술, 페르소나, 심층인터뷰, 델파이, 인공지능, 교류분석이론

이 연구과제의 신청시 심사신청분야(최대 3순위까지 신청 가능)
1순위 : 사회과학 > 신문방송학 > 영상학 > 뉴미디어
2순위 : 공학 > 컴퓨터학 > 인간과컴퓨터상호작용 > 상호작용및인터페이스
3순위 : 사회과학 > 신문방송학 > 영상학 > 미디어산업

연구성과물 목록