연구성과물검색
유형별/분류별 연구성과물 검색
HOME ICON HOME > 연구과제 검색 > 연구과제 상세정보

연구과제 상세정보

빅 데이터 기반 과중채무의 원인분석과 예측모형 개발
Understanding causes of personal debt and developing a prediction model based on big data and experiments
  • 연구자가 한국연구재단 연구지원시스템에 직접 입력한 정보입니다.
사업명 공동연구지원사업 [지원년도 신청 요강 보기 지원년도 신청요강 한글파일 지원년도 신청요강 PDF파일 ]
연구과제번호 2018S1A5A2A03039623
선정년도 2018 년
연구기간 3 년 6 개월 (2018년 07월 01일 ~ 2021년 12월 31일)
연구책임자 박정민
연구수행기관 서울대학교
과제진행현황 종료
공동연구원 현황 송태민(삼육대학교)
최승주(서울대학교)
과제신청시 연구개요
  • 연구목표
  • -이 연구과제의 목표는 사회과학 및 공학 기반 다학제적 연구를 바탕으로 광범위한 사회적 현상이 된 가계부채와 채무조정제도 이용의 원인을 분석하고 예측모형을 개발하는 것이다. -가계부채는 한국사회의 중요한 사회문제로 자리잡았다. 우리나라의 가계부채 규모는 빠르게 증가해 왔다. 한편, 상환능력에 비해 과중한 채무를 가지고 있거나, 금융채무의 연체나 상환불능에 빠지는 개인 또는 가구 역시 증가하였다. -과중채무의 경험과 그에 따른 채무불이행과 신용하락 그리고 채무조정제도로의 진입은 대체로 장기간에 걸쳐 진행되고 그 과정에서 개인과 가족의 안녕(well-being)에 부정적 영향을 미칠 가능성이 높다. -이러한 추세를 배경으로 정부는 금융취약계층의 채무부담을 줄이고 경제적 재기를 돕기 위한 다양한 개인채무자 지원제도를 시행해왔다. -이와 같이 금융한계가구와 같은 과중채무집단과 채무조정제도의 이용자가 증가하는 반면, 가계부채와 과중채무에 관한 지식기반은 취약한 실정이다. 특히, 과중채무의 원인과 제도 이용의 동기에 대한 이해는 매우 부족하다. -이 분야의 선행연구는 소비지출에 초점을 맞춘 일부 연구가 있으며, 대체로 소규모 표본을 이용하고 참여자의 자기보고 정보에 의존하는 방법론적 한계를 지닌다. -이 연구과제는 채무의 원인과 지원제도 이용의 동기와 관련하여, 실업, 사고, 의료비 부담 등 원치 않는 사건의 발생과 그로 인한 소득 감소나 과다 지출에 주목하는 ‘불운한 생애사’, 개인이 채무조정 신청에 따른 금전적 편익과 비용을 고려하는 ‘전략적 선택’과 ‘도덕적 해이’, 채무조정제도 신청자의 증가와 사회적 오명의 감소를 신청자 증가의 원인으로 보는 ‘사회적 낙인’, 금융과 부채 관리에 필요한 지식과 기술의 부족에 초점을 두는 ‘금융문맹’, 자기통제능력의 부족 등과 관련된 ‘제한적 합리성’ 등에 특히 주목하여 탐색하고자 한다. -이를 위하여 이 연구과제는 정형(structured), 비정형(unstructured) 빅 데이터의 활용과 경제학 실험기법의 적용을 통해 채무의 원인과 채무조정제도 이용의 동기에 대한 지식 기반을 확충하고, 그를 바탕으로 제도적𐤟정책적 개선에 기여하는 것을 목적으로 한다. -모바일인터넷과 소셜미디어의 확산으로 온라인상의 데이터 양이 기하급수적으로 증가하면서 빅 데이터는 경제적 가치 창출 뿐 아니라 사회문제의 이해와 예측, 공공정책의 개발과 평가에 기여할 수 있는 원천으로 자리잡아가고 있다. 소셜 빅 데이터는 데이터마이닝, 시각화, 머신러닝, 통계분석의 적용을 바탕으로 정보를 예측하고, 사회경제적 이슈의 동향을 감지하고 모니터링하는데 유용하다. -또한 통계청 자료와 국내의 각종 패널 데이터를 포함한 오프라인 정형 데이터를 분석하며, 그 결과를 소셜 빅 데이터의 분석과 연계하여 채무와 관련한 사회현상을 이해하고자 한다. 또한 빅 데이터 분석을 기반으로 채무와 채무조정제도 이용의 예측모형을 개발하고, 경제학 실험기법을 활용하여 의식, 사회성, 의사결정에서의 합리성과 채무 관련 특성의 연관성을 분석한다. -이 연구는 다양한 자료원으로부터 데이터를 수집하고 이를 통합 처리하는 데이터 과학의 발전과 사회과학 분야의 지식기반을 바탕으로, 사회과학과 공학 분야의 다학제적 융복합 연구를 통해, 비교적 최근에 주요 사회적 이슈로 등장한 가계부채와 과중채무 현상을 보다 잘 이해하고 나아가 사회공동체로서 이 문제의 해결 역량을 강화하는데 기여하고자 한다. -이 연구과제의 구체적인 연구목표는 다음과 같다. 1) 가계부채와 과중채무의 관련 특성을 분석하고 고위험집단을 선별한다. 정형데이타와 소셜 빅 데이터의 분석을 주요 수단으로 한다. 2) 과중채무의 원인과 채무조정제도 이용의 동기를 분석한다. 특히, 불운한 생애사, 전략적 선택, 도덕적 해이, 금융문맹, 제한적 합리성의 역할을 살펴본다. 이는 소셜 빅 데이터와 정형 데이터의 분석, 그리고 경제학 실험기법을 활용한다. 3) 과중채무 및 채무조정제도 이용의 예측모형을 개발한다. 소셜 빅 데이터와 정형 데이터의 연계분석에 기반한다.
  • 기대효과
  • 본 연구과제의 학문적, 실천적 기대효과는 다음과 같다. (혁신적, 미래지향적 융복합연구) 인구구조의 변화, 과학기술의 발전과 함께 사회구조와 기능 그리고 연구환경 역시 급변하고 있다. 특히 이동통신과 인터넷의 융합, 방송과 통신의 융합을 바탕으로 소통기술과 기능 그리고 데이터의 형식과 내용 역시 급속히 변화하고 있다. 이 연구과제는 정보통신기술과 기존 산업 및 서비스의 융합이 활발히 이루어지는 시대에, 다중격차 사회의 한 중요한 이슈를, 소셜 빅 데이터와 머신러닝 기법의 활용과 온오프라인 데이터의 연계 등을 통하여 살펴봄으로써, 디지털 컨버전스의 시대에 맞는 창의적 연구의 좋은 사례가 될 수 있을 것이다. (학술적 의의) 최근 중요한 사회적 이슈가 되고 있는 가계부채와 과중채무의 현상을 대상으로 개인적 요인과 사회적 요인을 탐색하고 합리성과 편익 추구 등 의사결정의 동기를 분석함으로써, 인간행동 및 사회현상에 대한 명확한 이해를 추구하고, 그를 바탕으로 사회과학 지식기반의 확장에 기여하는 것을 목표로 한다. 또한 흔히 4차 산업혁명으로 일컬어지는 사회경제 구조와 환경의 급격한 변화의 시대에 전개되는 연구환경의 변화를 반영하여 소셜 빅 데이터의 활용과 분석을 오프라인 정형데이터의 분석과 연계하고 경제학적 실험방법을 적용하는 등 사회과학과 공학 기반 융복합 연구의 좋은 사례를 제시할 것이다. (정책적 기여) 이 연구과제의 결과는 과중채무의 원인을 이해하고 채무자의 채무조정제도 이용의 동기를 분석함으로써 현재 시행되고 있는 여러 개인채무자 지원제도의 적절성을 파악하고 더 나아가 정책의 개선방향을 제시함으로써 실천적 가치가 있는 연구결과를 창출할 것이 기대된다. (신진 연구인력의 양성) 이 연구과제가 실행되면 전 과정에 석박사급의 연구보조원이 참여하여, 문헌탐색과 고찰부터 자료의 수집, 분석, 해석, 연구문제의 개발, 학술발표 및 논문을 통한 정보 공유의 기회를 가질 것이다. 이 과제가 다양한 연구방법을 적용하고, 사회과학과 공학 기반의 다학제적 융합연구이며, 사회적 이슈의 이론적 탐색과 정책적 개선 방안의 모색을 추구한다는 점에서, 참여 연구진, 특히 4차 산업 혁명에 적합한 차세대 전문 인력의 교육 및 연구 역량 강화에 크게 기여할 것으로 기대된다. 연구에 참여하는 대학원생은 패널데이터를 이용한 고급통계분석, 소셜 빅 데이터의 분석과 해석, 경제학적 실험기법의 적용과 분석, 국내외 학술대회 참가 및 학술논문 작성 참여를 통해 연구경험을 쌓을 수 있을 것이다. (연구역량의 강화) 이 연구의 결과는 국제학술지(SSCI급), 국내학술지(등재지), 국내외 학회 등을 통해 발표될 것이다. 구체적으로 연구결과를 바탕으로 한 논문을 연평균 2~3편, 총 6~9편 국내외 우수학술지에 출간할 계획이다. 채무 이슈에 대한 사회적𐤟정책적 관심, 창의적인 연구방법의 적용, 융합적인 연구 인력의 협업에 바탕을 둔 다양한 접근방법 등을 고려할 때 이 연구과제의 결과에 대한 많은 관심을 기대할 수 있다. (교육과의 연계) 이 연구의 과정, 결과, 생산물은 이후 학부 및 대학원 과정의 다양한 관련 과목들—사회조사방법론, 자료분석론, 빅데이터 연구방법론, 실험경제학, 사회문제론, 프로그램 개발과 평가, 정책평가 및 분석—을 위한 사례를 제시하고, 내용을 풍부히 하는 데에 이용될 수 있을 것이다.
  • 연구요약
  • 이 연구과제는 과중채무의 원인과 채무조정제도 이용의 동기를 분석하고 예측모형을 개발하는 것이 목표이다. 그를 위해 소셜 빅 데이터의 수집과 분석, 정형 빅 데이터의 분석, 머신러닝 기술, 경제학 실험기법을 적용한다. 첫째, 소셜 빅 데이터 연구의 내용은 다음과 같다. 1) 먼저 채무에 대한 이론적, 경험적 연구 등을 분석하여 분류체계를 개발하고 분석모델링을 실시한다. 이 후 온라인 채널에서 채무관련 온라인 문서를 수집하여 자연어처리와 주제분석을 통하여 온톨로지를 개발한다. 2) 소셜 빅 데이터 자료 수집은 크롤러를 보유하고 있고 소셜 빅 데이터의 수집과 분류 경험이 풍부한 SKT의 데이터 센터(SKT 스마트인사이트)에 의뢰하여 채무관련 온라인 문서를 수집할 것이다. 연구대상 자료는 2014년부터 2018년까지 5년 동안 트위터, 온라인 뉴스 사이트, 블로그, 카페, 게시판 등 약 220여개의 온라인 채널에서 수집할 예정이다. 3) 채무 관련 온라인 문서 수집은 온톨로지에 명시된 수집대상과 수집범위 등을 설정한 후, 대상채널(뉴스, 블로그, 카페, 게시판, 트위터 등)에서 크롤러 등 수집 엔진(로봇)을 이용하여 실시한다. 4) 수집된 채무 관련 온라인 문서는 텍스트 형태의 비정형 데이터로 주제분석(text mining)과 감성분석(opinion mining)을 통하여 분류하고 정제한다. 5) 키워드의 발생 빈도에 대한 코드화 작업을 통하여 정형 빅 데이터로 변환한다. 6) 단어빈도와 문서빈도를 이용하여 미래신호를 탐색하고, 탐색된 신호들을 분류과정을 통해 새로운 현상을 발견하고 예측할 수 있는 머신러닝 분석과 시각화를 실시한다. 7) 위험예측을 위한 연관분석, 군집분석 등을 실시한다. 둘째, 오프라인 정형 데이터의 분석이다. 1) 개인적 차원의 분석은 미시자료를 활용한 횡단 및 종단분석을 실시한다. 분석은 불운한 생애사, 도덕적 해이, 전략적 선택, 사회적 낙인 가설 등을 탐색하는데 초점을 둔다. 구체적으로, 고용지위의 변화, 건강 및 장애 상태의 변화, 가족해체 등 원치 않는 사건의 발생, 소득에 비해 과도한 소비와 지출로 인한 소득충격 및 채무상환 능력의 손실이 과중채무의 경험과 진입과 연관이 있을 가능성을 살펴본다. 2) 미시데이터에 지역 정보를 결합하고 지역 간 격차의 탐색을 통해서 개인 수준 연구에서는 드러나지 않는 과중채무와 채무조정제도 이용에 영향을 미치는 지역적 요인과 분석모델에 포함한 요인 간 결합구조(configulation)을 이해한다. 3) 또한, 과중채무자의 규모와 채무조정제도 이용 규모의 시계열적 분석를 통해 제도의 이용률이 상대적으로 증가 또는 감소하였는지를 분석하여 채무조정제도에의 접근성과 인식이 시간의 흐름에 따라 변화했을 가능성도 살펴본다. 4) 채무와 관련된 현상을 정형, 비정형 빅 데이터를 연계하여 분석하기 위해서 정형화된 소셜 빅 데이터와 오프라인 통계(조사) 자료와 연계하여 요인 간 인과관계나 시간별 궤적을 분석할 수 있는 구조방정식모형 분석이나 시간별(시간/일/월/년) 사회현상과 관련한 요인과의 관계를 분석할 수 있는 다층모형 분석 등을 적용할 예정이다. 셋째, 실험 연구는 소셜 빅데이터 수집 자료와 연계하여 채무 관련 온라인 자료 수집이 주로 이루어지는 온라인 공간을 파악하고, 이 공간의 참여자들을 대상으로 온라인 상에서 실험 참여자 모집과 실험을 진행한다. 경제학 실험 조사의 구체적인 내용은 크게 네 가지로 구분된다. 1) 합리성과 위험 선호 측정 2) 시간 선호율과 현재 편향 3) 자기통제와 자기통제능력에 대한 인식(self-awareness) 측정 4) 친사회성
결과보고시 연구요약문
  • 국문
  • 이 연구과제는 최근 중요한 사회적 이슈가 되고 있는 가계부채와 과중채무 현상을 대상으로 개인적 요인과 사회경제적 요인을 탐색함으로써, 인간행동 및 사회현상에 대한 명확한 이해를 추구한다. 흔히 4차 산업혁명으로 일컬어지는 사회경제 구조와 환경의 급격한 변화의 시대에 전개되는 연구환경의 변화를 반영하여 소셜 빅데이터를 활용하고 기존의 사회조사자료를 분석하는 등 사회과학과 공학 기반 융복합 연구의 좋은 사례를 제시한다. 이 연구과제의 결과는 첫째, 빅데이터와 머신러닝 알고리듬을 이용하여 소득, 부채액, 원리금 상환액, 신용거래와 같은 개인정보 없이 온라인 문서에 등장하는 다양한 채무 및 인구사회학적 특성 요인들의 조합으로 가계부채의 부실위험을 상당히 높은 수준에서 예측할 수 있음을 보여주고 사회현상을 이해하고 예측하는데 빅데이터를 이용하는 좋은 사례를 제시하고 있다. 둘째, 이 연구의 결과는 사회적 위험으로 간주될 수 있는 불운한 생애사의 경험과 과중채무를 보유할 가능성이 밀접한 관련을 가지며 과중채무를 예방하기 위해 사회적 위험에의 대처가 함께 고려되어야 한다. 셋째, 과중채무로 인한 재정적 위기와 그로 인한 경제적 스트레스는 가족 갈등과 부부폭력 등 삶의 질에 부정적 영향을 미친다는 점 등을 보여주었다. 이 연구과제의 결과는 과중채무의 원인과 결과 및 채무자의 채무조정제도 이용 동기와 결과를 분석함으로써 가계부채에 대한 이해를 높이고 관련 정책의 개선방향을 제시하였다.
  • 영문
  • This research project aims to examine personal and socioeconomic factors for personal debt and over-indebtedness in order to enhance our understanding of an important social issue. To achieve the goals, this study has used big data, machine learning algorithm as well as national panel data and interview surveys. Main findings of this research are as follows: First, machine learning algorithms were highly capable of predicting the quality of household debt based on a combination of an array of debt-related and sociodemographic characteristics without such information as income, asset, total amount of debt, amount of repayment; Second, households who reported experiencing unemployment, disability, or divorce had a higher likelihood of being in over-indebtedness, and the likelihood of being in over-indebtedness was significantly higher during the period after the incidence of adverse life events; Third, the ratio of debt payment to disposal income and the level of subprime loans are significantly associated with a greater level of family conflict and domestic violence. The findings of this research project contribute to enhancing our understanding of the causes and consequences of personal debt and over-indebtedness.
연구결과보고서
  • 초록
  • 이 연구과제의 목표는 사회과학 및 공학 기반 다학제적 연구를 바탕으로 광범위한 사회적 현상이 된 가계부채와 채무조정제도 이용의 원인을 분석하고 예측모형을 개발하는 것이다.
    우리나라의 가계부채 규모는 빠르게 증가해 왔다. 한편, 상환능력에 비해 과중한 채무를 가지고 있거나, 금융채무의 연체나 상환불능에 빠지는 개인 또는 가구 역시 증가하였다. 과중채무의 경험과 그에 따른 채무불이행과 신용하락 그리고 채무조정제도로의 진입은 대체로 장기간에 걸쳐 진행되고 그 과정에서 개인과 가족의 안녕(well-being)에 부정적 영향을 미칠 가능성이 높다. 이러한 추세를 배경으로 정부는 금융취약계층의 채무부담을 줄이고 경제적 재기를 돕기 위한 다양한 개인채무자 지원제도를 시행해왔다.
    과중채무집단과 채무조정제도의 이용자가 증가하는 반면, 가계부채와 과중채무에 관한 지식기반은 취약하다. 특히, 과중채무의 원인과 제도 이용의 동기와 결과에 대한 정보가 매우 부족하므로 이 연구과제는 이 부분을 극복하는데 기여하고자 하였다. 이를 위하여 이 연구과제는 정형(structured), 비정형(unstructured) 빅데이터, 즉 소셜 빅데이터와 행정데이터, 그리고 각종 사회조사 데이터를 활용하여 채무의 원인과 채무조정제도 이용의 동기 및 결과를 분석하고 채무와 채무조정제도 이용의 예측모형을 개발하고자 한다.
    이 연구과제의 결과는 첫째, 빅데이터와 머신러닝 알고리듬을 이용하여 소득, 부채액, 원리금 상환액, 신용거래와 같은 개인정보 없이 온라인 문서에 등장하는 다양한 채무 및 인구사회학적 특성 요인들의 조합으로 가계부채의 부실위험을 상당히 높은 수준에서 예측할 수 있음을 보여주고 사회현상을 이해하고 예측하는데 빅데이터를 이용하는 좋은 사례를 제시하고 있다. 둘째, 이 연구의 결과는 사회적 위험으로 간주될 수 있는 불운한 생애사의 경험과 과중채무를 보유할 가능성이 밀접한 관련을 가지며 과중채무를 예방하기 위해 사회적 위험에의 대처가 함께 고려되어야 한다. 셋째, 과중채무로 인한 재정적 위기와 그로 인한 경제적 스트레스는 가족 갈등과 부부폭력 등 삶의 질에 부정적 영향을 미친다는 점 등을 보여주었다.
    이 연구과제의 결과는 과중채무의 원인과 결과 및 채무자의 채무조정제도 이용 동기와 결과를 분석함으로써 가계부채에 대한 이해를 높이고 관련 정책의 개선방향을 제시하였다.
  • 연구결과 및 활용방안
  • 첫째, 가계부채의 원인, 특성, 결과를 포괄하는 온톨로지는 소셜 빅데이터는 물론 나아가 공공 및 민간기관에서 수집, 보유하고 있는 채무와 신용 관련 데이터를 탐색하는 분석틀로 활용될 수 있으며, 기존 사회조사(survey) 연구에서 활용된 연구 모형을 보완하는 역할을 수행할 수 있다.
    둘째, 이 연구에서 활용한 소셜 빅데이터는 개인이 자발적으로 직접 표현하는 반응, 의견, 감정, 가치 등을 포함한다는 점에서 사회복지 분야에서 많이 이용하고 있는 설문조사 등에 기반한 이차데이터와 차별화된다. 특히, 기존 데이터에서 수집이 제한되었던 개인의 감정과 가치 그리고 이들의 시간의 흐름에 따른 변화 여부 등을 분석하는데 유용하게 활용될 수 있다.
    셋째, 소셜 빅데이터와 머신러닝을 이용한 예측모형, 즉 인공지능의 개발이 사회현상과 사회문제 위험집단의 예측에 유용한 수단으로 기능할 수 있다. 국내 금융기관의 신용평가제도(예: NICE 평가정보)는 개인의 소득, 금융기관 거래 및 대출 이력, 원리금상환과 연체 정보, 신용거래정보 등을 이용하여 신용수준을 구분하고, 이를 대출승인여부, 대출가능금액, 신용카드 발급, 적용금리를 위한 의사 결정에 사용된다. 이 연구에서 개발한 채무 건전성 예측 인공지능 역시 신용수준을 평가하고 예측하기 위한 한 수단으로 활용될 수 있다. 나아가 이 예측모형은 가계부채 부실위험 집단을 선별하는데 활용되어 부실위험의 예방과 지원방안 마련에 기반을 마련하는데 기여할 수 있다.
    넷째, 이 연구에서 이용한 온라인문서 외에 또 다른 대표적인 빅데이터로 행정데이터를 들 수 있다. 특히 사회복지와 보건의료 분야는 방대한 규모의 행정데이터가 구축되어 있어 이들 데이터들은 공공서비스 수요의 예측, 위험집단의 선별, 서비스 이용 요인 및 영향과 결과의 분석에 매우 유용하게 이용될 수 있다. 본 연구에서 제시한 예측모형 개발 과정을 개인회생법원이나 신용회복지원제도의 공공데이터에 적용하면 개인파산, 개인회생, 신용회복제도 신청자 중 누가 완제 확률이 높고, 중도탈락위험을 높이는 특성은 무엇이며, 경제적 재기의 확률과 관련요인은 무엇인지 등을 이해하는데 매우 유용할 것이다.
  • 색인어
  • 가계부채, 과중채무, 채무조정, 빅데이터, 머신러닝, 예측모형
  • 연구성과물 목록
데이터를 로딩중 입니다.
데이터 이용 만족도
자료이용후 의견
입력