연구성과물검색
유형별/분류별 연구성과물 검색
HOME ICON HOME > 연구과제 검색 > 연구과제 상세정보

연구과제 상세정보

비정형 데이터를 이용한 ICO(Initial Coin Offering) 평가 핵심 요인 도출 및 프레임워크 구축에 관한 연구
A Study on the Key Factors and Framework for Evaluation of Initial Coin Offering (ICO) Using Unstructured Data
  • 연구자가 한국연구재단 연구지원시스템에 직접 입력한 정보입니다.
사업명 중견연구자지원사업
연구과제번호 2020S1A5A2A01042616
선정년도 2020 년
연구기간 1 년 (2020년 07월 01일 ~ 2021년 06월 30일)
연구책임자 강주영
연구수행기관 아주대학교
과제진행현황 종료
과제신청시 연구개요
  • 연구목표
  • ○ 초연결사회(Hyper-connected society)를 구현하기 위한 기반 기술로 블록체인이 주목받고 있으며, 최근에는 암호화폐 및 블록체인 기반 프로젝트를 위한 투자금을 암호화폐(Cryptocurrency)로 모집하는 행위인 ICO(Intial Coin Offering)이 자주 발생하고 있음
    ● ICO는 프로젝트의 초기 단계에서, 블록체인을 기반으로 한 코인 또는 토큰을 온라인상에서 공개적으로 판매함으로써 필요한 자금을 조달하고, 투자자에게 참여 비율에 따라 공개적으로 코인 또는 토큰을 분배하는 과정을 포함함

    ○ ICO는 법에 정해진 절차 없이 일종의 사업 계획서인 백서(white paper)를 통해 암호화폐에 기반한 미래 사업의 비전을 제시하는 방식으로 투자자를 모집함
    ● 백서는 일반적으로 미래 가치를 공정하게 판단하기 어렵고, 프로젝트를 과장하기 때문에, 투자자로 하여금 과도한 기대를 갖게 하는 경향이 있음

    ○ 최근 일부 기업이 무분별하게 ICO를 진행하고 해킹, 사기적 모집이 증가하고 있기 때문에, 우리나라를 포함하여 중국, 미국 등 각국이 ICO 규제를 강화하고 있는 추세임

    ○ 본 연구에서는 최근 급증하는 암호화폐 ICO 행위와 관련, 인터넷에서 공개된 자료를 수집하고, 데이터 분석을 통해 ICO를 정량적으로 평가하고자 함.
    ● 인터넷상에 공개된 백서, 블록체인 암호화폐의 소스 코드, 관련 커뮤니티 내의 텍스트 데이터와 여론의 형성 및 전파 과정 등에 대한 분석을 진행하고자 함.
    ● 백서, 커뮤니티 내 여론을 기계학습 모델에 투입하기 위해 텍스트 임베딩 알고리즘인 BERT를 적용하여 텍스트 벡터 특성(feature)을 도출할 계획임
    ● 또한, 블록체인 암호화폐간 소스 코드의 유사도 분석을 위해 코드 분석 알고리즘인 exEyes, MOSS 등을 적용하여 기존 소스 코드들과의 유사도를 판명하고자 함
    ● 마지막으로, 커뮤니티 여론 전파의 사용자 네트워크 구조를 기계학습에 투입하기 위해 node2vec 알고리즘을 적용하고자 함

    ○ 데이터 기반의 정량적 ICO 평가방법론 제시
    ● 기업공개(IPO)를 분석하고 평가하는 사례는 다수 존재하지만 ICO를 평가하는데 최적화된 방법론에 대한 연구는 미진함
    ● 기존 ICO 평가방법론들은 평가자가 평가표에 직접 점수를 매기는 정성적인 방법으로 평가가 이루어지고 있으나 ICO에 적합한 평가 방식을 차용하지 못함
    ● 기업공개(IPO)와 비즈니스 모델 평가방법론을 확장하여 블록체인 및 암호화폐를 다루는 ICO에 최적화된 평가방법론을 고안할 필요가 있음.
    ● 본 연구에서는 ICO가 진행될 때 발생하는 데이터인 블록체인에 기반한 암호화폐 소스코드, 백서(White Paper), 마케팅 자료를 크롤링을 통해 수집 후 머신 러닝 모델에 투입하기 위한 node2vec, BERT와 같은 벡터 임베딩 기법을 적용하여 분석에 활용할 계획임
    ● 머신러닝 기반의 분석을 통해 정성적 평가 기준이 아닌 정량적 평가 기준을 수립하여 객관적인 ICO 평가 지표를 제시할 수 있을 것으로 기대됨.
    ○ 사기 ICO 예방을 위한 방법론 제시
    ● 금전 편취를 위한 사기 ICO가 범람하고 있음에도 불구하고 이를 평가하는 평가 방법 체계와 이를 탐지하고 예방하기 위한 연구가 부족한 상황임
    ● 본 연구를 통해 ICO의 정량적 평가방법론이 수립되는 경우, 사기 ICO에 대한 예방 시스템을 구축하여 건전한 블록체인 생태계 수립에 기여할 수 있음
  • 기대효과
  • 1. 학문적 기여
    ○ 최신 임베딩 알고리즘을 활용한 비정형 데이터의 특성 공학 방법론 제시
    ● 지금까지 비정형 데이터를 활용한 연구는 텍스트 데이터에 국한되어 오고 있음. 또한, 이러한 데이터를 활용한 실질적인 문제 해결보다는 탐색적인 연구 문제 해결에만 사용되는 경우가 많았음
    ● 본 연구는 텍스트 데이터, 네트워크 데이터 등을 구축하고, 이를 각각의 벡터 임베딩 기법으로 특성을 추출하여 실질적인 문제 해결을 위한 지도 학습에 활용하는 방법론을 제시하였음

    2. 실무적 관점
    ○ 최근 늘어나고 있는 블록체인 관련 비즈니스 평가 모형 제안
    ● 다양한 ICO가 범람하고 있는 가운데 성공적인 ICO를 예측하고, 이를 평가하기 위한 연구는 이루어지지 않음.
    ● ICO의 특성상, 제한된 자료를 이용하여 투자를 평가하고 있기 때문에 투자자의 경험과 판단이 중요하지만, 이를 평가하기 위한 모형은 정성적인 수준으로 이루어지고 있었음
    ● 본 연구에서는 ICO 과정 중에 나타나는 다양한 데이터들을 바탕으로 효과적인 투자를 위한 객관적인 평가 모형을 제안하였음

    ○ ICO 사기 관련 예방 및 탐지 모형 제안
    ● ICO와 관련한 다양한 사기 사건이 발생하고 있어 적잖은 사회적 손해가 발생함
    ● ICO에 대한 객관적인 평가 지표가 없어 투자자들은 큰 위험을 감수해야 함
    ● 블록체인 암호화폐는 계속해서 만들어지고 있지만 투자대상으로써 평가하기 위해서는 전문 지식이 필요하여 투자자들의 피해가 점점 커지는 상황임
    ● 따라서 ICO가 사기인지를 객관적으로 평가하여 불필요한 사회적 비용을 줄이고 미래의 암호화폐 금융시장에 대한 선제적 대응이 가능할 것으로 기대됨
  • 연구요약
  • ○ 본 연구는 ICO의 성공 가능성 및 사기 여부를 탐지하기 위해 블록체인 암호화폐 소스코드, 백서, 커뮤니티 여론등 다양한 데이터를 수집하여 ICO를 여러 관점에서 정량적으로 평가하고자 함

    ○ 이를 위해 데이터 수집, Feature 개발, 데이터 분석, 결과 검증의 절차를 거쳐 연구를 진행하고자 함

    ○ 먼저, ICO 평가를 위한 체계적인 평가 프레임워크를 구상할 계획임
    ● 기존의 IPO 평가 연구를 분석하여 ICO를 평가하기 위한 핵심적인 특성(feature)을 재정의하여 블록체인 암호화폐에 대한 평가 체계를 설계하고자 함
    ● ICO에 대해 공식적으로 공개되는 자료는 백서와 블록체인 암호화폐 소스코드가 전부라고 볼 수 있으므로 해당 자료를 수집함과 동시에 ICO와 관련된 커뮤니티 여론 또한 사용자들의 투자 결정에 많이 참고되므로 사용자들의 여론에 대한 오피니언 마이닝(Opinion Mining)을 수행할 절차를 구축할 것임
    ● 최근 블록체인 암호화폐는 금융시장의 관심사이며 새로운 암호화폐에 대한 언론, 투자기관의 관심을 받고 있으므로 뉴스기사 또는 투자기관 의견 등을 종합하는 체계를 수립할 예정임
    ● 최종적으로 ICO 주요 특성별 정량적인 평가 지표를 제안하여 기존의 ICO와 새로이 등장하는 ICO를 객관적으로 평가할 수 있도록 할 것임

    ○ 둘째, 기존 IPO 평가 기법을 ICO에 적합하게 확장하여 설계한 평가 프레임워크에 따라 ICO 데이터를 수집할 계획임
    ● 암호화폐 ICO의 경우 실체 구현체인 소스코드를 공개함으로써 자신들의 기술력을 증명함
    ● 하지만, 사기 ICO로 판명난 과거 프로젝트 중에도, 소스 코드는 기존 프로젝트의 것을 베껴오는 것이 있어, 소스 코드의 공개 여부만으로도 전문가가 아닌 사람들이 기술력에 대한 검증을 진행하는 것은 불가능에 가까움
    ● ICO 백서를 구성하는 핵심 요인을 추출하여 DB화하고, ICO에서 제시하는 블록체인 암호화폐 소스코드의 유사도 판별, 핵심 코드 도출을 위한 임베딩 기법을 적용할 예정임
    ● 소스 코드 및 저장소 내의 활동기록 등을 추출하여 저장하고자 함
    ● 만약 소스 저장소가 없는 경우, 저장소 관련 벡터의 값을 결측치로 두어 모델에서 소스 저장소가 없는 것을 반영시키도록 할 계획임

    ○ 셋째, ICO 백서로부터 추출된 정보와 함께 다양한 채널을 통해 관련 텍스트 데이터를 수집할 계획임
    ● 한국의 경우 암호화폐 투자 관련 논의가 활발한 다음의 “코인천사” 카페 및 클리앙 “암호화폐당” 게시판, 암호화폐 모임인 “DDENGLE” 등의 커뮤니티를 웹 크롤링하여 특정 암호화폐에 대한 사용자들의 여론을 수집할 계획임
    ● 또한, 네이버 블로그, 다음 블로그, 티스토리 등의 블로그 플랫폼에 올라오는 특정 코인 관련 포스트들에 대해서도 웹 크롤링을 이용하여 텍스트 데이터를 구축할 계획임.
    ● 국외 ICO의 경우, 다양한 해외 채널을 발굴하여 수집할 계획임.
    ● 수집된 텍스트 데이터는 텍스트 벡터 임베딩 알고리즘인 BERT와 감성분석을 통해 연구에 활용될 계획임
    ● 또한, 커뮤니티의 여론 확산 구조를 작성자-댓글 등의 네트워크 구조로 확인 후 네트워크를 node2vec 알고리즘으로 벡터화할 계획임

    ○ 마지막으로 객관적인 평가방법론을 도출하기 위해 기존 ICO 백서를 통해 성공적으로 상장된 암호화폐 및 실패 사례, 사기로 판명된 사례를 분류하는 분류기 개발할 계획임
    ● ICO 백서의 분류기 개발을 위해 수집된 데이터에 구체적인 라벨링(labeling) 작업을 수행하여 고품질의 학습 데이터를 구축하고자 함
    ● 분류기는 성공, 실패, 사기를 분류할 뿐만 아니라 판단에 대한 신뢰도를 바탕으로 점수화할 수 있는 지표를 도출하도록 구현할 예정임
    ● ICO 백서로부터 추출된 핵심 특성(feature)과 더불어 웹 크롤링으로 얻은 정보를 결합하여 신뢰도를 확보할 수 있는 지표로 발전시킬 예정임

    ○ 데이터 분석은 Deep Learning과 Gradient Boosting을 활용하여 Ensemble Model을 통해 데이터를 분류하고자 함
    ● 첫 번째 모형인 Deep Learning 모형에서는 텍스트 데이터를 BERT 알고리즘을 통해 벡터화시킨 데이터셋을 이용하여 합성곱 신경망 분류 모델을 사용하여 분류할 예정임
    ● 두 번째 모형인 Gradient Boosting 분류 모형에서는 벡터 형태의 Feature들을 모두 투입하여 유의미한 분류 모형을 구축할 계획임
    ● 본 연구에서 활용하고자 하는 Gradient Boosting알고리즘인 catboost 알고리즘은 Anna Veronika Dorogush et al.,(2017)에 의하면 범주형 자료 분류에 최적화된 변환 기법을 가지고 있는 것으로 확인 됨
    ● 따라서, 성공, 실패, 사기 3개의 분류로 데이터를 구분하는 해당 연구에 가장 적합한 알고리즘으로 확인하였음
결과보고시 연구요약문
  • 국문
  • 본 연구는 ICO의 성공 가능성 및 사기 여부를 탐지하기 위해 백서 등의 데이터를 수집하여 ICO를 여러 관점에서 정량적으로 평가하고자 하였으며, 이를 위해 데이터 수집, Feature 개발, 데이터 분석, 결과 검증의 절차를 거쳐 연구를 진행하였다. 이를 위해 먼저, ICO 평가를 위한 체계적인 평가 프레임워크를 구상하였다. 기존의 IPO 평가 연구를 분석하여 ICO를 평가하기 위한 핵심적인 특성(feature)을 재정의하여 블록체인 암호화폐에 대한 평가 체계를 설계하였다. 그리고, ICO에 대해 공식적으로 공개되는 자료는 백서 등 자료를 수집하여, ICO 주요 특성별 정량적인 평가 지표를 제안하여 기존의 ICO와 새로이 등장하는 ICO를 객관적으로 평가하고자 하였다. 또한, 객관적인 평가방법론을 도출하기 위해 기존 ICO 백서를 통해 성공적으로 상장된 암호화폐 및 실패 사례, 사기로 판명된 사례를 분류하는 분류기 개발하고자 하였다. 이를 통해 최종적으로 투자자가 ICO의 성공, 실패 및 사기 여부를 자의적으로 판단할 수 있는 정량적 지표를 도출하여, 투자자로 하여금 다각적인 측면에서 ICO를 평가할 수 있도록 하는 최적화된 가이드라인을 통해 자동적으로 도출된 핵심요인별 정량적 평가 지표를 제시하고자 하였다.
  • 영문
  • This study aimed to quantitatively examine the ICO from a variety of viewpoints by collecting data such as white papers in order to detect the ICO's potential for success and fraud. proceeded. To this objective, a systematic evaluation methodology for ICO evaluation was developed first. The blockchain cryptocurrency evaluation method was created by redefining the main features for evaluating ICOs and examining prior IPO evaluation research. Furthermore, using publicly available data on ICOs, we attempted to objectively evaluate existing and new ICOs by gathering material such as white papers and offering quantitative evaluation markers for each main ICO characteristic. In addition, in order to construct an objective evaluation approach, we attempted to create a classifier that categorizes successfully listed cryptocurrencies, failed instances, and cases discovered to be fraudulent using the current ICO white paper. We hopt that this would results in the automatic generation of quantitative indicators that allow investors to arbitrarily appraise the success, failure, and fraud of the ICO, as well as optimized rules that allow investors to evaluate the ICO from numerous perspectives.
연구결과보고서
  • 초록
  • 본 연구는 ICO의 성공 가능성 및 사기 여부를 탐지하기 위해 백서 등의 데이터를 수집하여 ICO를 여러 관점에서 정량적으로 평가하고자 하였으며, 이를 위해 데이터 수집, Feature 개발, 데이터 분석, 결과 검증의 절차를 거쳐 연구를 진행하였다. 이를 위해 먼저, ICO 평가를 위한 체계적인 평가 프레임워크를 구상하였다. 기존의 IPO 평가 연구를 분석하여 ICO를 평가하기 위한 핵심적인 특성(feature)을 재정의하여 블록체인 암호화폐에 대한 평가 체계를 설계하였다. 그리고, ICO에 대해 공식적으로 공개되는 자료는 백서 등 자료를 수집하여, ICO 주요 특성별 정량적인 평가 지표를 제안하여 기존의 ICO와 새로이 등장하는 ICO를 객관적으로 평가하고자 하였다. 또한, 객관적인 평가방법론을 도출하기 위해 기존 ICO 백서를 통해 성공적으로 상장된 암호화폐 및 실패 사례, 사기로 판명된 사례를 분류하는 분류기 개발하고자 하였다. 이를 통해 최종적으로 투자자가 ICO의 성공, 실패 및 사기 여부를 자의적으로 판단할 수 있는 정량적 지표를 도출하여, 투자자로 하여금 다각적인 측면에서 ICO를 평가할 수 있도록 하는 최적화된 가이드라인을 통해 자동적으로 도출된 핵심요인별 정량적 평가 지표를 제시하고자 하였다.
  • 연구결과 및 활용방안
  • 1. 학문적 기여
    ○ 최신 임베딩 알고리즘을 활용한 비정형 데이터의 특성 공학 방법론 제시
    ● 지금까지 비정형 데이터를 활용한 연구는 텍스트 데이터에 국한되어 오고 있음. 또한, 이러한 데이터를 활용한 실질적인 문제 해결보다는 탐색적인 연구 문제 해결에만 사용되는 경우가 많았음
    ● 본 연구는 텍스트 데이터, 네트워크 데이터 등을 구축하고, 이를 각각의 벡터 임베딩 기법으로 특성을 추출하여 실질적인 문제 해결을 위한 지도 학습에 활용하는 방법론을 제시하였음

    2. 실무적 관점
    ○ 최근 늘어나고 있는 블록체인 관련 비즈니스 평가 모형 제안
    ● 다양한 ICO가 범람하고 있는 가운데 성공적인 ICO를 예측하고, 이를 평가하기 위한 연구는 이루어지지 않음.
    ● ICO의 특성상, 제한된 자료를 이용하여 투자를 평가하고 있기 때문에 투자자의 경험과 판단이 중요하지만, 이를 평가하기 위한 모형은 정성적인 수준으로 이루어지고 있었음
    ● 본 연구에서는 ICO 과정 중에 나타나는 다양한 데이터들을 바탕으로 효과적인 투자를 위한 객관적인 평가 모형을 제안하였음

    ○ ICO 사기 관련 예방 및 탐지 모형 제안
    ● ICO와 관련한 다양한 사기 사건이 발생하고 있어 적잖은 사회적 손해가 발생함
    ● ICO에 대한 객관적인 평가 지표가 없어 투자자들은 큰 위험을 감수해야 함
    ● 블록체인 암호화폐는 계속해서 만들어지고 있지만 투자대상으로써 평가하기 위해서는 전문 지식이 필요하여 투자자들의 피해가 점점 커지는 상황임
    ● 따라서 ICO가 사기인지를 객관적으로 평가하여 불필요한 사회적 비용을 줄이고 미래의 암호화폐 금융시장에 대한 선제적 대응이 가능할 것으로 기대됨
  • 색인어
  • 암호화폐, 투자예측, 사기탐지, ICO, 블록체인, 텍스트마이닝, BERT, node2vec, 딥러닝, 인공지능, 합성곱 신경망
  • 연구성과물 목록
데이터를 로딩중 입니다.
데이터 이용 만족도
자료이용후 의견
입력