연구성과물검색
유형별/분류별 연구성과물 검색
HOME ICON HOME > Search by Achievements Type > Reports View

Reports Detailed Information

https://www.krm.or.kr/krmts/link.html?dbGubun=SD&m201_id=10016452&local_id=10018218
DTW와 Fusion 기법을 이용한 비유사도 기반 식별기의 최적화와 이를 활용한 희소성 문제의 해결
Reports NRF is supported by Research Projects( DTW와 Fusion 기법을 이용한 비유사도 기반 식별기의 최적화와 이를 활용한 희소성 문제의 해결 | 2008 Year 신청요강 다운로드 PDF다운로드 | 김상운(명지대학교) ) data is submitted to the NRF Project Results
Researcher who has been awarded a research grant by Humanities and Social Studies Support Program of NRF has to submit an end product within 6 months(* depend on the form of business)
  • Researchers have entered the information directly to the NRF of Korea research support system
Project Number D00115
Year(selected) 2008 Year
the present condition of Project 종료
State of proposition 재단승인
Completion Date 2009년 11월 23일
Year type 결과보고
Year(final report) 2009년
Research Summary
  • Korean
  • 최근 비유사도기반 식별법(DBCs)의 식별성능을 향상시키기 위하여 김과 듀인은 패턴식별을 위한 일반화 단계에서의 식별기 설계 뿐만 아니라 특징표현단계에서도 퓨전기법을 동시에 적용하는 다단계 퓨전기법(MFS)을 제안하였다. 그러나 다단계 퓨전기법은 여러 개의 비유사도 행렬을 결합할 때 응용에 따라서는 비정의적인(indefinite) 특성을 갖게 된다. 따라서 결합 비유사도행렬은 유클리디 공간에서는 메트릭(metric) 특성이 만족되지 않기 때문에 전통적인 식별기법의 적용에 한계가 있게 된다. 이와 같은 문제를 해결하기 위하여 본 연구에서는 CCC (combine-correct-combine)라고 이름 붙인 유클리디언 교정 과정을 표현단계와 일반화 단계 사이에 추가하는 새로운 방법을 제안하였다. 본 연구의 CCC 기법 첫 번째 단계에서는 다양한 측정법으로 작성한 비유사도행렬을 표현 결합법으로 결합하여 새로운 비유사도 행렬을 생성한다. 그리고 두 번째 단계에서는 의사 유클리디언 임베이딩 알고리즘을 이용하여 전 단계에서 생성한 비유사도행렬의 내부 견고성(internal consistency)을 향상시킨다. 그리고 마지막 단계로, 내부 구조가 정제된 비유사도 행렬에서 학습한 다양한 식별기를 다시 결합시켜 식별성능을 시킨다. 제안한 CCC기법을 잘 알려져 있는 벤치마크 영상 데이터베이스를 대상으로 실험한 결과 CCC기법은 기존의 다중 퓨전기법인 MFS 보다 식별성능을 더 향상시킬 수 있음을 확인하였다. 특히, 평균결합법으로 비유사도공간을 생성한 다음, 의사 유클리디언 알고리즘으로 임베딩한 후, 학습 결합기 식별할 때 가장 높은 식별 성능을 얻을 수 있었다. 이와 같은 실험결과로부터, 본 연구에서 제안한 CCC 기법은 고차원 영상식별에서 발생하는 소규모 학습 데이터에 기인한 문제 (SSS문제)를 해결할 수 있는 대안이 될 수 있음을 확인하였다.
  • English
  • Recently, to increase the classification accuracy of dissimilarity-based classifications (DBCs), Kim and Duin proposed a method of simultaneously employing fusion strategies in representing features (representation step) as well as in designing classifiers (generalization step). In this multiple fusion strategies, however, the resulting dissimilarity matrix is sometimes an indefinite one, causing problems in using the traditional pattern recognition tools after embedding the matrix in a vector space. To overcome this problem, we study a new way, named combine-correct-combine (CCC) scheme, of additionally employing an Euclidean correction procedure between the two steps. In CCC scheme, we first combine dissimilarity matrices obtained with different measures to a new dissimilarity representation using a representation combining strategy. Next, we correct the dissimilarity matrix using a pseudo-Euclidean embedding algorithm to improve the internal consistency of the matrix. After that, we again utilize the classifier combining strategies in the refined dissimilarity matrix to achieve an improved classification for a given data set. Our experimental results for well-known benchmark image databases demonstrate that the CCC mechanism works well and achieves further improved results in terms of the classification accuracy compared with the previous ones. Especially the results demonstrate that the highest accuracies are obtained when the averaged dissimilarity representation refined with the pseudo-Euclidean embedding is classified by the trainable combiners. From these considerations, we confirm the possibility that the proposed CCC scheme could be used as a means of avoiding the small sample size problem of a high-dimensional image classification.
Research result report
  • Abstract
  • 본 방문연구에서는 비유사도 기반 식별기(Dissimilarity-Based Classifiers: DBC)의 비유사도 작성단계에서의 DTW(Dynamic Time Warping)와 식별기 학습단계에서 퓨전기법을 중복 적용하는 다단계 퓨전기법(Multi-level Fusion Strategies: MFS)으로 DBC를 최적화시키는 연구를 수행하였으며, 본 연구결과는 음성인터페이스나 생체인식 등의 식별 응용에서 소규모 학습패턴으로 발생하는 희소성 문제의 해결에 활용할 수 있다. 즉, 본 방문연구에서는 고차원 영상 패턴에 대한 DBC의 성능향상을 위해 먼저 비유사도 계산에 다양한 방법으로 비유사도 공간을 생성한 다음, 이 공간을 임베이딩 알고리즘으로 의사 유클리드(pseudo-Euclidean) 공간으로 사상 향상시켰다. 그리고 이 공간에서 다시 식별기를 다 단계로 퓨전 결합시켜 DBC를 최적화시키는 연구 (combine-correct-combine: CCC)를 수행하였다. 제안 알고리즘의 유용성을 검증하기 위하여 잘 알려져 있는 네 종류의 벤취마크 영상 데이터를 이용하여 식별 실험을 수행하였다. 실험 결과 기존의 단순 다단계결합 알고리즘에 의한 DBC 식별효율보다 개선돤 결과를 얻을 수 있음을 확인하였다. 또한, CCC 알고리즘을 다양한 결합식별기와 함께 실험한 결과 학습 가능한 결합기에서 가장 우수한 식별 율을 얻을 수 있음을 확인하였다. 이와 같이 CCC를 이용한 다단계 퓨전기법으로 DBC의 성능을 최적화시키는 연구 주제는 희소성 문제의 해결과 관련하여 지금까지 연구되지 않았던 독창적인 주제로 DBC 연구의 새로운 방법론을 제시할 수 있으며, 이와 관련된 많은 후속연구를 파생할 가능성이 높다.
  • Research result and Utilization method
  • 통계적-구문적 패턴인식을 포함한 지금까지의 패턴식별은 패턴벡터를 구성하는 특징에 기반 한 식별이다. 이와는 달리, 본 방문연구에서는 특징벡터 대신에 학습 패턴을 대표하는 프로토타입과 학습패턴들 간의 비유사도를 이용하여 패턴 클래스를 식별하는 방법을 연구하였다. 특히 본 방문연구에서는 다단계 퓨전기법인 MFS와 비유사도 공간을 의사 유클리드공간으로 임베딩시키는 방법을 이용하여 DBC의 성능을 최적화시키는 방법에 대하여 연구하였다. 본 연구에서 제안한 DBC-CCC는 기존의 주성분분석(PCA)이나 선형판별분석(LDA), 커널-트릭(kernel trick)을 이용하는 방법들과는 전혀 다른 새로운 방법이다. 여기서, 희소성 문제 해결에 DBC-CCC를 도입한 이유는 DBC의 식별오차는 패턴의 분포구조와는 무관하게 되며, 또한 차원축소 문제를 획기적으로 단순화시킬 수 있었기 때문이다.

    비유사도에 기반 한 식별법인 DBC-CCC의 식별성능은 프로토타입을 선택하는 방법, 비유사도를 측정하는 방법, 비유사도 식별기를 설계하는 방법 등에 따라 결정된다. 본 방문연구에서는 비유사도 표현단계의 DWT와 DBC의 학습단계에서 퓨전기법을 중복하여 적용하는 다단계 퓨전기법으로 DBC를 최적화시키는 방법을 제안하였다. 제안 방법을 벤취마크 얼굴영상 데이터베이스를 대상으로 실험하여 기존의 방법과 비교한 결과, 식별성능을 개선함으로서 소규모 학습패턴에서 발생하는 희소성 문제의 해결에 적용할 수 있음을 확인하였다.

    본 방문연구의 연구주제는 DBC와 관련하여 지금까지 연구되지 않았던 새로운 주제로서, 식별을 위해 부분공간을 이용하지 않기 때문에 벡터차원에 비해 샘플 수가 적은 고차원 영상 식별에 효과적으로 활용할 수 있다. 특히 본 연구에서 목표로 하는 고성능 식별기술은 IT 핵심기술의 하나로, 음성 인터페이스와 생체인식의 구현에 활용할 수 있다. 먼저, 음성인터페이스는 기존의 키보드나 마우스를 대체할 가장 자연스러운 방식으로, 우리나라 신 성장 동력산업인 홈 네트워크나 지능형 로봇에서 기본 인터페이스로 활용할 수 있는 가능성이 높다. 또한, 최적화 DBC를 이용한 생체인식 기술은 기존의 각종 ID를 대체할 수 있는 새로운 신원확인 방식으로 활용할 수 있는 가능성이 높다.
  • Index terms
  • dissimilarity-based classifications, representation combining, representation correcting, classifier combining, combine-correct-combine scheme
  • List of digital content of this reports
데이터를 로딩중 입니다.
  • This document, it is necessary to display the original author and you do not have permission
    to use copyrighted material for-profit
  • In addition , it does not allow the change or secondary writings of work
데이터 이용 만족도
자료이용후 의견
입력