연구과제 상세정보

https://www.krm.or.kr/krmts/link.html?dbGubun=SD&m201_id=10014800&res=y

방송사 정보시스템 환경에서 비디오영상정보의 색인 효율성 개선 방안

연구자가 한국연구재단 연구지원시스템에 직접 입력한 정보입니다.

사업명	기초연구지원인문사회(창의주제연구)
연구과제번호	2006-321-H00031
선정년도	2006 년
연구기간	1 년 (2006년 11월 01일 ~ 2007년 10월 31일)
연구책임자	김현희
연구수행기관	명지대학교(서울캠퍼스)
과제진행현황	종료

과제신청시 연구개요

연구목표
연구 목표는 연구 필요성과 목적으로 구분하여 기술한다. <1. 연구 필요성> 최근 방송사 정보시스템은 디지털 방송의 출현으로 방송 정보 환경에 커다란 변혁을 초래하고 있다. 특히 정보 시스템에 저장된 멀티미디어 콘텐츠는 영상 및 음성 정보 뿐만 아니라 문자 정 ...

연구 목표는 연구 필요성과 목적으로 구분하여 기술한다. <1. 연구 필요성> 최근 방송사 정보시스템은 디지털 방송의 출현으로 방송 정보 환경에 커다란 변혁을 초래하고 있다. 특히 정보 시스템에 저장된 멀티미디어 콘텐츠는 영상 및 음성 정보 뿐만 아니라 문자 정보를 비롯한 여러 의미 정보를 내포하고 있다. 또한 시각적 관계, 시간적 관계, 공간적 관계, 비정형적이고 대용량적 관계 등의 특징 정보들을 내포하고 있으므로 기존의 텍스트 기반의 검색시스템으로는 비디오 콘텐츠를 효율적으로 검색하고 관리하는데 많은 어려움이 따른다. 이러한 어려움이 가중되고 있는 가운데 이용자의 정보 요구는 점차 높아 가고 있다. 기존의 텍스트 기반의 시스템 환경에서 수행된 문헌 단위의 검색에서 구체적인 질문에 대한 답을 제공하는 질의응답방식으로 발전한 것처럼, 멀티미디어 검색시스템에서도 이용자가 원하는 특정값을 갖는 비디오 단위(예, KBS가 2005년 제작한 S프로그램을 수록한 비디오)에서 이용자의 정보 요구에 적합한 특정 프레임, 샷 등을 요구하는 수준으로 변하고 있다. 예를 들어서, 특정 객체를 포함하고 있는 멀티미디어 자료 즉, “월드컵에서 P선수가 골을 넣는 장면을 담은 프레임”을 요구하기도 한다. 이와 같이 이용자의 정보 요구는 높아가고 있지만 멀티미디어 검색 시스템은 이에 따라 가지 못하는 것이 현실이다. 전통적으로 비디오 자료는 구조화된 메타데이터와 함께 수작업으로 만든 해제에 의존하여 검색되어 오고 있다. 즉, 비디오는 수작업으로 샷단위로 구분되고 각 샷별로 텍스트 해제가 훈련된 전문 사서에 의해서 완성되었다. 이와 같이 수작업으로 작성한 해제와 구조화된 메타데이터의 결합이 검색의 기초가 되어 오고 있다. 그러나 이러한 색인 방식은 특히 색인 작업의 모든 과정이 수작업으로 수행될 때 급속도로 증가하고 있는 비디오 자료를 처리하는데 어려움이 있을 뿐만 아니라 비디오 자료의 구체적인 내용을 제시하지 못하며 더 나아가 색인 작성자 마다 색인 내용이 달라지는 색인자간 불일치성 문제가 생겨나고 있다. 최근 활발히 연구되고 있는 이미지의 색, 모양, 객체 등을 추출하여 검색에 활용하는 내용 기반 이미지 색인 및 검색과 오디오 정보를 인식하여 검색에 활용하는 내용기반 오디오 색인 및 검색은 비디오 콘텐츠 자체가 가지는 특징들을 자동 또는 반자동으로 분석하여 활용하기 때문에 앞에서 언급한 텍스트 기반 색인과 검색의 제한점들을 보완하고 있다. 그러나 이러한 연구들은 대부분 공학적인 관점에서 비디오 자료들을 샷별로 분할하고 분할된 콘텐츠에서 키 프레임을 추출하고 추출된 키 프레임의 특징들을 활용하여 비디오 자료를 자동 색인하는 이미지 프로세싱에 초점이 맞춰져 있다. 이러한 이미지 프로세싱 방법에만 의존하여 멀티미디어 자료를 구조화하기에는 아직도 많은 연구들이 요구된다. 공학적 기술면에서 이러한 자동색인 연구는 지속되어야 하고, 기여하는 바는 크지만 영상기호학에서 지적되듯이 영상정보는 개념적 불명확성이 불가피하고, 제작자의 의도와 달리 시청자에 의해 다의적으로 해독되는 경향이 있다. <2. 연구 목적> 따라서 본 연구의 목적은 콘텐츠 제작과정에 생겨나는 정보를 이미지 프로세싱 분석 결과와 함께 활용하면 색인의 효율성을 높일 수 있다고 판단하여, 사전 제작정보(예, 콘티, 방송대본, 비디오 캡쳐 정보 등)와 폐쇄자막 등을 문헌정보학에서 개발된 색인 이론을 적용, 분석한 비디오 색인 방안을 제안하여 방송영상정보의 색인 및 검색 효율성을 향상시키고자 한다. 이러한 목적을 수행하기 위한 연구 절차를 약술하면 다음과 같다. 첫째, 드라마/교육 콘텐츠의 경우 사전 제작정보를 데이터베이스화하고 이로부터 형태소 분석과 의미활용론을 이용하여 객체, 위치, 이벤트 등과 관련된 키워드를 자동으로 추출한 후 이러한 자료들과 자동으로 추출한 스토리보드를 활용한 통합된 색인 방안을 제안하고, 관례적으로 사전 제작정보를 활용하지 않는 뉴스 영상 콘텐츠는 폐쇄 또는 공개 자막을 형태소 분석과 의미활용론을 이용하여 분석한 후 객체, 위치, 이벤트 등과 관련된 키워드를 자동으로 추출한 후 이러한 자료들과 스토리보드를 활용한 통합된 색인 방안을 제안하고 제안된 색인 방법들의 효율성을 측정해 본다. 아울러 이러한 사전 제작정보를 체계적으로 수집하여 색인 작업, 드라마 제작 및 수익 사업에 활용하기 위해서 방송사 기관 리포지토리의 구축이 필요함을 제안하고 기관 리포지토리의 개념적 모형을 구축해 본다.

기대효과
기대 효과는 학문 및 교육 발전에의 기여와 사회 발전에의 기여로 나눠서 설명한다.
<1. 학문 및 교육 발전에의 기여> 첫째, 본 연구에서 제안된 색인 방안들은 방송국 또는 대학도서관의 멀티미디어 자료의 색인과 브라우징 과정에 활용될 수 있을 것이다. 즉, 멀티 ...

기대 효과는 학문 및 교육 발전에의 기여와 사회 발전에의 기여로 나눠서 설명한다.
<1. 학문 및 교육 발전에의 기여> 첫째, 본 연구에서 제안된 색인 방안들은 방송국 또는 대학도서관의 멀티미디어 자료의 색인과 브라우징 과정에 활용될 수 있을 것이다. 즉, 멀티미디어 콘텐츠 내용이 복잡하고 검색이 빈번히 요구되는 경우는 제안된 통합 색인 방식을 적용하고, 세밀한 색인 작업이 어렵거나 색인 작성자의 개입이 불가능한 방송 환경에서는 이용자들이 스토리보드와 사전 제작정보 또는 자막 정보를 함께 브라우징할 수 있는 정보 환경을 조성하여 이용자들이 직접 내용 분석을 하여 원하는 자료를 찾을 수 있도록 한다. 또는 사전 제작정보나 폐쇄자막에서 자동으로 추출한 키워드를 해당 샷의 주제를 나타내는 색인어로 바로 활용할 수 있을 것이다.
둘째, 정보 기술의 발전으로 다양한 매체의 정보가 통합되어 가고 있는 추세이다. 이러한 추세가 계속된다면 문헌정보학 분야는 문헌정보 뿐만 아니라 멀티미디어 정보도 상당한 비중으로 다루어야 할 것임이 분명해 보인다. 문헌정보학의 연구 분야인 정보 조직, 정보 검색 등에서 영상 정보의 구조화, 검색 방법 그리고 더 나아가서는 영상 정보의 처리 까지 다루어야 하는 것은 문헌정보학 분야에 있는 연구자와 실무자가 피할 수 없는 일이 된 것 같다. 멀티미디어 정보의 생성 과정, 저장, 검색 및 보존에 대한 이론적인 측면과 기술적인 측면을 심도 있게 이해하기 위해서는 영상 콘텐츠가 분할되어 처리되는 물리적인 색인 방법에 대한 이해와 함께 문헌정보학 색인 이론 체계를 멀티미디어 정보에 접목시키려는 노력이 필요해 보인다. 이러한 노력을 시도한 본 연구는 문헌정보학에서 당연히 다루어야 했지만 활발한 연구가 이루어지지 않은 멀티미디어 정보 관리 분야의 발전에 도움을 줄 것으로 생각된다. 셋째, 방송국 이외의 기관 즉, 대학, 학교, 연구기관 심지어는 공공기관의 도서관 환경에서도 기존 텍스트 기반의 자료가 멀티미디어 자료로 변화되어 가고 있으며, 이외에 다양한 비디오 교육 자료를 관리해야 하는 정보 매체의 급격한 변화로 디지털 비디오 도서관 시스템 구축이나 디지털 아카이브 구축의 필요성이 높아지고 있는데 본 연구 결과는 이러한 기관들의 멀티미디어 콘텐츠 관리에도 유용하게 활용될 수 있을 것이다. 이외에 의학 분야의 의료영상시스템, 홈쇼핑 등 다양한 분야에 폭넓게 활용될 수 있을 것이다.
넷째, 대학, 학교 등 교육기관에서 점차 많은 강의들이 원격으로 진행되고 있다. 상당수의 강의 콘텐츠가 교수, 교사가 직접 강의를 하는 영상 콘텐츠로 구축되고 있는데 학습자의 입장에서는 강의 자료 전체를 브라우징하는 경우도 있지만 특정 강의 장면들만 선택하여 보는 경우도 많은 것이 사실이다. 이러한 구조적 정보 검색을 가능하게 할 본 연구 결과는 효율적인 가상 교육 서비스를 제공하는데 도움을 줄 수 있을 것이다.
<2. 사회 발전에의 기여> 첫째, 오랫동안 방송국의 제작과정정보의 관리가 허술하여 중요한 사료로서의 가치가 있는 대본이나 콘티조차 망실되고 없는 영화영상이 많은데 비해, 최근 영화영상업계에서는 오히려 제작과정정보를 상업화하는 추세이다. DVD 형태로 시판되는 많은 영화영상물의 부가정보들이 이에 해당된다. 방송도 오랫동안 제작과정정보를 체계적으로 관리하지 않아 망실된 것이 대부분이지만 디지털영상화가 진행되면서 영화 DVD의 전례를 따를 것으로 쉽게 예상된다. 따라서 이러한 추세에 발맞춰 본 연구에서 제안한 방송국 기관 리포지토리의 모형은 이제까지 1차 시장에만 관심을 둘 뿐 방송되고 나면 방치하던 방송영상물도 다매체다채널 시대에서는 2차, 3차 시장에서 영상물 전체 또는 제작기획서나 콘티는 물론 대본 등의 제작과정에서 생겨난 텍스트, 컷이나 시퀀스 등의 영상물의 세부적인 요소들도 활용할 수 있는 방송국 정보 환경을 구현하는데 기여할 것이다.
둘째, 방송국에서 생산하는 자료들은 다른 기관에 비해서 그 특성상 폐쇄성이 높고 보존이 철저하지 않으며, 지식 재산권이 학술기관의 콘텐츠 보다 훨씬 엄격한 것이 사실이다. 방송국 콘텐츠 마다 공개 범위를 정하여 제한적으로 공개하면서 이러한 자원을 체계적으로 조직, 활용, 보존할 수 있는 아카이브의 역할을 수행할 방송사 기관 리포지토리의 모형에 대한 제안은 방송사 리포지토리에서 일정기간 보존 후 한국방송개발원, 국립도서관과 같은 국가기관에 영구 보존을 위해서 콘텐츠를 이양할 수 있는 체제와 연계되어 국가적 문화 유산을 관리하고 보존할 수 있는 방안 모색에 하나의 안이 될 수 있을 것이다.

연구요약
본 연구에서는 통합 색인 기법 및 검색 인터페이스 모형을 제안하고 그 효율성을 측정해 본 후, 연구 가설을 검증한다. 또한 방송사 기관 리포지토리의 개념적 모형을 제안한다.
<1. 통합 색인 작업> 색인 작업을 각 매체별로 기술하면 다음과 같다. <1.1 드라마/ ...

본 연구에서는 통합 색인 기법 및 검색 인터페이스 모형을 제안하고 그 효율성을 측정해 본 후, 연구 가설을 검증한다. 또한 방송사 기관 리포지토리의 개념적 모형을 제안한다.
<1. 통합 색인 작업> 색인 작업을 각 매체별로 기술하면 다음과 같다. <1.1 드라마/교육 영상 콘텐츠> 첫째, 선정된 드라마/교육 비디오를 기존에 개발된 알고리즘을 사용하여 샷별로 나눈 후 샷에서 키 프레임을 자동으로 추출하여 스토리보드를 구성한다.
둘째, 기획정보, 비디오를 구성하는 방송 대본 또는 콘티 등을 수록하고 있는 사전 제작정보를 데이터베이스화하고 이로부터 형태소 분석과 의미활용론을 이용하여 객체, 위치, 이벤트 등과 관련된 키워드를 자동으로 추출한다.
셋째, 이전 단계에서 준비한 스토리보드, 사전 제작정보 데이터베이스 및 이로부터 자동으로 추출한 키워드 집단을 참조하여 샷 단위로 색인어들을 추출하고 해제 (초록)를 작성한다.
<1.2 뉴스 영상 콘텐츠> 첫째, 드라마/교육 콘텐츠 경우와 같은 방식으로 스토리보드를 구성한다. 둘째, 샷 단위의 폐쇄 자막에 나타나는 등장인물의 음성 내용, 각 화자의 구분, 화면에서의 화자의 위치, 주변 상황에 대한 설명 등을 형태소 분석과 의미활용론을 이용하여 분석한 후 객체, 위치, 이벤트 등과 관련된 키워드를 자동으로 추출한다. 셋째, 스토리보드, 폐쇄자막 데이터베이스 및 이로부터 자동으로 추출한 키워드 집단을 참조하여 샷 단위로 색인어들을 추출하고 해제 (초록)를 작성한다.
<2. 검색 인터페이스> 제안된 통합 색인 방식에 대한 이해를 돕기 위해서 객체, 위치, 이벤트, 키워드(초록)을 입력할 수 있는 검색 인터페이스의 개념적 모형을 설계해 본다. 검색자는 해당되는 항목에 질의어를 입력하고 질의어간은 블리언 연산자를 선택하여 전체 질의어를 구성한 후 시스템에 질의를 전송하면 시스템은 검색 결과를 출력해 준다. 즉, 시스템은 질문과 전체 또는 부분적으로 매칭되는 비디오 샷(들)의 키 프레임(들)을 제시하고 검색자는 키 프레임과 그 키 프레임이 속한 프레임 그룹 (샷) 등을 브라우징하여 원하는 자료를 최종적으로 선택할 수 있다.
<3. 연구 가설과 색인 평가> 제안한 통합 색인 방안의 효율성을 측정하기 위해서 비디오 표본 집단을 사용하여 제안된 색인 방법의 결과와 수작업 또는 스토리보드만을 사용하여 색인한 결과들과 색인어 질, 색인작성시간, 색인자간 일치성 등을 중심으로 비교, 분석하여 가설 검증 여부를 조사해 본다.
<3.1 연구 가설> 첫째, 제안된 통합된 색인 방식은 수작업 방식과 거의 유사한 색인 결과의 질을 유지할 것이나 색인 시간은 더 짧고 색인자간 일치성도 훨씬 효율적인 결과를 나타낼 것이다. 둘째, 제안된 통합된 색인 방식은 스토리보드만을 활용한 방식과 거의 유사한 색인 시간이 소요될 것이나 색인어 질과 색인자간 일치성에서는 훨씬 효율적인 결과를 나타낼 것이다. <3.2 색인 평가> 색인 평가 과정은 다음과 같다. 첫째, 표본으로 선정한 20편의 영상 콘텐츠를 세 명의 색인 작성자에게 수작업 방식으로 비디오를 분할한 후 색인어들을 추출하도록 하고 초록을 작성하게 한다. 둘째, 세 명의 색인 작성자에게 자동으로 추출한 스토리보드만을 제시하여 샷 단위로 색인어들을 할당하고 초록을 작성하게 한다.
셋째, 세 명의 색인 작성자에게 제안된 통합 색인 방식을 활용하여 샷 단위로 색인어들을 할당하고 초록을 작성하게 한다. 넷째, 수작업 색인 결과를 이상적인 색인 결과로 간주하고 수작업 결과를 통합된 색인 방식과 스토리보드만을 활용한 결과와 색인어의 질, 색인작성시간, 색인자간 일치성 등 비용 대 효과 면에서 비교, 조사하여 본 연구에서 설립한 가설의 검증 여부를 조사한다.
4. 방송국 기관 리포지토리 모형 구축 - 국내의 공중파 방송국과 뉴스 전문 케이블 방송국을 각각 한 곳씩 선정하여 이들 방송국들의 콘텐츠 제작, 관리 및 보존 활동을 사례 연구를 통해서 분석할 계획이다. 이러한 사례 연구 결과와 현재 연구되고 있는 대학 리포지토리의 운영 및 평가 체제를 참조하여 기관 리포지토리에 저장할 콘텐츠 종류를 결정하고, 방송 정보 처리 절차 그리고 제작 과정에서 생겨나는 정보의 체계적인 관리를 위해 방송 정보 유통 과정을 정형화하고 표준 메타데이터 형식도 제안할 계획이다.

한글키워드
통합 색인과 검색,검색 효율성,모양,질감,키 프레임,비디오 샷,사전 제작정보,콘티,공개자막,폐쇄자막,텍스트 기반 색인과 검색,내용 기반 색인과 검색,디지털 비디오,색,이미지 프로세싱,메타데이터,이벤트,장소,객체,스토리보드,대표키 프레임,컷,방송사 기관 리포지토리,멀티미디어,정보시스템,방송사,비디오영상정보,브라우징,탐색,색인 효율성,의미활용론,프레임,형태소분석

영문키워드
digital video,browsing,searching,transcript,Informedia,MPEG-7,indexing efficiency,retrieval efficiency,storyboard,Open Video Digital Library,QBIC

결과보고시 연구요약문

국문
<연구 내용>영상 초록이 색인어 추출을 하기 위한 적합한 정보원인지 검증하기 위해서 12개의 표본 비디오 집단과 14명의 피조사자들을 이용하여 영상 초록 및 전체 클립 보기를 통한 색인어 및 요약문 추출의 정확도를 측정해 보았다. 측정 결과 첫째, 비디오 유형에 따 ...

<연구 내용>영상 초록이 색인어 추출을 하기 위한 적합한 정보원인지 검증하기 위해서 12개의 표본 비디오 집단과 14명의 피조사자들을 이용하여 영상 초록 및 전체 클립 보기를 통한 색인어 및 요약문 추출의 정확도를 측정해 보았다. 측정 결과 첫째, 비디오 유형에 따라 정확도가 차이가 있는 것으로 나타났으며 이는 이미지에 주로 의존하여 정보를 표출하는 비디오의 경우 텍스트 초록만으로 의미 파악을 하기에는 한계가 있으며 텍스트 초록이 영상 초록과 함께 사용되었을 때 시너지 효과를 낼 수 있음을 보여주고 있다. 둘째, 영상 초록의 색인어 및 요약문 정확도가 전체 클립의 정확도 보다 떨어지지만 절반치에 근접한 것으로 나타나 영상 초록이 비디오 색인어(의미) 추출에 효율적으로 활용될 수 있음을 확인하였다. 또한 영상 초록의 색인어 정확도(0.45)가 요약문 정확도(0.40) 보다 더 높게 나타나 영상 초록을 통해서 색인어 추출 작업을 더 효율적으로 할 수 있음을 확인할 수 있었다. 이러한 실험 결과에 기초하여 영상 초록이 색인어 또는 요약문 추출 작업에 활용될 수 있을 뿐만 아니라, 디지털 도서관 환경에서 텍스트 초록과 같은 다른 메타데이터 요소들과 함께 사용된다면 이용자의 적합성 판정을 좀 더 용이하게 할 것이며, 더 나아가 영상 질의의 매칭 자료로도 이용될 수 있음을 제안하였다. 끝으로 방송국 정보 관리의 사례 연구 결과와 현재 연구되고 있는 대학 리포지토리의 운영 및 평가 체제를 참조하여 기관 리포지토리에 저장할 콘텐츠 종류를 결정하고, 방송 정보 처리 절차 그리고 제작 과정에서 생겨나는 정보의 체계적인 관리를 위해 방송 정보 유통 과정을 정형화하여 방송국 리포지토리의 개념적 모형을 설계한 후 각 방송사에서 생산하는 컨텐츠를 수집하여 일반에게 공개 하는 방송 정보 오픈 액세스를 실현할 수 있는 국립영상정보 아카이브를 제안하였다. <연구 방법> 비디오 자료의 색인어 추출을 위한 영상 초록의 효용성을 조사하기 위해서 5개의 연구 가설과 2개의 연구 문제를 설정하고 이를 검증하기 위해서 표본 비디오 12개를 이용하여 영상 초록과 전체 클립을 볼 수 있는 웹사이트를 구축하였다. 본 연구에서는 이미지의 의미전달의 가능성을 조사하는데 초점을 맞추었기 때문에 자막이 있는 키프레임들을 영상 초록에서 되도록 제외시켰다. 구성한 영상 초록과 전체 클립 보기를 통한 색인어 및 요약문 추출의 정확도를 측정하기 위해서 피조사자 14명을 M대학의 문헌정보학 전공 또는 복수 전공 학생 중에서 임의로 추출하였다. 선정된 피조사자 14명을 컴퓨터실에서 작업을 하도록 하였다. 즉, 피조사자에게 설문지를 배포하고 각 영상 초록에 대해서 색인어를 4개 이상 할당하도록 하고, 비디오 요약문은 두 문장 이상 기술하도록 하였다. 그런 다음 사운드가 제거된 전체 클립을 보게 한 후 영상 초록과 똑같이 색인어와 요약문을 기술하도록 하였고 이외에 영상 초록의 기능과 영상 초록과 전체 클립의 장단점에 대한 추가적인 질문을 포함시켰다. 총 실험시간은 실험에 대한 안내를 포함하여 약 3시간 30분이 소요되었다. 색인어와 요약문의 정확도 측정은 표본 비디오에 대한 표준 색인어와 요약문을 구성한 후 이를 피조사자가 작성한 색인어 그리고 요약문과 대조한 후 어느 정도 일치하느냐에 따라 0~1 사이의 값을 주어서 측정하였다. 이러한 측정값을 기초로 하여 일원배치 분산분석과 사후검정, t-검증 등의 통계기법을 활용하여 가설 검증을 하였다. 또한 방송국 리포지토리의 개념적 모형은 방송국 정보 관리의 사례 연구 결과와 현재 연구되고 있는 대학 리포지토리의 운영 및 평가 체제를 참조하여 기관 리포지토리에 저장할 콘텐츠 종류를 결정하고, 방송 정보 처리 절차 그리고 제작 과정에서 생겨나는 정보의 체계적인 관리를 위해 방송 정보 유통 과정을 분석하여 제안하였다. <연구 범위와 제한점>최초의 계획은 제작자정보나 사전 제작정보를 활용하여 색인과 검색의 효율성을 높일 필요가 있다고 판단하고 사전 제작정보 등을 색인 이론을 적용시킨 효율적인 비디오 색인 및 브라우징 방법을 제안하고자 하였다. 그러나 실제 디지털 비디오 도서관 환경에서는 자동적으로 영상 초록이 구성되고 있는 상황이며, 사전 제작정보는 축적된 데이터베이스가 많지 않아서 연구 범위를 조금 변경하기로 결정하였다. 즉, 영상 초록이 주어진 환경에서 전체 비디오를 보지 않고도 이를 이용하여 비디오 내용 요약과 색인어 추출을 할 수 있는지를 테스트 하여 영상 초록이 색인어 추출을 하기 위한 적합한 정보원이 되는지 여부를 파악하고 아울러 텍스트 질의 대신 영상 질의가 들어왔을 때에 이에 대한 매칭 자료로 영상 초록을 이용할 수 있는 방안을 제안하였다.

영문
This study is designed to assess whether storyboard surrogates are useful enough to be utilized for indexing sources as well as for metadata elements using 12 sample videos and 14 participants. Study shows that first, the match rates of index terms a ...

This study is designed to assess whether storyboard surrogates are useful enough to be utilized for indexing sources as well as for metadata elements using 12 sample videos and 14 participants. Study shows that first, the match rates of index terms and summaries are significantly different according to video types, which means storyboard surrogates are especially useful for the type of videos of conveying their meanings mainly through images. Second, participants could assign subject keywords and summaries to digital video, sacrificing a little loss of full video clips' match rates. Moreover, the match rate of index terms (0.45) is higher than that of summaries (0.40). This means storyboard surrogates could be more useful for indexing videos rather than summarizing them. The study suggests that 1)storyboard surrogates can be used as sources for indexing and abstracting digital videos; 2) using storyboard surrogates along with other metadata elements (e.g., text-based abstracts) can be more useful for users' relevance judgement; and 3)storyboard surrogates can be utilized as match sources of image-based queries. In addition, in order to improve storyboard surrogates quality, this study proposes future studies: constructing key frame extraction algorithms and designing key frame arrangement models. Finally, this study proposed the conceptual framework of institutional repositories for storing broadcating information and knowledge that enables to build national broadcasting archives.

연구결과보고서

초록
전통적인 텍스트 기반의 자료에서 색인 작업은 자료 전체에서 색인어를 추출하기 보다는 대부분 표제와 초록이라는 메타데이터를 활용하여 색인어를 추출하는 것이 일반적이다. 본 연구는 이와 같은 원리를 비디오 영상 자료에 그대로 적용시켜 비디오 전체 클립 대신 영 ...

전통적인 텍스트 기반의 자료에서 색인 작업은 자료 전체에서 색인어를 추출하기 보다는 대부분 표제와 초록이라는 메타데이터를 활용하여 색인어를 추출하는 것이 일반적이다. 본 연구는 이와 같은 원리를 비디오 영상 자료에 그대로 적용시켜 비디오 전체 클립 대신 영상 초록에서 색인어를 추출하는 방법이 전체 비디오 클립을 활용하여 색인어를 추출하는 방법과 어떤 차이를 보이는지 살펴봄으로써 좀 더 효율적인 비디오 자료 색인 방안에 대한 이론적인 틀을 제공하고자 한다. 본 연구의 목적은 크게 두 가지로 구분된다. 첫째는, 비디오 자료의 색인어(의미) 추출을 위해서 그 대상을 비디오 전체 클립으로 할 때와 영상 초록을 이용할 때와의 차이를 분석하여 영상 초록이 색인어 추출 작업에 효율적으로 이용될 수 있을 뿐만 아니라, 디지털 도서관의 OPAC 시스템의 메타데이터의 한 요소로 활용되어 적합성 판정을 위한 이용자의 비디오 브라우징 및 영상 질의가 이용되는 비디오 검색 환경에 이용될 수 있음을 제안하여 영상 자료의 색인과 검색을 좀 더 용이하게 하는 것을 목적으로 한다. 둘째는 사전제작정보 부터 시작하여, 편집정보, 제작된 멀티미디어 콘텐츠를 체계적으로 저장, 관리, 보존할 수 있는 방송국 기관 리포지토리 구축은 해당 콘텐츠의 색인 작업에는 물론 다른 콘텐츠 제작 또는 방송사 수입사업에 유익하게 활용될 수 있다는 점에서 매우 중요한 작업으로 판단된다. 따라서 방송사 사례연구 결과와 현재 활발히 연구되고 있는 대학 리포지토리의 운영 및 평가 체제를 참조하여 방송사 기관 리포지토리의 개념적인 모형을 제안한다. 비디오 자료의 색인어(의미) 추출을 위한 영상 초록의 효용성을 조사하기 위해서 표본 비디오 12개와 피조사자 14명을 이용하여 영상 초록과 전체 클립의 색인어 및 요약문의 정확도를 측정해 보았다. 표본 비디오 자료에서 자막이 있는 키프레임들은 되도록 제외시키고 피조사자들에게 표제를 포함한 메타데이터 요소들을 전혀 제시하지 않고 영상 초록만을 보여 주었기 때문에 색인어 및 요약문 추출의 정확도가 다른 연구에 비해서 낮을 것으로 예측된다. 측정 결과 첫째, 비디오 유형에 따라 정확도가 차이가 있는 것으로 나타났다. 특히 이미지에 의존하여 내용을 전달하는 비디오 유형1의 정확도(색인어: 0.51, 요약문: 0.50)와 서술에 의존한 비디오 유형3의 정확도(색인어: 0.39, 요약문: 0.28)간에 큰 차이가 있었다. 이는 이미지에 주로 의존하여 정보를 표출하는 비디오의 경우 텍스트 초록만으로 의미 파악을 하기에는 한계가 있으며 텍스트 초록이 영상 초록과 함께 사용되었을 때 시너지 효과를 낼 수 있음을 보여주고 있다.
둘째, 영상 초록의 색인어 정확도(0.45)와 요약문 정확도(0.40)가 전체 클립의 정확도 보다 떨어지지만 절반치(0.50)에 근접한 것으로 나타나 영상 초록이 비디오 의미 추출에 효율적으로 활용될 수 있음을 확인하였다. 또한 영상 초록의 색인어 정확도가 요약문 정확도 보다 더 높게 나타나 영상 초록을 통해서 색인어 추출 작업을 더 효율적으로 할 수 있음을 확인할 수 있었다. 이러한 연구 결과에 기초하여 본 연구는 영상 초록의 종류에 따라서 색인어 및 요약문 추출의 정확도에 차이가 있지만 영상 초록이 비디오 자료의 다른 메타데이터 즉, 제목, 텍스트 초록 등과 함께 사용되었을 때 비디오 장르나 유형에 관계없이 비디오 자료의 색인어(의미) 추출을 위한 자원으로 사용될 수 있음을 보여주고 있다. 또한 영상 초록은 디지털 도서관의 OPAC 시스템의 메타데이터의 한 요소로 활용되어 적합성 판정을 위한 이용자의 비디오 브라우징 및 영상 질의가 이용되는 비디오 검색 환경에 이용할 수 있음을 제안하고, 영상 초록의 품질을 높이기 위한 후속 연구들에 대해서도 제언하였다.

연구결과 및 활용방안
<연구 결과> 본 연구에서는 비디오 자료의 색인어(의미) 추출을 위한 영상 초록의 효용성을 조사하기 위해서 표본 비디오 12개와 피조사자 14명을 이용하여 영상 초록과 전체 클립의 색인어 및 요약문의 정확도를 측정해 보았다. 표본 비디오 자료에서 자막이 있는 키프 ...

<연구 결과> 본 연구에서는 비디오 자료의 색인어(의미) 추출을 위한 영상 초록의 효용성을 조사하기 위해서 표본 비디오 12개와 피조사자 14명을 이용하여 영상 초록과 전체 클립의 색인어 및 요약문의 정확도를 측정해 보았다. 표본 비디오 자료에서 자막이 있는 키프레임들은 되도록 제외시키고 피조사자들에게 표제를 포함한 메타데이터 요소들을 전혀 제시하지 않고 영상 초록만을 보여 주었기 때문에 색인어 및 요약문 추출의 정확도가 다른 연구에 비해서 낮을 것으로 예측된다. 측정 결과 첫째, 비디오 유형에 따라 정확도가 차이가 있는 것으로 나타났다. 특히 이미지에 의존하여 내용을 전달하는 비디오 유형1의 정확도(색인어: 0.51, 요약문: 0.50)와 서술에 의존한 비디오 유형3의 정확도(색인어: 0.39, 요약문: 0.28)간에 큰 차이가 있었다. 이는 이미지에 주로 의존하여 정보를 표출하는 비디오의 경우 텍스트 초록만으로 의미 파악을 하기에는 한계가 있으며 텍스트 초록이 영상 초록과 함께 사용되었을 때 시너지 효과를 낼 수 있음을 보여주고 있다.
둘째, 영상 초록의 색인어 정확도(0.45)와 요약문 정확도(0.40)가 전체 클립의 정확도 보다 떨어지지만 절반치(0.50)에 근접한 것으로 나타나 영상 초록이 비디오 의미 추출에 효율적으로 활용될 수 있음을 확인하였다. 또한 영상 초록의 색인어 정확도가 요약문 정확도 보다 더 높게 나타나 영상 초록을 통해서 색인어 추출 작업을 더 효율적으로 할 수 있음을 확인할 수 있었다. 이러한 연구 결과에 기초하여 본 연구는 영상 초록이 색인어 및 요약문 추출 작업에 활용될 수 있을 뿐만 아니라, 디지털 도서관의 OPAC 시스템의 메타데이터의 한 요소로 활용되어 적합성 판정을 위한 이용자의 비디오 브라우징 및 영상 질의가 이용되는 비디오 검색 환경에 이용할 수 있음을 제안하고, 영상 초록의 품질을 높이기 위한 후속 연구들에 대해서도 제언하였다. 마지막으로, 사전제작정보 부터 시작하여, 편집정보, 제작된 멀티미디어 콘텐츠를 체계적으로 저장, 관리, 보존할 수 있는 방송국 기관 리포지토리의 개념적인 모형을 제안하였다. <활용방안> 1) 본 연구에서 제안된 색인 방안에 대한 이론적은 틀은 방송국 또는 대학도서관의 멀티미디어 자료의 색인과 브라우징 과정에 활용될 수 있을 것이다. 즉, 세밀한 색인 작업이 어렵거나 색인 작성자의 개입이 불가능한 방송 환경에서는 영상초록을 이용하여 색인 전문가는 색인 작업을 하고 이용자는 적합성 판정을 하게 된다. 2) 멀티미디어 정보의 생성 과정, 저장, 검색 및 보존에 대한 이론적인 측면과 기술적인 측면을 심도 있게 이해하기 위해서는 영상 콘텐츠가 분할되어 처리되는 물리적인 색인 방법에 대한 이해와 함께 문헌정보학 색인 이론 체계를 멀티미디어 정보에 접목시키려는 노력이 필요해 보인다. 이러한 노력을 시도한 본 연구는 문헌정보학에서 당연히 다루어야 했지만 활발한 연구가 이루어지지 않은 멀티미디어 정보 관리 분야의 발전에 도움을 줄 것으로 생각된다. 3) 방송국에서 생산하는 자료들은 다른 기관에 비해서 그 특성상 폐쇄성이 높고 보존이 철저하지 않으며, 지식 재산권이 학술기관의 콘텐츠 보다 훨씬 엄격한 것이 사실이다. 방송국 콘텐츠 마다 공개 범위를 정하여 제한적으로 공개하면서 이러한 자원을 체계적으로 조직, 활용, 보존할 수 있는 아카이브의 역할을 수행할 방송사 기관 리포지토리의 모형에 대한 제안은 방송사 리포지토리에서 일정기간 보존 후 한국방송개발원, 국립도서관과 같은 국가기관에 영구 보존을 위해서 콘텐츠를 이양할 수 있는 체제와 연계되어 국가적 문화 유산을 관리하고 보존할 수 있는 방안 모색에 하나의 안이 될 수 있을 것이다.

색인어
디지털 비디오, 주제 색인, 영상 초록, 요약, 텍스트 초록 , 영상 질의, 키프레임, 메타데이터, 통보적 초록, 지시적 초록, 비디오 클립, 디지털 도서관, Open Video Digital Library, storyboard surrogates

이 연구과제의 신청시 심사신청분야(최대 3순위까지 신청 가능)
1순위 : 복합학 > 문헌정보학 > 정보검색 > 데이터베이스
2순위 : 복합학 > 문헌정보학 > 정보검색 > 자동색인/요약
3순위 : 복합학 > 문헌정보학 > 디지털도서관

연구성과물 목록