이 연구는 대중으로 부터 사랑받기 위한 이별 음악은 느린 템포여야만 하는가? 맥주 광고에 적합한 음악은 무엇인가? 라는 실용적인 연구 질문으로부터 시작되었다. 이 질문에 답변하기 위해서 기존 연구와 차별되는 음악의 특징 변수를 탐색하고 특정 용도에 적합한 음악 ...
이 연구는 대중으로 부터 사랑받기 위한 이별 음악은 느린 템포여야만 하는가? 맥주 광고에 적합한 음악은 무엇인가? 라는 실용적인 연구 질문으로부터 시작되었다. 이 질문에 답변하기 위해서 기존 연구와 차별되는 음악의 특징 변수를 탐색하고 특정 용도에 적합한 음악을 예측하는 모델을 탐구하는 것이 이 연구의 주된 내용이다.
첫번째 질문을 해결하기 위해서는 ‘이별 음악’과 ‘느린 템포’의 정의가 필요하다. 이별을 가사 주제로 정의하고 텍스트 마이닝의 주제분석과 감성분석을 사용한다. 느린 템포는 음악의 오디오 특징을 추출하여 변수로 사용한다.
두번째 질문을 해결하기 위해서는 광고음악으로 사용되었는지의 여부를 이분형(Yes, No)으로 라벨링한 후 음악을 구성하는 특징을 가사와 오디오 특성으로 추출하여 학습한 후 모델링을 한다. 이 경우 labeling의 구체성 확보는 정확하고 의미 있는 연구를 가능하게 한다. 단순히 광고음악으로 labeling하는 것 보다는 “맥주광고음악”, “자동차광고음악” 등으로 라벨링 하는 것이 실무적 활용도가 높을 수 있다.
예시로 사용된 위의 예제를 포함하여 통합적 예측모델 구축을 위하여 이 연구는 4개의 연구로 구성되며 총 10단계의 순서로 연구를 진행한다.
연구1은 노래의 가사를 R과 T-lab을 이용하여 주제를 도출하고 주제별로 클러스터링한다. 클러스터링을 위해서는 K-means 방법의 수정 방법론인 Bi-sect K-means방법론을 사용한다. 감성분석은 LIWC와 DICTION 감성사전 프로그램으로 감성점수를 도출한다. 노래별 감성점수와 주제 클러스터별 소속 확률이 노래별 가사의 특성치 변수가 된다. 연구1은 가사 분석을 통한 음악의 특성치를 수량화하기 위한 시도이다.
연구2는 연구1에서 도출한 가사 특성치 외에 오디오 특성 변수를 고려한다. 가사와 오디오 및 이를 모두 고려한 새로운 변수 탐색 연구이다. 연구1의 (i) 노래별 감성 feature(20개), (ii)주제 점수 (5cluster 소속 확률: 5개), (iii) Spotify audio features(13개) 세 유형의 feature간 상관관계를 구하고 네트워크 분석을 통해서 중심되는 feature가 무엇인지 분석한다.
Pre study에서는 acousticness와 다른 변수와의 관계 [i(+), you(+), verb(+), anger(-), sad(+), drvies(-), power(-), focusfuture(+)]와
Danceability와 다른 변수와의 관계가 주목할 만한다. [anger(+), female(+), focusfuture(-), time(-), work(+)] 중심성 분석에서는 tempo, speechniness, liveness, energy, danceability가 중심성이 높았으며, loudness가 isolate되어 있는 점이 특색이다. 상관관계가 높은 acousticness와 sad를 곱한 새로운 변수를 만들어 사용할 수 있다.
연구3은 인기도를 label로 하고 감성변수, 주제변수, Spotify오디오 특성치, 연구2의 New 변수를 feature로 하여 인기도 예측 모델링을 한다. 오디오 특성치만의 모델링에 감성변수와 주제변수가 포함될 때 예측모델의 변화를 탐색한다. 방법론으로 R과 파이썬을 사용하여 인공신경망, SVM(SVR), 랜덤포레스트를 사용한다. 기계학습에서 변수에 대한 설명이 미비했던 점을 고려하여 신뢰도를 설명하는 파이썬의 LIME을 활용하여 모형의 해석과 활용 방향성을 제시한다. input변수의 중요도 판단은 실무적 적용에 중요한 요인이다.
연구4는 2가지 예측모델을 시도한다. 하나는 새로운 음악의 성취도를 목표변수로 고안하여 사용하는 연구이고 두번째는 특정 분야 광고음악(Car or beer ads)에 적합한 음악을 선별하는 예측 모델링 연구이다. 새로운 음악 성취도 라벨링을 위해서는 실적치를 추정할 수 있는 매출액, 비평가 평점을 포함하여 추가적인 data set을 구성한다. 특정 분야의 광고 음악을 추정하기 위해서는 훈련 데이터의 숫자를 확보하여야 한다. 특정 카테고리별 광고의 모수를 확보하지 못하는 경우 유사광고끼리 카테고리화 하여 접근한다. 이 연구의 Input변수는
(i) 연구1~3변수
(ii) 합성곱에 의한 new 변수 포함(ex: sad*acousticness)
(iii) 음성분석 Praat tool을 이용한 발굴 변수(기타: 뮤직 feature tool로 알려진 Yaafe, Sonic Annotator, GNAT사용)
(iv) Python librosa를 통한 new 발굴 변수(MFCC, Mel-spectrogram)
음악 전문가의 분석 니즈는 평균/하이라이트 음역대, Intro 피아노, 기타, 현악, 첼로 독주, 독주와 협주의 구분, 음성과 바이올린, 음성과 피아노 구간에 대한 추출과 분석, Prosody(운율 지표), Emotion feature (Timbre: Warm, Cold, Piercing), 코드 전개, 마디별 평균 코드 수, 다이어토닉 코드의 사용 비중, 곡 구조(intro, hook, verse 등) 등이다.
모델링이 구성되면 새로운 음악이 특정광고에 사용될 가능성을 확률로 제시할 수 있고 특정광고음악과 유사한 음악들을 유클리디안 거리, 시계열 매핑 등으로 계산할 수 있다.