시계열 군집분석을 통한 디지털 음원의 순위 변화 패턴 분류*
(한국지능정보시스템학회, 2020)
- 디지털 음악에 대하여 공신력 있는 음원 차트인 '가온 차트'에 진입한 음원들의 73주간 순위 변화를 수집
- 유사한 특징을 가지는 패턴들로 분류 -> 각 순위 변화 패턴으로부터 주목할만한 특징에 대한 설명적 분석
- 음원에 대한 신뢰도 이슈가 발생하기 이전 기간의 국내 발매된 디지털 음원들로 한정하여 시점을 일치시킨 후 시계열 군집을 통해 패턴을 도출
- 데이터 수집과 전처리를 통하여 742건의 중복되지 않은 음원 확보
- 시계열 순위 변화에 대한 시계열 군집분석 결과 16개의 패턴들이 도출
- '스테디셀러'와 '원 히트 원더'의 두 가지 유형의 대표적인 패턴 확인
- 원 히트 원더형 패턴에서 아티스트의 슈퍼스타 효과와 편승효과가 강하게 나타남.
- 소비자들의 디지털 음원 선택에 강한 영향을 미침
- 스테디셀러형 패턴을 통해 오랜 시간 소비자들의 선택을 받는 음원 확인
- 특히 주목할만한 점은 스테디셀러형 패턴을 통해 '차트 역주행' 현상을 확인
- 순위 변화의 패턴을 세분화함으로써 음원 연구에 대한 새로운 접근을 시도하였다는 점에서 의의가 있음.
- 시계열 군집분석
- 다양한 소비자들 속에서 동질의 소비자들을 분류해내는 것과 그 소비자 집단의 특성을 파악하는 것은 군집분석에 있어 핵심.
- 군집 분석은 표본들 간의 유사도에 기반하여 동질성이 높은 표본들을 하나의 군집으로 분류하는 탐색적 분석을 의미
- 데이터 마이닝 기법들 중 대표적인 비지도학습인 군집 분석은 분석 과정에서 동질적인 표본끼지는 동일한 군집에 배치하고, 이질적인 표본들 간에는 서로 다른 군집에 속하도록 배치
- 군집 분석의 주요 목적은 데이터들 간의 구조적 특성을 파악하기 위하여 주로 사용
- 군집화를 통하여 복잡한 데이터들 몇 개의 군집으로 나타낼 수 있으며, 나아가 데이터 집단의 대표적인 특성이나 유형을 파악하기 용이하다는 강점이 있음.