카테고리 없음

Spotify 0. 음악을 숫자로 본다는 것

elya0919 2025. 6. 27. 00:49
왜 이 분석을 시작하는가 ?

 

데이터 분석을 공부하면서 "도메인에 대한 이해"가 얼마나 중요한지 실감했다.

낯선 분야에서는 어떤 데이터가 의미가 있는지조차 판단이 어려웠기에

그래서 전공분야로 가장 자신있는 도메인인 "음악"이라는 분야를 첫 개인 프로젝트로 삼았다.

 

가설 1

빌보드 차트 상위권 음악들의 장르, 특성들이 시간이 흐르고 한국에 유행을 한다.
이것을 데이터로 분석해보면 어떠한 주기, 패턴을 명확히 수치화가 가능하지 않을까 ?

 

가설 2

상위권 곡들 사이에 수치화 가능한 공통점이 존재한다면,

장르나 곡의 특성만으로 히트 가능성을 예측할 수 있는 공식도 만들 수 있지 않을까 ?

 

음악 활동을 하면서 곡을 음악 분석할 때 수치화까지는 아니더라도

트랜드, 장르, 곡의 특성같은 정성적인 기준을 나름대로 정리해온 경험이 있었다.

이제는 그 흐름을, 그리고 그 이외의 다양한 음악적 분석들을 정량적 지표로 바꿔 보고 싶다는 생각이 들었다.

 

음악 산업 데이터 분석가의 업무

분석에 앞서 음악 산업에서 데이터 분석가는 실제로 어떤 데이터로를 다루며 어떤 업무를 수행하는지 궁금해졌다.

단순히 내가 세운 가설을 분석을 하기보다는 실제 현업에서의 역할을 먼저 살펴보고 싶었다.

그래서 음악 산업 데이터 분석가 직무를 조사하고

모두가 이름만 들어도 알만한 음악 기획사의 데이터 분석가 채용공고를 살펴봤다.

1
2
3

 

이 외에 스타트업 회사의 채용공고도 봤다.

뮤즈라이브

공통적으로 음악 산업 데이터 분석가는 유관 부서와의 협업, 리포트 작성 등 커뮤니케이션 역량이 정말 중요한 역할이라는 점이 눈에 띄었다.

 

흥미로웠던 건, 각 회사마다 분석의 중심이 조금씩 다르다는 점이었다. 예를 들어, 어떤 회사는 스트리밍 데이터를 주로 볼 수 있고, 다른회사는 팬덤 데이터를 더 중점적으로 다룰 수 있다는 식이다.

 

물론 이는 수많은 업무 중 일부일 뿐이고, 결국 음악 산업 전반의 데이터를 폭넓게 다룬다는 공통 기반 위에서 회사의 요구 사항에 따라 약간씩 나뉜다고 볼 수 있다. 예를 들어 음악 데이터와 경영 지표를 다루는 팀이라고 해서 팬덤 데이터를 아예 다루지 않는 건 아닐 것이다.

 

오히려 다양한 데이터를 연결해서 음악 활동과 엔터테인먼트 비즈니스 전반을 연결해 인사이트를 도출하는 역할을 한다는 걸 확인했다.

 

이 과정을 통해 처음에 내가 떠올렸던 단순한 '음악 분석', '음원 차트 분석'에서 한 걸음 더 나아가 

 

복합적인 요인을 고려한 폭넓은 관점의 분석이 필요하다고 느꼈다.

 

그래서 나는 무엇을 분석할 것인가?

 

나는 크게 음악 산업 데이터 분석을 4가지로 나눠봤다.

 

1. 음악 데이터 분석 (BPM, 장르, 가사 등 음악 자체 + 트렌드 예측 like A&R)

2. 플랫폼 데이터 분석 (YouTube, Spotify 사용자 행동 데이터) 

3. 팬덤 지표(팬 커뮤니티 활동, 앨범과 굿즈 판매량, 팬 반응 등등)

4. 경영 지표 (재무재표 및 마케팅 수익 등)

 

현재 개인 프로젝트의 현실적인 제약을 고려하며, 제일 자신있는 음악 및 음원 차트 분석에 집중하고자 한다.

 

그래서 나는 음악 산업에서 요구되는 역량 중 하나인 미래 트렌드를 예측을 목표로 삼았다.

 

데이터 탐색

 

음악 및 음원차트 분석을 위해 데이터를 탐색했고

kaggle에 Spotify를 관련 데이터가 존재했다. (어느 정도 검증된)

 

Kaggle에서 Spotify 검색

 

 

2024년 스포티파이에서 가장 많이 스트리밍 된 노래 

2023년 스포티파이에서 가장 많이 스트리밍 된 노래 

2014~2022년 스포티파이 트랙 차트 데이터셋 

 

여러 데이터셋 중 내가 목표하는 트랜드 예측에 적합한 형태의 연도별로 정리되어 있는 음원차트 데이터를 찾았다.