Play with Data 2 > Chapter 7. 나도 슈퍼스타!

[따라하기] 월별 인기 음악 장르 분석하기

 월별로 인기 음악 장르가 다를까?

1. 월별 인기 음악 장르 추측해보기

여러분들은 여름에 어떤 음악을 많이 듣나요? 여름에 듣는 음악과 겨울에 듣는 음악이 비슷한가요? 이번에는 월별로 사람들이 어떤 음악을 듣는지 알아보려고 해요. 이번에도 마찬가지로 다음 질문에 대해 추측해서 답해볼까요?

1) 새해가 시작되는 1월에는 사람들이 무슨 음악을 많이 들을 것 같나요?

2) 캐롤은 1년 중 몇 월부터 듣기 시작할 것 같나요?

3) 발라드는 일 년 중 어느 계절에 많이 들을 것 같나요?

4) 여러분의 질문 _________________________________________________________________ 

 

위의 질문 외에도 여러분이 궁금한 것을 하나 적어보세요. 그리고 그 질문에 대한 답을 추측해봅시다.



2. 네이버 바이브 데이터로 월별 인기 음악 장르 분석 및 해석하기

자, 그럼 여러분의 추측이 맞았는지 틀렸는지, 데이터를 직접 보면서 한번 알아볼까요?

  

  

‘데이터분석’ 칸을 누르고 위에 ‘테이블 불러오기’를 선택해주세요. 이후 등장하는 화면 왼쪽 상단에 ‘테이블 추가하기’ 버튼을 눌러주세요.


‘테이블 선택’에서 ‘네이버 VIBE 장르별 재생 수’를 클릭한 후 아래의 ‘추가’를 누릅니다.

 

데이터를 살펴볼게요. ‘테이블’에 보면 1월부터 12월까지 총 6개 장르의 노래 재생수가 나와있어요.

 

이것도 역시 숫자로만 보니까 의미를 알기가 어려워요. 그래프로 시각화해봅시다.

‘테이블’에서 ‘차트’를 누르고 ‘+’ 버튼을 눌러봅시다. ‘꺾은선’을 선택해봅시다. 시간의 흐름에 따라 변화하는 내용을 표현할 때는 꺾은선 그래프가 좋아요.  


2-1. 새해가 시작되는 1월에는 사람들이 무슨 음악을 많이 들을까?

‘가로축’‘월’, ‘계열 값’‘합계’를 제외한 나머지 장르들(발라드, 댄스, 힙합, 팝, 캐롤)로 선택해볼게요. 이렇게 하면 모든 장르의 1년 간 재생수 변화를 한 눈에 볼 수 있어요.

 

1월에 가장 많이 듣는 음악은 무엇인가요? 1월에는 발라드를 가장 많이 듣네요. 왜 그럴까요? 어 그런데 다른 달들을 보니 여전히 발라드를 많이 들어요. 1월이 특별해서 발라드가 1위를 한 것이 아니라 발라드는 원래 인기가 많은 음악 장르인가 봅니다.


2-2. 캐롤은 몇 월부터 듣기 시작할까?

캐롤은 크리스마스에 듣는 노래지요? 크리스마스는 12월 25일인데, 사실 우리는 그 전부터 길거리 상점에서 캐롤을 들어요. 사람들은 몇 월부터 캐롤을 듣기 시작할까요? 이 질문에 답을 하고 싶으면 1월부터 12월까지 ‘캐롤’의 재생수 변화를 보면 돼요. 시간의 흐름에 따라 변화하는 내용을 표현할 때는 꺾은선 그래프가 좋아요. ‘테이블’에서 ‘차트’를 누르고 ‘+’ 버튼을 눌러봅시다. ‘꺾은선’을 선택해봅시다. ‘가로축’‘기간’, ‘계열 값’‘캐롤’로 선택합시다. 이렇게 하면 1년 간 캐롤의 재생수 변화를 한 눈에 볼 수 있어요.

 

캐롤 그래프가 갑자기 증가하는 달은 언제 인가요? 10월이네요. 사람들이 10월부터 크리스마스를 기다리며 캐롤을 들었나 봅니다.


2-3. 발라드는 일 년 중 어느 계절에 많이 들을까?

발라드는 이야기가 담긴 노래를 말해요. 사랑노래와 이별노래가 대표적인 발라드 노래죠. 1년 중 발라드 음악을 가장 많이 듣는 달은 언제일까요? 이 질문에 답을 하려면 월별로 발라드의 재생수 변화를 보면 돼요. ‘테이블’에서 ‘차트’를 누르고 ‘+’ 버튼을 눌러봅시다. ‘꺾은선’을 선택해봅시다. ‘가로축’을 ‘기간’, ‘계열 값’을 ‘발라드’로 해볼게요. 이렇게 하면 1년 동안 발라드의 재생수 변화를 한 눈에 볼 수 있어요. 가장 높은 달은 언제인가 요? 4월과 11월이네요.

 

왜 그럴까요? 그래프를 전체적으로 보면 봄에 높다가 여름에 낮아졌다가 가을에 다시 높아 지네요. 봄, 가을에 사람들이 발라드를 많이 듣는다는 말이에요. 아마 봄에는 사랑노래, 가을에는 이별노래를 많이 들었을 수도 있겠어요.


여러분이 만든 질문에도 답할 수 있나요? 그리고 그 결과를 창의적으로 해석해보세요.

 <워크시트>

1) 새해가 시작되는 1월에는 사람들이 무슨 음악을 많이 들었나요?

2) 캐롤은 1년 중 몇 월부터 듣기 시작했나요?

3) 발라드는 일 년 중 어느 계절에 많이 들었나요?

4) 여러분의 질문 __________________________________________________________


이렇게 우리가 추측한 결과에 대해 데이터로 확인해보았어요. 데이터의 분석 결과는 다 같을 수 있어도 왜 그런지에 대해 설명하는 것은 사람마다 다 다를 수 있어요. 이렇게 데이어 분석 결과로부터 가치와 의미를 찾는 일을 우리는 ‘데이터의 해석’이라고 합니다. 데이터를 분석하는 것은 기계도 할 수 있지만 그 결과를 창의적으로 해석 하는 것은 인간의 역할이에요. 데이터의 주제에 대해 관심과 지식을 많이 갖춘 사람일수록 데이터 분석 결과를 더욱 더 창의적이고 정확하게 해석할 수 있겠죠?



 데이터 윤리 - 음원 사재기와 데이터 조작

※ 음원사재기와 데이터 조작

음원 사재기에 대해 들어본 적이 있나요? 네이버 바이브와 같은 음악 스트리밍 서비스 내에서 자신의 음악의 순위를 올리기 위해 사용하는 조작 행위를 의미해요. 특정 가수의 음악을 기계가 반복해서 재생함으로써 순위를 올리는 방식인데요. 지난 몇 년 간 몇몇 가수들이 음원 사재기 논란을 겪기도 했죠.

 

그렇다면 왜 음원 사재기를 하는 걸까요? 여러분들이 스트리밍 서비스를 통해 음악을 들을 때 음악의 작곡가나 가수에게 수입이 제공된다는 사실, 알고 있었나요? 이렇게 사람들이 음악을 듣는 횟수에 따라 순위가 올라가고 수입이 정해지는 구조 때문에 가수나 소속사 혹은 일부 팬들이 특정 음악의 음원을 반복해서 재생하는 문제가 생겼어요.

이렇게 우리가 완벽하다고 생각해왔던 시스템도 사실은 데이터 조작에 의해 조작될 수 있습니다. 데이터에 기반한 결정이 객관적일 것 같지만 이렇게 데이터가 조작되거나 편향되어 있을 경우에는 좋지 못한 결과가 나올 수 있답니다. 특히 인공지능은 많은 양의 데이터 즉, 빅데이터를 기반으로 하고 있는데요. 인공지능도 마찬가지로 어떠한 데이터를 넣느냐에 따라 결과가 달라질 수 있어요.


따라서 인공지능 시대를 살아갈 우리들은 인공지능이 어떤 데이터를 사용하고 있는지, 데이터가 조작되지는 않았는지 늘 날카롭게 바라보아야 할 것입니다.