Play with Data 2 > Chapter 7. 나도 슈퍼스타!

[준비하기] 연령대별 인기 음악 분석하기

 나이에 따라 인기 음악이 다를까?

엔트리봇이 슈퍼스타N에 나가서 우승할 수 있으려면 어떤 음악을 골라야할까요? 사람들에게 인기가 높았던 음악을 선택하는 것이 유리할 것 같은데요. 인기가 많은 음악을 찾기 위해서는 우리가 평소에 자주 사용하는 음악 서비스에 남아 있는 데이터를 활용해야 할 것입니다.

여러분은 평소에 어떤 음악을 듣나요? 음악을 듣기 위해 어떤 서비스를 이용하나요? 다음의 내용들을 포함하여 나의 경험을 말해봅시다.

1)어떤 가수의 어떤 음악을 자주 듣나요?

2) 음악을 듣기 위해 사용하는 서비스(어플, 웹사이트)는 무엇인가요?


네이버 바이브(Naver Vibe)는 네이버의 음악 스트리밍 서비스입니다. 사람들이 네이버 바이브의 어플이나 홈페이지에 들어가서 음악을 들으면 인터넷상에 데이터가 남게 되는데요, 누가, 몇 시에, 무슨 음악을, 몇 초 동안 들었는지 등의 데이터가 남습니다. 이렇게 사용자가 인터넷에 접속해서 남기는 발자국 같은 데이터를 '로그 데이터'라고 합니다. 이번 프로젝트에서는 네이버 바이브의 사용자들이 남긴 로그 데이터를 보고 연령별, 월별로 어떤 음악이 인기가 많은지 분석해볼 거예요. 그리고 엔트리봇이 계절에 따라 인기 음악을 선택할 수 있도록 도와주는 프로그램을 만들어보겠습니다.



1. 연령대별 인기 음악 추측해보기

여러분은 어떤 음악을 좋아하나요? 여러분이 좋아하는 음악과 선생님이 좋아하는 음악은 비슷할까요? 2019년 1년 간 가장 많은 재생수를 기록한 음악은 무엇일까요? 10대는 어떤 가수의 어떤 음악을 많이 들었을까요? 데이터를 살펴보기 전에 우리는 머릿속으로 추측을 해볼 수 있어요. 다음의 질문에 대한 여러분의 추측을 말해보세요.

1) 2019년 1년 간 가장 많은 재생수를 기록한 음악은 무엇일 것 같나요?

2) 2019년 1년 간 10대가 가장 많이 들은 음악은 무엇일 것 같나요?

3) 2019년 1년 간 10대가 가장 많이 들은 가수는 누구일 것 같나요?



2. 네이버 바이브 데이터로 연령대별 인기 음악 분석 및 해석하기

자, 그럼 여러분의 추측이 맞았는지 틀렸는지, 데이터를 직접 보면서 한번 알아볼까요?


  

  

‘데이터분석’ 칸을 누르고 위에 ‘테이블 불러오기’를 선택해주세요. 이후 등장하는 화면 왼쪽 상단에 ‘테이블 추가하기’ 버튼을 눌러주세요.

 

'테이블 선택’에서 ‘네이버 VIBE 재생 수 및 연령별 선호도’를 클릭한 후 아래의 ‘추가’ 버튼을 누릅니다.

잠깐 데이터를 살펴볼까요? 이것은 2019년 1월부터 12월까지 재생수를 기준으로 1위부터 100위까지의 음악들을 대상으로 만든 데이터입니다. 첫 번째 열에는 노래 제목이, 두 번째 열에는 ‘아티스트’라고 해서 가수 이름이, 세 번째 열에는 재생 수가 있어요. 두 번째 행인 ‘작은 것들을 위한 시’를 볼까요? 방탄소년단의 노래이고, 재생 수는 약 6백 만 번이네요.

이렇게 숫자로 보니까 잘 모르겠죠? ‘차트’를 클릭해서 그래프로 표현해봅시다. ‘+’ 버튼을 눌러서 ‘막대’를 골라보세요.


막대 그래프는 하나의 주제를 가지고 서로 다른 대상을 비교할 때 좋아요. 우리는 재생수, 연령대별 선호도처럼 특정한 주제를 가지고 100개의 음악을 비교해볼 거예요.


2-1. 2019년 1년 간 가장 많은 재생수를 기록한 음악은 무엇일까?

2019년 일 년 동안 가장 인기 있었던 음악을 알기 위해서 그래프를 그려볼 거예요. ‘가로축’을 ‘제목’, ‘계열 값’을 ‘재생 수’로 만들어보세요.


2019년 가장 인기가 많은 음악은 무엇이었나요? ‘작은 것들을 위한 시’가 1위였네요. 

2-2. 2019년 1년 동안 10대가 가장 많이 찾은 음악은 무엇일까요?

이번에는 연령대별로 인기 음악을 알아볼 거예요. 여러분은 10대니까 10대 선호도를 알아볼게요. ‘가로축’은 그대로 ‘제목’으로 두고 ‘계열 값’에 ‘10대 선호도’를 넣어주세요.


2019년 10대에게 가장 인기가 많은 음악은 무엇이었나요? ‘사랑이란 멜로는 없어’와 ‘BAND’가 아슬아슬하게 1, 2위를 차지하고 있네요.

2-3. 2019년 1년 동안 10대가 가장 많이 찾은 음악을 부른 가수는 누구일까요?

이번에는 음악이 아니라 가수를 살펴볼 거예요. 10대에게 인기가 많았던 가수를 살펴보기 위해서 ‘가로축’은 ‘아티스트’, ‘계열 값’은 그대로 ‘10대 선호도’로 해보세요.

 

2019년 가장 인기가 많은 가수는 누구였나요? ‘전상근’과 ‘창모’가 1, 2위를 차지하고 있네요.

여러분의 추측이 맞았나요? 데이터를 발견한 사실을 워크시트에 적어보세요.

1) 2019년 1년 간 가장 많은 재생수를 기록한 음악은 무엇이었나요?

2) 2019년 1년 간 10대가 가장 많이 들은 음악은 무엇이었나요?

3) 2019년 1년 간 10대가 가장 많이 들은 가수는 누구였나요?




 쉬어가기(1) 사물인터넷 전문가란?

1. 데이터 과학 기초 용어 익히기

※ 사물인터넷 전문가란?

사물인터넷(IoT: Internet of Things)은 여러 사물을 인터넷으로 연결하여서 새로운 기능을 제공하는 것을 의미합니다. 우리 삶에서는 어떻게 사용될까요?

 

아침이 되어 해가 밝아옵니다. 빛 감지 센서가 이를 감지하고 스마트 스피커에서는 당신이 좋아하는 가수의 노래를 틀어 잠에서 깨워줍니다. 침대에서 일어나 화장실로 가는데 스마트홈은 당신의 이동경로를 파악해서 자동으로 화장실 불을 켜줍니다. 냉장고는 당신이 지난 밤 깊은 잠에 들지 못한 것을 알아내서 피로회복에 좋은 재료들로 아침 식단을 추천해줍니다. 재료가 떨어지면 알아서 인터넷으로 필요한 재료를 구매하기도 합니다.

영화에나 나올 법한 이야기라고요? 우리 집에 있는 모든 사물이 인터넷으로 연결된다면 충분히 가능한 이야기입니다!


사물인터넷은 가정뿐 아니라 교통, 건축, 의료, 금융 등 다양한 분야에서 활용되고 있으며 앞으로 더 확대될 것입니다. 

사물인터넷 전문가는 이를 위해 다양한 사물에 센서를 붙이고 이들 사물이 서로 정보를 인터넷으로 주고받을 수 있도록 하는 기술을 개발하는 역할을 합니다. 이를 위해서는 컴퓨터와 기계를 다룰 수 있는 능력, 다양한 사물인터넷을 생각해낼 수 있는 응용력과 창의력이 필요합니다!