Play with Data 2 > Chapter 3. 지식 iN 데이터를 분석해보자

[실습하기] 네이버 지식iN 데이터 분석하기

 지식iN 데이터 분석하기

1. 지식iN 분야별 질문, 답변수 분석하기

 

지식iN에서 월별로 질문의 유형을 정리한 엑셀파일이 있습니다. 가로축에는 기간이, 세로축에는 다양한 분야가 적혀있습니다. 가로축은 ‘행’, 세로 축은 ‘열’이라고 부릅니다. 각 행과 열에는 컴퓨터 통신, 게임, 엔터테인먼트, 경제, 건강 등 다양한 분야에 질문과 답변 수가 월별로 얼마나 있었는지 표현되어 있습니다.


표로 제시되어 있는데 굉장히 복잡해 보이죠? 엔트리 작품만들기 [https://playentry.org/ws#!/]에 접속하여 지식iN 데이터를 분석해봅시다.


 

수업 Tip

엔트리 실습 링크 [https://blog.naver.com/nvplaysw/222162691603]에서 지식iN 데이터 파일을 다운받아 실습을 진행합니다. 


[STEP 1] 테이블에서 필요한 데이터 추가하기


 

  

1) 블록 탭에서 데이터분석을 선택한 후 테이블 불러오기 버튼을 눌러주세요. 다음으로 '테이블 추가하기'를 클릭합니다.


 

2) 데이터가 많기 때문에, 직접 입력하지 않고 파일을 직접 업로드해봅시다. 파일올리기를 누르고 파일을 드래그한 후, '추가' 버튼을 클릭합니다. 

 

3) 파일을 추가한 모습입니다. ‘정보’에서는 각 요소별로 ‘평균’ 등을 한 눈에 볼 수 있습니다.


[STEP 2] 테이블에서 차트로 표현하기


1) ‘테이블’ 버튼을 누르면 엑셀 파일에서 볼 수 있었던 표가 나옵니다. 마찬가지로 복잡하기 때문에 그래프로 표현해서 확인하도록 하겠습니다.


 

2) 먼저 ‘차트’를 클릭하세요. 그리고 ‘막대 그래프’를 클릭합니다.



 

 3) 그래프 가로축은 ‘기간’을 클릭합니다.


 

4) 계열 값은 선택하실 수 있는데 먼저 ‘모두’를 클릭해보겠습니다.

5) 분야별로 여러 색상으로 구분되어 막대 그래프로 표현되는 것을 확인할 수 있습니다.


[STEP 3] 한 분야만 선택한 그래프 확인하기



 


6) 이렇게 한 가지 분야만 선택해서 그래프로 표현할 수 도 있습니다. 자유롭게 분야를 바꿔가며 그래프를 살펴봅시다.

2. 질문이 가장 많은 월(달) 확인하고 이유 분석하기

그래프를 통해 분석하면서 질문에 답해봅시다.

 <워크 시트>

(가) 어떤 분야에 대한 질문과 답변이 많은가요?

(나) 몇 월에 질문과 대답이 가장 많았나요?

 

질문과 답변수를 보면 10월에 유난히 수치가 높은 것을 확인할 수 있습니다. 네이버 검색을 통해 2019년 10월에 무슨 일이 있었는지 조사해봅시다.


 (다) 무슨 일이 있었나요? :


 

2019년 10월에 네이버 지식iN 17주년 이벤트가 있었습니다. 다른 기간에 비해 이벤트 기간 동안 지식iN에서 질문과 답변수가 평소보다 확연히 늘었다는 사실을 데이터 분석을 통해 확인 할 수 있습니다.

 



 쉬어가기(2) 스토리텔링의 중요성

스토리텔링(Storytelling)이란?

'스토리(story) + 텔링(telling)'의 합성어로서 말 그대로 '이야기하다'라는 의미를 지닙니다. 즉 상대방에게 알리고자 하는 바를 재미있고 생생한 이야기로 설득력 있게 전달하는 행위입니다. 스토리텔링은 원래 문학이나 영화, 교육학 등에서 활용되던 방법이었습니다. 오늘날 우리 일상생활에서 스토리텔링은 여러 가지로 유익하고 설득력 있는 수단으로 이용되고 있습니다. 인류가 등장한 이래 스토리텔링은 인간끼리의 의사소통에 있어 늘 중심적인 역할을 해왔기 때문입니다. 스토리텔링은 매체의 특성에 따라 다양하게 발현되고 하는데, 영화·비디오·애니메이션·만화·게임·광고 등의 원천적인 콘텐츠로 활용되고 있습니다.

[출처 : 네이버 지식백과] 스토리텔링 (문학비평용어사전, 2006. 1. 30., 한국문학평론가협회)

전문가 인터뷰

 

라인(LINE)에서는 일본에서 ‘코노미’라는 프로그램을 통해 맛집 추천을 해줍니다. 초기에는 사람들이 먹었던 음식에 대한 기록을 바탕으로 순위를 매겨 추천을 했는데 반응이 좋지 않았습니다. 그래서 스토리를 넣어 ‘이 음식점은 당신이 3일 전에 먹었던 음식처럼 매운 음식을 팔고 있습니다’와 같이 제시해보았더니, 오히려 사용자들이 더 많은 관심을 보였습니다. 데이터분석에 가장 중요하게 다뤄지는 것은 ‘스토리’입니다. 기술이 아니라, 스토리를 만들어내고 제시한 다음, 반응에 따라 수정해나가는 것이 매우 중요한 화두라고 할 수 있습니다.

- 김광림님 인터뷰(네이버 데이터랩 데이터 엔지니어)


1년에 1095개 vs 하루에 3개?

같은 내용이라도 어떻게 표현하느냐에 따라 사람들에게 다른 느낌을 줄 수 있습니다. 사과를 1년 동안 1095개를 먹는다고 하는 것과 매일 3개를 먹는다고 했을 때 느낌이 비슷한가요? 같은 내용이라도 이야기를 어떻게 풀어내느냐가 중요합니다. 데이터 분석에서도 ‘스토리텔링’을 잘 활용할 필요가 있습니다.