[따라하기] 네이버 웹툰 데이터 분석하기
네이버 웹툰 데이터 분석하기
1. 웹툰 데이터 테이블 생성하고 정보 확인하기
지금부터는, 여러분들이 앞서 수집한 데이터를 엔트리에 정리해보겠습니다. 먼저, 엔트리 홈페이지에 접속하여, ‘작품 만들기’를 클릭해주세요.
|
작품을 만드는 화면이 나왔나요? 그렇다면 ‘블록’ 탭의 ‘데이터분석’ 칸을 클릭한 후, ‘테이블 불러오기’ 버튼을 클릭해주세요. 다음 화면에서 ‘테이블 추가하기’를 클릭한 후, ‘새로 만들기’를 클릭하고, ‘추가’ 버튼을 클릭해주세요. |
칸에 글자를 적어 테이블 이름을 바꿀 수 있어요. 테이블 이름은 세 가지의 웹툰 중 하나를 골라 적어주세요. |
첫 번째 행을 클릭하여 데이터의 이름을 입력해줍시다. 1주, 2주, 3주, 4주, 5주까지를 입력할 것이기 때문에, 대표 이름으로 ‘주’를 적어주세요. |
같은 방식으로 ‘별점’, ‘좋아요’, ‘댓글’도 추가해주세요. |
이후 각 칸을 클릭하여 알맞은 데이터를 입력하겠습니다. 우리는 5주차만큼의 데이터를 입력하게 될 것이기 때문에 ‘주’ 아래에 1주~5주 데이터를 입력해주세요. (가장 위의 ‘1주’는 ‘가장 최근 1주’를 의미합니다. 그러니까 1주가 가장 가까운 시점인 셈이죠.) |
나머지 칸에는 여러분들이 찾아서 워크시트에 적어두었던 데이터를 옮겨 적어주세요. (선생님이 화면에 보여주는 예시는 정확한 데이터가 아닙니다. 여러분이 직접 적은 워크시트를 참고 해주세요.) |
혹시나 활동 중에 위와 같은 메시지가 뜬다면, 꼭 ‘확인’ 버튼을 클릭해주세요! 그렇지 않으면 지금까지 입력한 데이터가 다 날아갈 수 있답니다! |
테이블을 완성하면, 꼭 ‘저장하기’ 버튼을 눌러주세요. 위와 같은 방식으로 다른 웹툰 테이블도 추가해봅시다. 앞으로 2개를 더 추가하게 되겠죠? |
다른 테이블을 추가하고 나면 이렇게 세 개의 테이블이 생기게 됩니다. |
그렇다면 지금까지 정리한 각각의 웹툰 데이터를 분석해볼까요? 엔트리에 테이블을 입력하면, 자동으로 평균값과 최댓값, 중간값, 최솟값을 분석해준답니다. 위의 ‘정보’ 탭을 누르면, 각각의 웹툰에 대한 여러 가지 정보를 알 수 있습니다. |
다양한 정보를 워크시트에 정리해주세요. (다음 활동을 빠르게 할 수 있답니다!)
2. 엔트리 차트 기능을 활용해 데이터 시각화하기
|
이번에는 데이터를 차트로 살펴볼까요? 위의 ‘차트’ 탭을 눌러주세요. 그리고 플러스 버튼을 눌러주세요. 플러스 버튼을 누르면, 네 가지의 차트 종류가 나옵니다. 우리는 5주 동안의 ‘변화’를 살펴보는 것이므로, ‘꺾은선 그래프’를 선택해주세요. |
|
먼저 가로축을 설정해줘야 하는데요, 우리는 5주 동안의 변화를 살펴볼 것이기 때문에, ‘주’를 선택해주세요. |
|
계열 값에서는 내가 원하는 정보를 클릭할 수 있습니다. ‘별점’을 한 번 클릭해볼까요? |
클릭하고 나면, 이렇게 차트가 나오게 됩니다. 5주 동안의 별점 변화를 알 수 있네요!
나머지 정보들도 클릭해서 차트를 살펴봅시다. 그리고 다른 테이블의 정보들도 확인해봅시다.
표현 값을 ‘모두’ 선택해서 한꺼번에 차트를 살펴볼 수도 있습니다. 그렇지만, 보시다시피 좋아요의 개수는 만 단위이고, 댓글이나 별점의 단위는 천 단위이죠. 그래서 한꺼번에 차트를 살펴볼 때는 각각의 변화 정도를 쉽게 알기는 어렵습니다.
3. 데이터 시각화를 통해 3개의 웹툰 비교해보기
|
지금부터는, 여러분들이 앞서 각 웹툰의 데이터를 비교하면서 분석해보겠습니다. 3가지 웹툰을 한 번에 비교할 수 있도록 ‘만화비교’ 테이블을 추가해주세요. |
이렇게, 화면과 같이 테이블을 만들어주세요. ‘만화이름’, ‘별점 평균’, ‘좋아요 평균’, ‘댓글 평균’을 입력하고 각각의 웹툰 이름도 적어주세요. |
평균값의 데이터는 어디에서 얻을 수 있었나요? 네, 각 웹툰의 ‘정보’ 탭에서 알 수 있었습니다. 이미 여러분이 워크시트에 정리해놓은 데이터이니, 워크시트를 참고해주세요. |
이제부터, 각 웹툰의 평균 데이터를 비교해보겠습니다. 위쪽의 ‘차트’ 탭을 눌러주세요. 각 웹툰을 ‘비교’하는 것이므로, 이번에는 ‘막대그래프’를 선택해주세요. |
|
가로축으로 ‘만화이름’을 선택해주세요. |
|
계열 값으로는 ‘댓글 평균’을 선택해보겠습니다. ‘모두’를 선택할 수도 있지만, 앞서 설명했듯, 각 표현값의 수 차이가 크게 나기 때문에 ‘모두’를 선택할 경우 비교를 하기가 어려울 수 있습니다. 따라서, 한 가지씩 선택해주세요. |
|
차트를 보면, 각 웹툰의 정보를 비교해볼 수 있습니다. 이렇게 차트 아래에는 각 웹툰의 이름이 보입니다. 댓글 평균이 가장 높은 웹툰은 무엇인가요? |
지금까지 배운 내용을 복습하기 위해, 워크시트에 있는 빈칸을 채워 봅시다.
1. 웹툰 홈페이지에서 수집한 데이터는 ( 좋아요 수 ), ( 별점 ), ( 댓글 수 ) 입니다. 2. A에는 만 단위의 데이터가 모여 있습니다. 그리고 B에는 백 단위의 데이터가 모여 있습니다. A와 B를 동시에 차트로 나타내어 살펴본다면, 각각의 변화 정도를 알기 ( 쉬울 / 어려울 ) 것입니다. |
별점 테러로 발생하는 윤리적 문제
※ 별점 테러와 데이터 윤리
인터넷 플랫폼이나 앱을 사용하다보면, 만족도에 따라 ‘별점’과 ‘리뷰(댓글)’을 달아본 적이 있을 것입니다. 웹툰과 같은 작품이나 특정 서비스를 평가하고, 리뷰를 달아주는 일은 서비스를 운영하는 사람들에게 개선 방향을 알려주고, 격려도 해줄 수 있어 도움이 됩니다. 그런데 간혹 서비스를 제대로 체험해보지도 않고 자신의 기분에 따라 평점을 최하점으로 주는 경우도 있습니다. 웹툰도 마찬가지인데요, 새로 나온 웹툰의 그림체가 자신의 취향과는 맞지 않다는 이유로 내용을 읽어보지도 않고 낮은 별점으로 ‘테러’하는 경우가 있습니다.
|
이렇게 되면 작품이나 서비스에 대한 객관적인 평가를 데이터를 통해 확인하기 어렵게 됩니다. 이는 작가나 서비스 제작자에게 큰 피해를 줄 뿐만 아니라, 좋은 작품과 서비스를 만나고자 하는 다른 이용자들에게도 오해를 불러일으킬 수 있습니다. 이렇게 우리가 무심코 남긴 데이터가 누군가에게는 큰 영향을 미칠 수 있습니다. 여러 분이 남긴 데이터가 누군가에게 상처를 주지 않고, 사회발전에 도움을 줄 수 있다면 더 좋겠지요? |