Play with Data 2 > Chapter 6. 옷을 추천해주는 프로그램을 만들자!

[준비하기] 엔트리의 기온 데이터 탐색하기

 엔트리 기온 데이터 탐색하기

1. 옷을 고르는 나만의 기준 이야기하기

다른 지역이나 나라로 여행을 갈 때는 항상 어떤 옷을 챙겨가야 할지 고민이 됩니다. 여러분도 비슷한 경험이 있을 것입니다.

여러분은 이렇게 고민되는 상황에서 옷을 고를 때 어떤 정보들을 찾아보나요? 이럴 때 우리에게 자동으로 옷을 추천해주는 프로그램이 있다면 참 편하겠죠? 오늘은 데이터를 바탕으로 옷을 추천해주는 프로그램을 만들어보도록 하겠습니다.

여러분은 평소에 어떤 기준으로 옷을 고르나요? 여러분의 경험을 떠올리며 다음 질문에 대한 답을 워크시트에 적어봅시다.


1. 옷을 고를 때 도움이 되는 기준에는 무엇이 있을까요? (모두 적어보세요)

2. 위에서 적은 기준들 중에서 가장 중요하게 생각하는 기준은 무엇인가요?

3. 왜 중요하다고 생각하나요?

4. 기준을 생각하며 옷을 고른 경험이 있나요? 어떤 경험이었나요?



2. 16개 시도의 월별 기온 데이터 테이블 추가하기

그럼 지금부터 엔트리에 있는 기온 데이터를 탐색해봅시다! 먼저, 엔트리 홈페이지에 접속하여 ‘작품 만들를 클릭해주세요.

  

  

작품을 만드는 화면이 나왔나요? 그렇다면 ‘데이터분석’ 칸을 누르고 위에 ‘테이블 불러오기’를 선택해주세요. 이후 등장하는 화면 왼쪽 상단에 ‘테이블 추가하기’ 버튼을 눌러주세요.  

테이블 추가하기 화면에서 ‘월평균 기온’ 테이블을 클릭해주세요. 그리고 아래의 ‘추가’ 버튼을 눌러주세요.


그럼 이렇게 화면에 테이블 하나가 생성되었습니다. ‘정보’ 탭에서 스크롤을 내리면서, 몇 개의 지역에 대한 데이터인지 확인해봅시다. 총 몇 개인가요?

테이블 글자 아래에 보면 행이 24개라고 되어 있습니다. 행이 24개라는 것이 무엇을 의미할까요?


 

위의 ‘테이블’ 탭을 클릭해봅시다. 스크롤을 내리다 보면, 데이터가 2018년부터 2019년까지 있다는 것을 알 수 있습니다. 1년은 12개월로 되어있으니, 2년은 24개월이겠네요! 따라서 ‘정보’ 탭에서 행 숫자 ‘24’는, 24개월을 뜻한다는 것을 알 수 있습니다.

 



3. 지역별 그래프를 통해 추이 파악하기

이번에는 각 지역별 데이터를 활용하여, 다양한 그래프(차트)를 그려보겠습니다.


3-1. 지역별 월 평균온도 그래프를 꺾은선 그래프로 표현하기

 

먼저 한가지 지역에 대한 기온 변화를 꺾은선 그래프로 표현해보겠습니다. ‘차트’ 탭을 선택한 후, ‘+’ 버튼을 누르고 ‘꺾은선 그래프’를 선택해주세요. 

 

가로축에는 ‘월’을 선택하고, 계열값은 원하는 지역을 한 개 선택해주세요. 

 

그래프를 한 번 살펴보고 아래 내용을 토의해봅시다. 

 

 <워크시트>

1. 특정 지역의 월평균 그래프가 어떻게 변하고 있는지 토의해봅시다. (ex. 여름에는 기온이 높아지고, 겨울에는 기온이 떨어지는 것을 데이터를 통해 확인할 수 있습니다.) 


3-2. 지역별 월 평균온도 데이터를 막대 그래프로 표현하기

 

이번에는 막대 그래프를 살펴보겠습니다. ‘+’ 버튼을 눌러 막대그래프를 추가해주세요. 가로축에는 ‘월’을, 계열 값으로는 비교하고 싶은 두 지역을 클릭해주세요. 

 

막대 그래프를 보면서 두 지역의 월별 기온 데이터를 비교할 수 있습니다. 어느 지역의 평균 기온이 더 높게 나는지 확인하고 토의해봅시다.


 <워크시트>

2. 두 지역의 월 평균기온 그래프를 비교해보고 어떤 차이가 있는지 답해봅시다. (ex. 경기도가 강원도보다 대체적으로 평균 기온이 높습니다.)



 쉬어가기(1) - 날씨 데이터와 빵집의 상관관계

※ 날씨 데이터와 빵집의 상관관계

가게나 기업을 운영할 때 ‘날씨’ 데이터는 매우 중요합니다. 그래서 ‘날씨 경영’이라는 말도 나왔죠. 장마, 무더위, 혹한과 같은 날씨가 찾아올 때마다 기업들은 사람들의 날씨 데이터와 사람들의 행동 데이터를 기업의 경영 과 접목시켜 생각하곤 합니다. 다양한 사례들을 살펴볼까요?

1) 비오면 조리빵, 더우면 크림빵

2012년 P사는 날씨와 매출의 상관관계를 데이터로 분석하기 시작했습니다. ‘비오는 날 조리빵 판매가 유독 많다’는 현장 영업사원들의 의견을 본사 데이터팀에서 확인한 결과 사실로 드러났기 때문이죠. P사는 그때부터 과거 5년간 판매 내역과 날씨의 관계를 데이터로 만들어 가맹점에 공유하기 시작했습니다. P사의 한 직원은 "날씨에 따른 판매량을 미리 예측해 부족하거나 버리는 제품이 없도록 하기 위해 날씨 데이터를 활용하고 있다" 고 설명했습니다. 실제로 기온이 27℃ 이상의 맑은 날씨에는 샌드위치가 잘 팔리고, 비가 오는 20℃ 안팎의 날씨에는 기름기가 많은 조리빵(피자빵, 소시지빵 등 고명을 올린 빵)이 잘 팔린다는 데이터가 있다고 하니 정말 신기합니다!

2) 겨울엔 호빵, 여름엔 얼음! 그것 말고도 데이터가 더 있다!

국내 편의점 C사는 날씨 정보 제공 업체인 '케이웨더'로부터 매일 4시간 단위로 날씨 정보를 받아 가맹점 사장님들에게 공유해줍니다. 가맹점 사장님들은 물건을 주문할 때 이 데이터를 참고합니다. 날씨 데이터는 단순히 겨울엔 호빵을, 여름엔 얼음을, 장마엔 우산을 가게 앞쪽에 배치하도록 하는 것 이외에도 더 많은 정보를 제공 해주기 때문이죠. 예를 들어, 날씨에 영향을 많이 받는 음료, 아이스크림, 삼각김밥, 샌드위치 등의 먹거리를 주문할 때, 날씨 데이터에 따라 종류나 주문 수량을 결정할 수 있습니다. 만일 다음 주에 무더위가 예상된다면, 과거의 데이터를 파악해 ‘30℃ 이상의 기온에서 잘 팔린 제품’을 미리 찾아보고, 주문을 넣을 수 있겠죠.

3) 해외의 날씨 데이터까지

연간 1조8000억 원 가량의 곡물을 수입하는 B사는 날씨를 전문적으로 분석하여 전 세계의 곡물가격 변화에 대비하고 있습니다. 특히 원당, 옥수수, 대두, 원맥 등의 원재료 가격은 기상 변동에 민감하게 반응하기 때문에, 국내뿐만 아니라 미국 뉴욕과 시카고 상품거래소에 사무소를 두고 실시간으로 작황과 데이터를 점검한다고 합니다. 만약 미국에서 수입하는 옥수수나 대두가 현지 작황으로 품질이 떨어지거나 값이 올라가는 일이 생기면 원재료에 따라 동남아, 호주 등에서 수입하는 곡물량을 늘리는 방식이죠.

출처 : https://www.hankyung.com/economy/article/201807027224g