[준비하기] 데이터 과학이란 무엇일까요?
데이터 과학이란 무엇일가요?
1. 데이터 과학 기초 용어 익히기
엔트리와 함께하는 데이터 과학 캠프에 참여해주신 여러분 반갑습니다. 이번 엔트리와 함께하는 데이터 과학 캠프에서는 엔트리를 활용해서 데이터 과학과 친해지는 시간을 가질 것입니다. 그 전에 기초 용어부터 익혀보도록 하겠습니다.
|
데이터(자료) : 관찰이나 측정 등을 통해서 얻은 단순한 사실이나 값. 예) 학생 각각의 키, 성적 증은 모두 데이터(자료)라고 할 수 있음. 또한 각종 설문을 통해서 얻어지는 한 사람, 한 사람의 의견도 자료라고 할 수 있음. |
데이터 과학 : 데이터로부터 의미 있는 정보를 추출해내는 학문으로, 데이터를 분석하고 그 결과를 해석하여 효과적으로 전달하는 과정 등이 포함됩니다. 예) 네이버에서 나의 쇼핑 데이터를 확인해서, 내 취향에 맞는 상품을 추천하기 -> 나의 쇼핑 데이터 : 데이터 / -> 내 취향 : 의미 있는 정보
데이터 과학자 : 현장에 존재하는 대량의 데이터를 모으고, 분석에 적합한 형태로 가공하고, 데이터가 의미하는 바를 다른 사람에게 효과적으로 전달하는 사람입니다.
표(테이블) : 조사한 자료를 어떤 기준에 따라 가로, 세로로 나뉜 직사각형 모양의 칸에 정리하여 자료에 나타난 수량을 한눈에 알아보기 쉽게 만든 것입니다.
<계절별 여행을 가고 싶어하는 학생 수>
|
그래프 : 데이터의 크기 비교나 자료의 변화를 한눈에 알아보기 쉽도록 자료를 점, 직선, 곡선, 막대, 그림 등을 이용하여 나타낸 것입니다. 막대 그래프, 꺾은선 그래프, 원 그래프, 그림 그래프 등이 있습니다. ex) 막대 그래프 |
2. 나이팅게일이 데이터 과학자였다?
|
그럼 본격적으로 시작하기 전에 간단한 퀴즈를 하나 풀어봅시다. 오른쪽 그림의 인물은 누구일까요? 그리고 이 분의 직업은 무엇 일까요? 플로렌스 나이팅게일입니다. 혹시 들어본 적 있나요? 대부분 나이팅게일을 간호사라고 알고 있습니다. 그러나 나이팅게일은 백의의 천사라는 별명을 가진 간호사이기도 하면서, <간호를 위하여>라는 간호학 책을 쓴 작가이기도 하고, 데이터 과학자이기도 합니다. |
3. 나이팅게일, 데이터 분석을 통해 세상을 구하다
나이팅게일이 데이터 과학자라고 하니까 어색하죠? 지금부터 나이팅게일이 왜 데이터 과학자인지 알아보겠습니다. 먼저, 나이팅게일의 생애를 통해, 나이팅게일이 데이터를 어떻게 활용하고 분석했는지 알아보도록 하겠습니다.
3-1. 어느 소녀의 꿈
플로렌스 나이팅게일은 1820년 어느 영국인 부부의 둘째 딸로 태어났습니 다. 나이팅게일이 17살이 되었을 때, 나이팅게일은 간호사가 되겠다고 폭탄 선언을 합니다. 당시만 해도 간호사는 사람들이 선호하는 직업이 아니었습니다. 부모님의 반대에도 불구하고, 나이팅게일은 마침내 33세에 작은 요양원의 책임자가 되었습니다. |
3-2. 참혹한 전쟁 속에서 데이터를 수집하고 분석하다.
1853년 유럽에서는 큰 전쟁이 벌어졌습니다. 러시아와 오스만 제국이 4년간 전쟁을 벌였죠. 나이팅게일은 야전병원의 간호 책임자로 이 전쟁에 뛰어들었습니다.
그녀의 눈에 가장 먼저 보인 것은 죽어가는 병사들이었습니다. 나이팅게일은 전투에서 죽는 병사의 숫자보다 전염병으로 죽는 병사의 숫자가 훨씬 많다는 사실을 알게 됩니다. 나이팅게일은 병원의 위생상태가 원인이라는 것을 알아채고, 지휘관들에게 병원 환경을 개선해달라고 요청하지만 거절당합니다. 그 당시 지휘관들은 모두 전투에만 신경을 쓰고 있었습니다. |
나이팅게일은 포기하지 않았습니다. 데이터를 직접 수집하고 분석했습니다. 노트에 매일의 상황을 정리했습니다. 입원과 퇴원 상황, 사망자 수, 사망 원인 등을 말이죠. 모두가 잠든 후에도 그녀는 잠들 수 없었습니다. 밤늦게까지 환자 사이를 오가는 모습을 보고, 사람들은 나이팅게일에게 “등불을 든 여인”이라는 별명을 붙여주었습니다.
3-3. 데이터 분석으로 세상을 구하다.
1854년 나이팅게일이 처음 간호 책임자가 되었을 때, 야전병원 환자의 사망률은 60% 이상에 달했습니다. 나이팅게일이 체계적으로 환자 데이터를 관리하고 분석한 덕분에, 야전병원 환자의 사망률은 단 6개월 만에 2%까지 떨어졌습니다. 이는 단순한 숫자의 변화가 아닌, 죽음이 생명으로 바뀌는 신호였습니다. |
지휘관들은 결국 나이팅게일에게 설득되었고, 얼마 후 나이팅게일은 영국군 전쟁지역 전체의 병원 간호를 책임지게 되었습니다. 그녀의 지휘 아래 대대적인 변화가 이어졌고, 수많은 생명들이 목숨을 건졌습니다.
3-4. 사망원인 도표, 2년간의 사망 데이터를 시각화하다.
전쟁이 끝난 후 1858년 나이팅게일은 이 모든 일을 담아 상세한 보고서를 만들었습니다. 제목은 ‘영국군의 건강, 능률, 병원 행정에 영향을 미치는 문제들에 관한 기록’이었습니다. 800쪽이 넘는 위대한 혁신의 이야기였습니다.
나이팅게일은 방대한 보고서를 단 한 장의 그림으로 요약하는 통찰을 발휘했습니다. 바로, 보고서의 핵심을 담은 ‘사망원인 도표’입니다. 2개의 원형 그림을 자세히 살펴봅시다. 원 하나가 1년을 나타냅니다. |
|
1년은 다시 1개월짜리 12개의 조각으로 구성되어 있습니다. 각 조각은 1개월 단위로 사망자 현황을 보여줍니다. 색깔은 사망 원인입니다. 바깥쪽 푸른색은 전염병으로 인한 사망, 붉은 색은 전투 중 치명적인 부상으로 인한 사망, 검은색은 기타 원인 사망입니다. 전염병으로 인한 사망이 전투로 인한 사망보다 훨씬 많다는 것을 쉽게 알 수 있죠? 나이팅게일은 데이터를 시각화를 통해 2년간의 데이터를 우리에게 한 눈에 보여주었습니다. |
이제 나이팅게일 동영상을 함께 시청해봅시다. 나이팅게일 영상 시청하기 : https://youtu.be/qCRWXpsbcL0 *영상은 0:00~2:00까지만 시청하면 됩니다. |
4. 데이터 과학자는 무엇을 하는 사람일까?
앞에서 살펴본 나이팅게일의 일생을 통해 오늘날의 데이터 과학자가 어떤 일을 하는지 구체적으로 알아봅시다. 워크시트를 보면 왼쪽에 데이터 과학자가 하는 일이 적혀있습니다. 오른쪽 빈칸에 나이팅게일이 데이터 과학자로서 한 일을 적어볼까요?
나이팅게일은 데이터 과학자의 모범이 되는 인물입니다. 그렇다면, 오늘날 데이터 과학자들은 어떤 일을 하고 있을까요? 데이터 과학 동영상을 함께 시청해보고, 데이터 과학이 어디까지 발전하고 있는지 살펴봅시다.
데이터 과학 동영상 시청하기 : https://www.youtube.com/watch?v=vc6heXAXqEs&t=128s
동영상에서 나온 데이터 과학이 적용된 사례를 워크시트에 적어봅시다.
이처럼 데이터 과학이 적용되는 사례들은 점점 늘어나고 있습니다. 그럼 데이터 과학은 데이터 과학자들만 할 수 있을까요? 아닙니다. 앞으로 우리도 데이터 과학을 통해 우리 생활의 문제를 해결해볼 것입니다. 나이팅게 일처럼 끈기와 열정을 가지고 데이터 과학을 배워봅시다.
쉬어가기(1) - 빅데이터 전문가란?
※ 4차 산업혁명 시대의 새로운 직업, 빅데이터 전문가란?
구글의 ‘플루 트렌드’는 감기나 독감의 검색 빈도가 높은 지역을 지도에 표시하여 독감의 확산을 가장 빨리 예측합니다. 페이스북은 개인의 성향과 검색패턴, 구매패턴을 분석해 맞춤화된 광고를 보여주기도 합니다. 서울시와 통신 회사인 KT는 고객들의 전화 데이터를 이용해서 가장 빠른 길로 다니는 버스 노선을 찾아내기도 합니다. 네이버랩스는 서울시 전역을 매우 정밀한 3D 지도로 구축하였습니다. 이때 항공사진으로 촬영한 2D의 평평한 이미지들을 현실 세계와 유사하게 3D로 복원하는 기술을 이용했습니다.
이러한 기술들은 바로 빅데이터가 있기 때문에 가능합니다. 세상에 존재하는 방대한 양의 데이터를 수집하고 분석해 가치 있는 정보로 만들어내는 빅데이터 기술은 정치, 경제, 문화, 과학 등 다양한 영역에서 활용되고 있습니다. 전 세계가 주목하고 있습니다!
빅데이터 전문가는 매우 빠르게 생산되고 있는 거대한 데이터를 실시간으로 수집하고 저장하며, 이 데이터를 분석해 가치 있는 정보를 추출하는 일을 합니다. 빅데이터 전문가가 하는 일은 크게 데이터 분석 기획, 데이터 수집, 데이터 분석, 시각화 및 보고서 작성 등으로 구분됩니다. 빅데이터 전문가가 하는 일에 대해 좀 더 자세히 알아봅시다.
1. 데이터 분석 기획 : 기업 등 고객이 빅데이터를 통해 얻고자 하는 정보가 무엇이고, 어디에 활용할 것인지를 협의하여 구체적인 빅데이터 분석 내용을 목록으로 만듭니다. 2. 데이터 수집 : 좀 더 자세한 분석을 위해 다른 개인, 기업, 공공기관 등이 보유한 데이터를 수집하기 위해 협의합니다. 3. 데이터 분석 : 통계와 데이터 분석 프로그램, 검색 엔진(네이버, 구글 등)을 활용하여 데이터를 분석합니다. 4. 분석 보고서 작성 : 빅데이터 분석이 완료되면 다른 사람들이 결과를 쉽게 이해할 수 있도록 시각화하여 보고서를 작성합니다. |