5주차 수업
5주차 수업에서는 4주차에서 자주 사용했던 기법들과 함수들을 다시 이용하여 4주차와 다른 종류의 데이터들을 분석하는 실습을 진행하였다. 4주차에서는 아직 데이터 기준을 나누는 방식이나 이를 위해 사용하는 함수를 배우는 것이 주였지만 5주차에서는 이것에 모두 익숙하다는 가정에서 여러 기준점을 세우고 데이터를 빠르게 분석해 나갔기 때문에 속도감이 있었다고 생각했다.
4주차에서 주로 사용했던 groupby(), pivot() 함수 등을 이용하여 각기 다른 종류의 데이터들을 특정 기준으로 분류하고 그래프를 그려 분석하였고, 최종적으로 데이터로부터 insight를 도출하는 과정을 거쳤다.
5주차에서는 이러한 실습과 더불어 강사의 도움없이 제공된 Starbucks_Customer_Data를 이용하여 직접 데이터를 분석하는 프로젝트도 같이 진행했다. 파일 read와 결측치 확인 및 데이터 전처리를 하는 것부터, column을 나누어 각 column에 대한 그래프를 그린 후, 이에 대한 insight를 도출하는 것까지 스스로 끝까지 마무리 하는 것이 프로젝트의 목표이다. 나는 개인적으로 더 예쁘게 데이터 분석을 하고 싶은 욕심이 있어서 수업 외에서 구글링하면서 배운 내용도 같이 활용해서 프로젝트를 마무리했다.
끝으로
5주간의 데이터 분석 과정이 처음에는 마냥 길게만 느껴졌는데, 하다보니까 재미도 붙고 실력도 늘어서 생각보다 5주가 빠르게 지나갔다.
총평을 하자면 아주 기초부터 어느정도 토대를 마련할 수 있는 수준의 강의였다고 생각한다. 아주 어려운 파이썬 문법을 사용하지 않았기 때문에 초심자들도 쉽게 따라올 수 있는 교육이었다. 특히나 수학과 관련된 부분은 거의 제외되었기 때문에 내가 진짜 수학에 자신이 없는 수포자다! 라고 할지라도 이 교육은 쉽게 따라갈 수 있을 거라고 생각한다.
그래도 모든 수업에 빠르게 적응하고, 강의마다 일시정지 없이 바로바로 이해를 하고 싶다면 어느정도 파이썬 기초 정도는 배워와서 복습겸 진행하는 것도 좋을 것 같다. python 기초 문법, pandas, numpy 라이브러리 정도만 기초 수준으로 배워두고 시작하면 되겠다.
만약 현업에서 파이썬 기반 데이터 분석 프로젝트를 진행하고 싶거나, 대학에서 프로젝트를 진행할 때 실험 데이터나 오차를 깔끔하게 분석하고 그래프로 표현하는 법을 배우고 싶다면 이 수업을 들어보는 것을 추천한다.