데이터 분석의 이해와 개발 환경
목차
- 들어가며
- 1-1. 데이터 분석이란 무엇인가?
- 1-2. 왜 파이썬을 선택해야 하는가?
- 1-3. 이 프로젝트의 목표와 기대 효과
- 파이썬 환경 설정 및 유용한 키
- 2-1. 파이썬 환경
- 2-2. 자주 사용하는 단축키
1-1. 데이터 분석이란 무엇인가?
데이터 분석은 데이터를 수집, 정리, 해석하여 의미 있는 정보를 추출하는 과정을 말합니다. 이를 통해 비즈니스 인사이트를 얻거나, 의사결정을 지원하거나, 특정 문제를 해결할 수 있습니다. 데이터 분석은 다양한 기술과 도구를 사용하며, 파이썬(Python)은 그 중에서도 강력하고 유연한 도구로 널리 사용됩니다.
1-2. 왜 파이썬을 선택해야 하는가?
데이터 분석, 데이터 사이언스하면 떠오르는 두 언어가 있습니다. 바로 R과 Python인데요. 두 언어에 대해 간단히 소개하겠습니다.
우선 R은 통계와 시각화를 위해 만들어진 언어로 데이터 분석이나 시각화를 할 수 있는 툴이 많습니다. 하지만 통계와 시각화에 특화되어 다양한 프로그래밍을 하기에는 적합하지 않습니다.
반면 Python은 다양한 분야에서 사용할 수 있는 언어로 사용할 수 있는 범용성이 R 보다 넓습니다. 즉 데이터 분석은 Python으로 할 수 있는 웹 개발, 머신 러닝 등 여러가지 분야 중 하나인 셈입니다.
범용성면에서 그리고 접근성면에서 처음 데이터 분석을 접한다면 Python을 추천드립니다.
1-3. 이 프로젝트의 목표와 기대 효과
앞으로 데이터 분석에서 유용하게 쓰이는 Python 라이브러리들의 사용법을 다루고 실습해보는 시간을 가질 것입니다. Python에 익숙하신 분들은 수월하게 보실 수 있으실 겁니다. Python 문법을 잘 모르시더라도 대부분 모듈 메소드를 이용하기 때문에 차근차근 하다보면 익숙해지실 겁니다. 추후에 Python에 익숙해지면 R도 한 번 다뤄보겠습니다.
2-1. 파이썬 환경
데이터 분석을 위한 개발환경으로 주피터 노트북(Jupyter Notebook)환경을 추천드립니다. 주피터 노트북(Jupyter Notebook)은 오픈소스 웹 에플리케이션으로 R, 파이썬, 줄리아 등 다양한 프로그래밍 언어를 지원하며, 데이터 분석을 편리하게 할 수 있는 여러 툴을 제공하여 주로 데이터사이언스 분야에서 활용됩니다. 또한 주피터 노트북은 다음 장점을 가지고 있습니다.
Jupyter 노트북의 장점
- 인터랙티브 환경 : 코드를 한 줄씩 실행하며 결과를 바로 확인할 수 있어 디버깅과 데이터셋(Dataset) 확인이 수월합니다.
- 시각화 : matplotlib, seaborn 등 다양한 시각화 라이브러리와의 호환성이 뛰어나 그래프와 차트를 쉽게 그릴 수 있습니다.
- 문서화 : 코드와 설명, 결과를 함께 포함할 수 있어 문서화가 용이합니다. 마크다운을 사용해 풍부한 설명을 추가할 수 있습니다.
하지만 이번 프로젝트에서는 이와 유사한 구글 코랩(Google Colab)환경을 활용하려고 합니다.
Colab이란?
구글에서 제공한 클라우드 기반의 주피터 노트북 개발환경으로, 파이썬 설치없이 브라우저 내에서 파이썬 코드 작성 및 실행이 가능합니다. 구글 드라이브나 깃허브 연동이 가능하여 데이터를 불러와 바로 사용할 수 있습니다.
사용방법
구글 코랩 홈페이지(https://colab.research.google.com)접속 후 로그인 후 사용
2-2. 자주 사용하는 단축키
- Ctrl + Enter: 현재 셀 실행
- Shift + Enter: 현재 셀 실행 후 다음 셀로 이동
- Alt + Enter: 현재 셀 실행 후 새로운 셀 추가
실습을 할 때 개인적으로 가장 많이 쓰는 단축키 입니다.
이외에도 다음 단축키들이 있습니다.
- Ctrl + M + B: 아래에 셀 추가
- Ctrl + M + D: 셀 삭제
- Ctrl + M + Z: 삭제한 셀 복원
- Ctrl + M + X: 셀 잘라내기
- Ctrl + M + C: 셀 복사
- Ctrl + M + V: 셀 붙여넣기
번외
다음과 같이 셀과셀 사이 중간에 마우스커서를 위치시키면 새로운 셀 만들기 또는 새로운 텍스트 만들기를 할 수 있습니다.
다음 글부터 본격적인 데이터 분석을 진행해보도록 하겠습니다.