데이터팩토리

  • 홈
  • 태그
  • 방명록

IQR 1

[Python]데이터 전처리 - 데이터 정제(2) 이상치 확인하기

이번 포스팅에서는 이상치의 정의와 이상치를 확인하는 방법을 위주로 알아보겠습니다. 그리고 확인과정에서 필요한 seaborn 패키지의 박스플롯을 그리고, 박스플롯의 통계적 의미에 대해서도 소개하겠습니다.실습준비colab 실행# 구글 드라이브 마운트from google.colab import drivedrive.mount('/content/drive')# 판다스 라이브러리import pandas as pdfinalterm = pd.read_csv('finalterm.csv') # 파일경로finalterm이상치(Outlier)이상치(Outlier)는 데이터 분석에서 일반적인 패턴에서 크게 벗어난 값이나 관측치를 의미합니다. 쉽게 말해 다른 데이터들과 동떨어진 너무 크거나 너무 작은 값입니다. 이러한 값은 데이..

파이썬을 활용한 데이터 분석 입문 2024.08.10
이전
1
다음
더보기
프로필사진

데이터팩토리

데이터팩토리 입니다.

  • 분류 전체보기 (21)
    • 파이썬을 활용한 데이터 분석 입문 (17)

Tag

Nan, 불린 인덱싱, 메소드체이닝, sort_values, 이상치, seaborn, non-null, query, 데이터, 결측치, Pandas, 시리즈, 파이썬, LoC, 판다스, 데이터 전처리, 박스플롯, 정렬, value_counts, 사분위수, iloc, Python, ISNA, 데이터전처리, 인덱싱, IQR, 외부 데이터 불러오기, 데이터프레임,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/05   »
일 월 화 수 목 금 토
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바