본문으로 바로가기

차례

1. 사용방법

2. 예제

 

 


 

 

1. 사용방법

 

문법

DataFrame.dropna(axis, how, thresh, subset, inplace)

 

매개변수

① axis : {0 or ‘index’, 1 or ‘columns’}, default 0 

결측치제거 방향입니다. 

② how : {‘any’, ‘all’}, default ‘any’

 - any : 하나라도 결측치인 경우 제거합니다.
 - all   : 전부 결측치인 경우 제거합니다.

③ thresh : int, optional

삭제되지 않기 위해 요구되는 최소 Value 값입니다.
thresh=5 경우, axis 기준으로 value 값이 5개 이상 존재한다면 그 axis는 삭제되지 않습니다.
그러나 Value의 개수가 선언한 thresh에 미치지 못한다면 그 axis에 해당하는 행이나 열은 삭제됩니다.

④ subset : column label or sequence of labels, optional

고려할 다른 축의 레이블입니다. 예를 들어 행을 삭제하는 경우 포함할 열 목록이 됩니다.
DataFrame.dropna(axis=0, subset=['칼럼명1', '칼럼명4'])
DataFrame.dropna(axis=1, subset=[1, 2, 4])

⑤ inplace : bool, default False

자료대체여부. 덮어쓰고 싶은 경우 inplace=True

 

 

 

2. 예제

 

2020년 서울 아파트 거래자료

2020_seoul_apt_trading.csv
5.27MB

 

(1) 데이터프레임을 불러옵니다.

import pandas as pd
import numpy as np

df = pd.read_csv('2020_seoul_apt_trading.csv', encoding='cp949')
df

 

(2) 각 컬럼별 결측치를 확인합니다.

df.isnull()  #결측치 True(1), 데이터 False(0)
df.isnull().sum()

 

(3) '지번' 컬럼의 결측치가 궁금한 경우 다음과 같은 방법으로 확인할 수 있습니다.

df.loc[df['지번'].isna(), :]

 

(4) 데이터프레임의 누락 데이터를 제거합니다.

df.dropna(how='any', axis=0, inplace=True)

제거방법 'any', 제거방향 '0'(인덱스방향) = 누락데이터가 하나라도 포함된 행은 삭제됩니다.

inplace = True 이므로 덮어쓰기 됩니다.

 

(5) 데이터프레임의 결측치 제거가 되었는지 확인합니다.

df.isnull().sum()

 

 

 


 

 

dropna 함수 사용법, dropna subset pandas, dropna 파이썬, dropna 특정행, dropna axis, 데이터프레임 결측치 제거, 데이터프레임 특정행 결측치 제거, 데이터프레임 특정열 결측치 제거, Dropna 특정 열, Dropna=False, Dropna how='any, Pandas dropna, Dropna inplace=True, Pandas dropna row, 파이썬 dropna, Pandas dropna index, Dropna thresh, Dropna 특정 열, Dropna how='any, Dropna=False, Pandas dropna row, Pandas dropna index, Pandas dropna subset multiple columns, #dropna함수사용법 #dropnasubsetpandas #dropna파이썬 #dropna특정행 #dropnaaxis #데이터프레임결측치제거 #데이터프레임특정행결측치제거 #데이터프레임특정열결측치제거 #Dropna특정열 #Dropna=False #Dropnahow='any #Pandasdropna #Dropnainplace=True #Pandasdropnarow #파이썬dropna #Pandasdropnaindex #Dropnathresh #Dropna특정열 #Dropnahow='any #Dropna=False #Pandasdropnarow #Pandasdropnaindex #Pandasdropnasubsetmultiplecolumns