본문으로 바로가기

 

 


 

 

데이터프레임에서 특정 조건을 만족하는 인덱스(행), 칼럼(열)을 삭제하는 방법이다.

 

예제파일 받기

IPO_list.xlsx
0.02MB

 

# 환경구축

import pandas as pd
import numpy as np
import re
# IPO_list 파일열기
# 출처 = http://www.38.co.kr/html/fund/index.htm?o=nw&page=1

ipo2021_df = pd.read_excel('IPO_list.xlsx', sheet_name='2021')
ipo2021_df

 

# 데이터프레임 정보 먗 결측치 조회

print(ipo2021_df.info(), ipo2021_df.isna().sum())

 

 

칼럼(열) 삭제

# 데이터분석에 필요없다고 생각되는 칼럼(열) 삭제
# 데이터프레임명.drop(['칼럼명'], axis=1, inplace)  
# axis = 1 (열 선택)
# inplace = True / False (덮어쓰기 여부)

ipo2021_df.drop(['전일비(%)'], axis=1, inplace=True)
ipo2021_df

 

 

인덱스(행) 삭제

# 2021년 신규 상장된 종목중 인수합병을 위한 '스팩' 관련주 조회 및 삭제
# 조건 : ipo2021_df 데이터프레임 '기업명'칼럼에 '스팩'이 포함된 행(종목) 삭제
# 조건문 = 데이터프레임명[데이터프레임명['칼럼명'].str.contains('포함된문자')].index 
# 데이트프레임명.drop(조건문, inplace=True)

spac = ipo2021_df[ipo2021_df['기업명'].str.contains('스팩')].index
ipo2021_df.drop(spac, inplace=True)
ipo2021_df

 

(변경전)

 

(변경후)

 

 

인덱스 재정렬

ipo2021_df.reset_index(drop=True, inplace=True)
ipo2021_df