데이터프레임에서 특정 조건을 만족하는 인덱스(행), 칼럼(열)을 삭제하는 방법이다.
예제파일 받기
# 환경구축
import pandas as pd
import numpy as np
import re
# IPO_list 파일열기
# 출처 = http://www.38.co.kr/html/fund/index.htm?o=nw&page=1
ipo2021_df = pd.read_excel('IPO_list.xlsx', sheet_name='2021')
ipo2021_df
# 데이터프레임 정보 먗 결측치 조회
print(ipo2021_df.info(), ipo2021_df.isna().sum())
칼럼(열) 삭제
# 데이터분석에 필요없다고 생각되는 칼럼(열) 삭제
# 데이터프레임명.drop(['칼럼명'], axis=1, inplace)
# axis = 1 (열 선택)
# inplace = True / False (덮어쓰기 여부)
ipo2021_df.drop(['전일비(%)'], axis=1, inplace=True)
ipo2021_df
인덱스(행) 삭제
# 2021년 신규 상장된 종목중 인수합병을 위한 '스팩' 관련주 조회 및 삭제
# 조건 : ipo2021_df 데이터프레임 '기업명'칼럼에 '스팩'이 포함된 행(종목) 삭제
# 조건문 = 데이터프레임명[데이터프레임명['칼럼명'].str.contains('포함된문자')].index
# 데이트프레임명.drop(조건문, inplace=True)
spac = ipo2021_df[ipo2021_df['기업명'].str.contains('스팩')].index
ipo2021_df.drop(spac, inplace=True)
ipo2021_df
(변경전)
(변경후)
인덱스 재정렬
ipo2021_df.reset_index(drop=True, inplace=True)
ipo2021_df
'Develop > Pandas' 카테고리의 다른 글
[Pandas] 텍스트형식의 날짜를 날짜형식으로 만들기 (0) | 2022.02.06 |
---|---|
[Pandas] 데이터프레임을 엑셀 필터처럼 쓰는 법 (2편) (0) | 2021.12.18 |
[Pandas] 데이터프레임을 엑셀 필터처럼 쓰는 법 (1편) (0) | 2021.11.12 |
[Pandas] 날짜 데이터프레임 업데이트 자동화 (0) | 2021.11.11 |
[Pandas] 데이터프레임 열을 Datetime으로 변환하기 (0) | 2021.11.10 |