데이터프레임에서 보통 iloc, loc를 사용하여 데이터를 선택합니다.
추가로 인덱싱과 슬라이싱을 사용하면 효과적입니다.
사용방법
데이터프레임.loc[행, 열]
iloc : 행번호(integer position)를 통해 값을 찾습니다.
loc : 문자(labeling)을 통해 값을 찾습니다.
예제파일
## 환경설정
import pandas as pd
import numpy as np
## 엑셀파일 불러오기
df = pd.read_excel('sample.xlsx')
df
인덱스는 삭제 가능하지만, 행번호는 고유의 값으로 삭제되지 않습니다.
loc
# 인덱싱을 이용한 행(row) 선택
df.loc[0]
# 슬라이싱을 이용한 행(row) 선택
df.loc[0:5]
# 인덱싱을 이용한 열(column) 선택
df.loc[:, ['거래일자']]
# loc은 라벨링을 통한 위치값을 가져온다. 슬라이싱(:)은 숫자를 위한 문법이다.
df.loc[:, ['거래일자':'거래금액']]
# loc 문법사용시, 반환할 열(column)을 적어준다.
df.loc[:, ['거래일자', '법정동', '전용면적', '아파트', '층', '거래금액']]
## 인덱싱을 통해 원하는 행, 열만 가져올 수도 있다.
df.loc[[1, 3, 1345], ['거래일자', '아파트', '거래금액']]
iloc
# 인덱싱을 이용한 행(row) 선택
df.iloc[0]
# 슬라이싱을 이용한 행(row) 선택
df.iloc[0:5]
# 인덱싱을 이용한 열(column) 선택
df.iloc[:, [0]]
# iloc은 integer position을 통한 위치값을 가져온다. 슬라이싱(:)은 숫자를 위한 문법이다.
df.iloc[:, 0:6]
## 인덱싱을 통해 원하는 행, 열만 가져올 수도 있다.
df.iloc[[1, 3, 5], [0, 3, 5]]
'Develop > Pandas' 카테고리의 다른 글
[Pandas] 결측치가 있는 행/열 쉽게 제거하는 방법 (dropna) (0) | 2022.09.21 |
---|---|
[Pandas] 'Groupby 함수' 꼭 알아야할 기본 사용법 (0) | 2022.06.19 |
[Pandas] 데이터프레임 옵션 설정하기 (화면, 컬럼 전부 보이게 하기) (0) | 2022.02.21 |
[Pandas] 텍스트형식의 날짜를 날짜형식으로 만들기 (0) | 2022.02.06 |
[Pandas] 데이터프레임을 엑셀 필터처럼 쓰는 법 (2편) (0) | 2021.12.18 |