본문으로 바로가기

 

차례

1. 사용방법

2. 예제

 

 

 


 

 

 

파이썬이 제공하는 astype 함수 '데이터타입 변경' 기능이 있습니다.

각 함수마다 적용되는 데이터 타입에 맞추기 위해 사용합니다.

 

 

1. 사용방법

 

문법

dataframe.astype(dtype, copy, errors)

 

매개변수

① dtype : Requried

변경할 데이터 타입입니다. 딕셔너리 형태로 여러개의 칼럼의 데이터타입을 변경할 수 있습니다.
DataFrame.astype(
    {
    '이름':'object',
    '나이':'int64'
                 }
)

② copy, errors : 잘 사용하지 않으므로 생략하겠습니다.

 

개인적으로 저는 astype을 아래와 같은 방법으로 사용합니다.

데이터프레임['변경할칼럼'] = 데이터프레임['변경할칼럼'].astype('변경할 데이터타입')

 

 

 

2. 예제

 

2020년 서울 아파트 거래자료

2020_seoul_apt_trading.csv
5.27MB

 

(1) 데이터프레임을 불러옵니다.

import pandas as pd
import numpy as np

df = pd.read_csv('2020_seoul_apt_trading.csv', encoding='cp949')
df

 

(2) 데이터프레임의 정보를 확인합니다.

df.info()

거래금액은 object 타입입니다. 데이터분석을 용이하게 하기 위해 숫자형(int64)로 변형하겠습니다.

 

(3) astype 함수를 써서 int로 변형합니다.

df['거래금액'] = df['거래금액'].astype('int64')

공백과 콤마가 있는 데이터가 있어서 숫자로 변형되지 않습니다.

따라서 공백과 콤마를 제거하기 위해 strip함수 replace함수를 사용합니다.

 

(4) strip함수를 사용해서 공백을 제거합니다.

df['거래금액'] = df['거래금액'].str.strip()
df['거래금액'] = df['거래금액'].astype('int64')

공백이 제거됨을 확인할 수 있습니다.

 

(5) replace함수를 사용하여 콤마(,)를 제거한후 데이터타입을 변경합니다.

df['거래금액'] = df['거래금액'].str.replace(',', '')
df['거래금액'] = df['거래금액'].astype('int64')
df

콤마(,)도 제거되었고 데이터타입도 int64로 변경되었습니다.

 

 

 


 

 

 

파이썬 astype 여러개, 파이썬 dtype: object, 파이썬 object 타입 변환, 파이썬 astype int, Pandas astype, 파이썬 object 변환, Pandas dtype 변경, DataFrame dtype 변경, 판다스 데이터 타입 변경, 파이썬 데이터프레임 타입 확인, 파이썬 object float 변환, 판다스 데이터 타입 종류, 데이터프레임 전체 공백 제거, #파이썬astype여러개 #파이썬dtype:object #파이썬object타입변환 #파이썬astypeint #Pandasastype #파이썬object변환 #Pandasdtype변경 #DataFramedtype변경 #판다스데이터타입변경 #파이썬데이터프레임타입확인 #파이썬objectfloat변환 #판다스데이터타입종류 #데이터프레임전체공백제거