본문 바로가기

Data Analysis/기타 데이터

[기타 데이터] Starwars 케릭터 분석 2 (데이터 전처리)

728x90

이전 내용은 아래에서 확인 하실 수 있습니다.

 

 

 

[기타 데이터] Starwars 케릭터 분석 1 (데이터 확인)

Starwars Character 분석 데이터 출처 : https://dplyr.tidyverse.org/reference/starwars.html < 질문 > - 스타워즈 캐릭터의 성별 비율 - 성별에 따른 캐릭터 신장의 분포 - 가장 무거운 캐릭..

sks8410.tistory.com

2. 데이터 전처리

2-1 결측치 처리

 

# 컬럼별 결측치 갯수 확인 

sw.isnull().sum()

 

결측치가 있는 컬럼 중 height, mass 를 제외한 컬럼은 모두 케릭터 고유 특성이므로 그대로 두기로 하겠습니다.

 

# height, mass 결측치를 0으로 처리

sw["height"].fillna(0, inplace = True)
sw["mass"].fillna(0, inplace = True)

sw.isnull().sum()

 

 

# sex 컬럼의 유니크값 확인

sw["sex"].unique()

 

 

# 성별이 none, nan 인 값 확인

print(sw[sw["sex"] == "none"])
print(sw[sw["sex"].isnull()])

 

성별이 none 인 종족의 species 가 Droid(robot) 이므로 성별을 robot 으로 변경하도록 하겠습니다.

성별이 없는 케릭터는 종족도 없으므로 별도 처리를 하지 않고 그대로 두도록 하겠습니다.

 

# sex 컬럼의 none 값을 robot 으로 변경

sw["sex"][sw["sex"] == "none"] = "robot"

sw["sex"].unique()

 

728x90