728x90
이전 내용은 아래에서 확인 하실 수 있습니다.
[기타 데이터] Starwars 케릭터 분석 1 (데이터 확인)
Starwars Character 분석 데이터 출처 : https://dplyr.tidyverse.org/reference/starwars.html < 질문 > - 스타워즈 캐릭터의 성별 비율 - 성별에 따른 캐릭터 신장의 분포 - 가장 무거운 캐릭..
sks8410.tistory.com
2. 데이터 전처리
2-1 결측치 처리
# 컬럼별 결측치 갯수 확인
sw.isnull().sum()
결측치가 있는 컬럼 중 height, mass 를 제외한 컬럼은 모두 케릭터 고유 특성이므로 그대로 두기로 하겠습니다.
# height, mass 결측치를 0으로 처리
sw["height"].fillna(0, inplace = True)
sw["mass"].fillna(0, inplace = True)
sw.isnull().sum()
# sex 컬럼의 유니크값 확인
sw["sex"].unique()
# 성별이 none, nan 인 값 확인
print(sw[sw["sex"] == "none"])
print(sw[sw["sex"].isnull()])
성별이 none 인 종족의 species 가 Droid(robot) 이므로 성별을 robot 으로 변경하도록 하겠습니다.
성별이 없는 케릭터는 종족도 없으므로 별도 처리를 하지 않고 그대로 두도록 하겠습니다.
# sex 컬럼의 none 값을 robot 으로 변경
sw["sex"][sw["sex"] == "none"] = "robot"
sw["sex"].unique()
728x90
'Data Analysis > 기타 데이터' 카테고리의 다른 글
[기타 데이터] LA Lakers 경기 데이터 분석 3 (EDA / 시각화 / 리뷰) (0) | 2021.10.12 |
---|---|
[기타 데이터] LA Lakers 경기 데이터 분석 2 (데이터 전처리) (0) | 2021.10.08 |
[기타 데이터] LA Lakers 경기 데이터 분석 1 (데이터 확인 / 질문) (0) | 2021.10.08 |
[기타 데이터] Starwars 케릭터 분석 3 (EDA / 시각화 / 리뷰) (0) | 2021.10.07 |
[기타 데이터] Starwars 케릭터 분석 1 (데이터 확인 / 질문) (0) | 2021.10.05 |