본문 바로가기

Data Analysis/기타 데이터

[기타 데이터] LA Lakers 경기 데이터 분석 2 (데이터 전처리)

728x90

이전 내용은 아래 글에서 확인 부탁 드리겠습니다.

 

 

[기타 데이터] LA Lakers 경기 데이터 분석 1 (데이터 확인 / 질문)

LA Lakers 경기 데이터 분석 데이터 출처 :  http://www.basketballgeek.com/data/  1. 데이터 확인 # 기본 패키지 불러오기 import math import numpy as np import pandas as pd import matplotlib.pyplot as..

sks8410.tistory.com

3. 데이터 전처리

3-1 datetime 컬럼 생성

# date 컬럼과 time 컬럼 합치기

lakers["date"] = lakers["date"].apply(str) # date 컬럼을 object 타입으로 변경
lakers["datetime"] = lakers["date"] + " " + lakers["time"] # date 컬럼과 time 컬럼 합치기
lakers.head()

 

 

# date 컬럼과 datetime 컬럼을 날짜 타입으로 변경

lakers["datetime"] = pd.to_datetime(lakers["datetime"], format = "%Y%m%d %H:%M:%S")
lakers["date"] = pd.to_datetime(lakers["date"])

print(lakers.info())
lakers.head()

3-2 결측치 처리

# 결측치가 존재하는 컬럼 확인

lakers.isnull().any(axis = 0)

- player, result, type 컬럼은 object 값이 있으므로 결측치를 처리하지 않고 그대로 두도록 하겠습니다.

- x, y 컬럼은 결측치를 0 으로 처리하도록 하겠습니다.

 

 

# x, y 컬럼의 결측치를 0으로 처리

lakers["x"].fillna(0, inplace = True)
lakers["y"].fillna(0, inplace = True)

print(lakers["x"].isnull().sum())
print(lakers["y"].isnull().sum())

lakers.head()

 

728x90