본문 바로가기

Data Analysis/기타 데이터

[기타 데이터] LA Lakers 경기 데이터 분석 1 (데이터 확인 / 질문)

728x90

LA Lakers 경기 데이터 분석

데이터 출처 :  http://www.basketballgeek.com/data/  

1. 데이터 확인

# 기본 패키지 불러오기

import math
import numpy as np
import pandas as pd

import matplotlib.pyplot as plt
plt.rc("font", family = "AppleGothic") # 한글 폰트 가져오기

import seaborn as sns
plt.style.use("seaborn") 
sns.set(font_scale = 1)
sns.set_style("whitegrid")

import plotly.express as px

import chart_studio.plotly as py
import cufflinks as cf
cf.go_offline(connected=True)

import plotly.graph_objects as go
import plotly.offline as pyo
pyo.init_notebook_mode()

from plotly.subplots import make_subplots

import missingno as msno

import warnings # 경고 메세지 숨기기
warnings.filterwarnings(action='ignore')

 

# 데이터 불러오기

lakers = pd.read_csv("data/lakers.csv")

print(lakers.shape)
lakers.head()

 

<컬럼 설명>
- Date: 경기 일자  
- Opponent: 대전 팀  
- Game type: 홈경기 vs. 원정경기  
- Time: 분 : 초  
- Period: 쿼터(한 쿼터당 12분 씩, 동점일 경우 5 쿼터 진행)
- Etype: 유형(ejection / foul / free throw / jump ball / rebound / shot / sub / timeout / turnover / violation / 퇴장 / 파울 / 자유투/ 점프볼/ 리바운드/ 슛/ 패스 / 타임아웃/ 턴오버/ 반칙)
- Team: 팀 구분(LAL: LA Lakers, 상대팀)  
- Player: 선수명  
- Result: 결과  
- Points: 점수  
- Type: 세부행동  
- X, Y: 상대편 팀 골대 뒤에서 바라본 X, Y 좌표. 골대의 위치는 (25, 5.25)이다.

 

 

# 데이터 기본 정보 확인

lakers.info()

- date 와 time 컬럼이 날짜 타입이 아닌 int 와 object 타입으로 되어 있습니다.

- 전처리 시 datetime 타입으로 변경 해주도록 하겠습니다.

 

 

# 연속형 데이터의 통계치 확인

lakers.describe()

 

 

# 범주형 데이터의 통계치 확인

lakers.describe(include = np.object_)

 

 

# 결측치 확인

lakers.isnull().sum()

 

 

# 결측치 시각화

msno.bar(lakers)

- x, y 컬럼의 결측치가 상당히 많으며 result 컬럼의 결측치도 많이 보입니다.

 

 

# 데이터 내용 간단히 출력하기

print("총 데이터 개수: ", lakers.shape[0] * lakers.shape[1])
print("총 결측치 수: {} = 전체 데이터의 {:.2f}%".format(lakers.isnull().sum().sum(),
                                            (lakers.isnull().sum().sum()*100) / (lakers.shape[0] * lakers.shape[1])))
print("LA 레이커스와 경기한 팀 수: ", lakers["opponent"].nunique())
print("경기에 등장하는 행동 수: ", lakers["etype"].nunique())
print("경기에 등장하는 세부행동 수: ", lakers["type"].nunique())

2. 질문

- LA레이커스의 홈 경기 vs. 원정경기 비율은?
- 경기에서 선수들이 가장 많이 하는 행동유형(etype)은?
- 이번 시즌에서 LA레이커스의 경기 결과는?
- LA레이커스 선수들은 코트의 어느 위치에서 어떤 동작을 했는가?

728x90