LA Lakers 경기 데이터 분석
데이터 출처 : http://www.basketballgeek.com/data/
1. 데이터 확인
# 기본 패키지 불러오기
import math
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
plt.rc("font", family = "AppleGothic") # 한글 폰트 가져오기
import seaborn as sns
plt.style.use("seaborn")
sns.set(font_scale = 1)
sns.set_style("whitegrid")
import plotly.express as px
import chart_studio.plotly as py
import cufflinks as cf
cf.go_offline(connected=True)
import plotly.graph_objects as go
import plotly.offline as pyo
pyo.init_notebook_mode()
from plotly.subplots import make_subplots
import missingno as msno
import warnings # 경고 메세지 숨기기
warnings.filterwarnings(action='ignore')
# 데이터 불러오기
lakers = pd.read_csv("data/lakers.csv")
print(lakers.shape)
lakers.head()
<컬럼 설명>
- Date: 경기 일자
- Opponent: 대전 팀
- Game type: 홈경기 vs. 원정경기
- Time: 분 : 초
- Period: 쿼터(한 쿼터당 12분 씩, 동점일 경우 5 쿼터 진행)
- Etype: 유형(ejection / foul / free throw / jump ball / rebound / shot / sub / timeout / turnover / violation / 퇴장 / 파울 / 자유투/ 점프볼/ 리바운드/ 슛/ 패스 / 타임아웃/ 턴오버/ 반칙)
- Team: 팀 구분(LAL: LA Lakers, 상대팀)
- Player: 선수명
- Result: 결과
- Points: 점수
- Type: 세부행동
- X, Y: 상대편 팀 골대 뒤에서 바라본 X, Y 좌표. 골대의 위치는 (25, 5.25)이다.
# 데이터 기본 정보 확인
lakers.info()
- date 와 time 컬럼이 날짜 타입이 아닌 int 와 object 타입으로 되어 있습니다.
- 전처리 시 datetime 타입으로 변경 해주도록 하겠습니다.
# 연속형 데이터의 통계치 확인
lakers.describe()
# 범주형 데이터의 통계치 확인
lakers.describe(include = np.object_)
# 결측치 확인
lakers.isnull().sum()
# 결측치 시각화
msno.bar(lakers)
- x, y 컬럼의 결측치가 상당히 많으며 result 컬럼의 결측치도 많이 보입니다.
# 데이터 내용 간단히 출력하기
print("총 데이터 개수: ", lakers.shape[0] * lakers.shape[1])
print("총 결측치 수: {} = 전체 데이터의 {:.2f}%".format(lakers.isnull().sum().sum(),
(lakers.isnull().sum().sum()*100) / (lakers.shape[0] * lakers.shape[1])))
print("LA 레이커스와 경기한 팀 수: ", lakers["opponent"].nunique())
print("경기에 등장하는 행동 수: ", lakers["etype"].nunique())
print("경기에 등장하는 세부행동 수: ", lakers["type"].nunique())
2. 질문
- LA레이커스의 홈 경기 vs. 원정경기 비율은?
- 경기에서 선수들이 가장 많이 하는 행동유형(etype)은?
- 이번 시즌에서 LA레이커스의 경기 결과는?
- LA레이커스 선수들은 코트의 어느 위치에서 어떤 동작을 했는가?
'Data Analysis > 기타 데이터' 카테고리의 다른 글
[기타 데이터] LA Lakers 경기 데이터 분석 3 (EDA / 시각화 / 리뷰) (0) | 2021.10.12 |
---|---|
[기타 데이터] LA Lakers 경기 데이터 분석 2 (데이터 전처리) (0) | 2021.10.08 |
[기타 데이터] Starwars 케릭터 분석 3 (EDA / 시각화 / 리뷰) (0) | 2021.10.07 |
[기타 데이터] Starwars 케릭터 분석 2 (데이터 전처리) (0) | 2021.10.07 |
[기타 데이터] Starwars 케릭터 분석 1 (데이터 확인 / 질문) (0) | 2021.10.05 |