[Kaggle] 아마존 리뷰 분석 #02(EDA, 감정분석)
🗂️ 데이터셋.https://www.kaggle.com/datasets/tarkkaanko/amazon 1. 시각화 리뷰 평점 시각화contraints로 pie chart 색상 구분5.0점대 평점 비율이 79.8%로 가장 높음# 리뷰 평점 확인constraints = ['#4682B4', '#FF6347', '#32CD32', '#FFD700', '#8A2BE2']def categorical_variable_summary(df, column_name): plt.figure(figsize=(10, 5)) # Countplot plt.subplot(1, 2, 1) df[column_name].value_counts().plot(kind='bar', color='skyblue') ..
2024. 6. 23.
[Kaggle] 주택 가격 예측 EDA #2(시각화)
1. 데이터의 자료 유형 변수 : 값이 변하는 모든 데이터 ex)키, 체중, 온도상수 : 값이 달라지지 않는 것 ex)파이(=3.14) 독립변수 : 원인이 되는 것 = 설명변수종속변수 : 결과가 되는 것 = 결과(반응)변수 질적변수 : 수치로 나타낼 수 없는 변수 ex)성별, 혈액형, 학교, 지역 등양적변수 : 수치로 나타낼 수 있는 변수 ex)체중, 키, 온도 2. 날짜 데이터 처리(연도 관련)# 연도 데이터 탐색 year_fea = [fea for fea in numeric_features if 'Yr' in fea or 'Year' in fea] // Yr, Year관련 데이터 추출print(year_fea)# return : ['YearBuilt', 'YearRemodAdd', 'Garag..
2023. 12. 29.