데이터분석 3

[통계기반 데이터 활용] Python ML 회귀 🚴‍♀️ (Kaggle 공공자전거 수요 예측)

작업 준비# 라이브러리 임포트import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as snsplt.style.use('ggplot')# 한글폰트 설정import matplotlib as mplmpl.rc('font', family='AppleGothic')mpl.rcParams['axes.unicode_minus'] = False 맥OS 에는 맑은 고딕이 없어서 AppleGothic 으로 대체했다. 데이터 불러오기**pd.read_csv(csv파일 경로, parse_dates=[datetime형식으로 불러올 컬럼])**https://www.kaggle.com/competitions/bike-sharing-de..

실습 2025.01.23

[통계기반 데이터 활용] Azure ML 회귀트리 🌲 (자동차 가격 예측 모델)

import pandas as pd def azureml_main(dataframe1 = None, dataframe2 = None): new_cols = pd.DataFrame( columns=["Algorithm"], data=[ ["Boostd DT Regression"], ["Decision Forest Regression"], ["Linear Regression"] ] ) result = pd.concat([new_cols, dataframe1], axis=1) return result,Lab : 트리기반 알고리즘을 이용한 자동차 가격 예측 모델 구현 오늘 실습에서 사용할 알고리즘은 D..

실습 2025.01.21

[통계기반 데이터 활용] 머신 러닝을 위한 통계 이론 훑어보기 (1)

개요통계 기본 개념기술 통계확률과 분포추정과 가설 검정상관분석  사람들은 정확한 '사실'을 인지하지 못하는 오류를 범한다. 우리가 세상을 똑바로 바라보지 못하는 이유는 "간극본능"과 "부정본능" 등 10가지 비합리적 본능 때문이라고 한다. 이 책은 그 사실을 객관적인 데이터를 바탕으로 세상이 생각보다 괜찮은 곳이라는, 그리고 앞으로 나아가고 있다는 사실을 보여준다. 우리가 통계를 공부해야 하는 이유가 여기에 있다.  통계...공부할수록 멀어지는 느낌이지만 렛츠고.머신러닝 개요 📊 구분프로그램 기반 (기존 프로그래밍) 💻데이터 기반 (머신러닝) 📈작동 원리사람이 명시적인 프로그램을 지시데이터를 통해 규칙을 학습주요 특징명령을 수행하고 결과를 산출데이터에서 규칙을 학습하여 새로운 데이터에 대한 결과를 ..

이론 2025.01.16