Home

에임스 지방 주택 가격 예측

문제 미국 아이오와 주의 에임스(Ames) 지방의 주택 가격 정보를 알아보는 회귀 문제 성능 평가는 RMSLE(Root Mean Squared Log Error)로 진행됨 가격이 비싼 주택일수록 예측 결과 오류가 전체 오류에 미치는 비중이 커지므로 이를 상쇄하기 위해 오류 값을 로그 변환한 RMSLE로 사용함 데이터 데이터 사전 처리(Preprocessing) import warnings warnings.filterwarnings('ignore') import pandas as pd import numpy as np import seaborn as sns import...

Read more

클래스를 활용한 코드 리팩토링

클래스가 필요한 순간 dict 에 dict을 저장해야 구현 가능하다고 느끼는 순간 클래스로 나누는것이 필요하다 아래 예시를 통해 어떻게 그런 순간을 맞닥뜨리는지 보자 class SimpleGradebook: def __init__(self): self._grades = {} def add_student(self, name): self._grades[name] = [] def report_grade(self, name, score): self._grades[name].append(score) def average_grad...

Read more

자전거 수요 예측

문제 자전거 대여 수요 예측 자전거를 대여하는 Count 값을 예측하는 Regression 문제 데이터 Bike Sharing Demand 답안 코드 보기 전 내가 먼저 접근해보기 접근 목표 선형 회귀, 트리 기반 회귀 성능 비교 pipeline을 통해 표준정규분포화, linearRegression 학습까지 동시에 진행 점수 산출은 rmse로! 주의해야 할 점은 rmse로 할 때 cross_val_score는 neg를 꼭 붙여줘야함 접근하면서 의문점 ...

Read more

객체지향 프로그래밍이란

학생들이 교실청소를 분업해서 진행해야 하는 상황 가정 진행해야 하는 작업은 총 3가지 (바닥쓸기, 창문닦이, 칠판닦이) 아래로 내려갈수록 점점 코드가 발전하는(체계화되는) 방식 절차지향 프로그래밍 학생 한명 한명에게 명령어를 직접 쳐서 바닥쓸기, 창문닦이, 칠판닦이를 시킴 같은 작업인데도 지정하는 학생이 달라질 때 마다 코드를 똑같이 다시 쳐야하기 때문에 중복이 심함 반복문으로 중복코드를 조금 없앰 학생을 인자로 받을 수 있는 함수에 2에서 활용한 반복문까지 써서 중복 코드 줄임 여전히 중복이 많음 여기 3번까지가 절차지향 프로그래밍 ...

Read more

회귀(Regression)

개념 최적의 회귀계수를 찾는 것 독립변수 개수 회귀 계수의 결합 1개: 단일회귀 선형: 선형 회귀 여러 개: 다중회귀 비선형: 비선형 회귀 분류와 회귀의 차이 지도학습은 두 가지 유형(분류, 회귀) 분류 예측값이 카테고리와 같은 이산형 클래스 회귀 예측값이 연속형 숫자 값 단순 선형회귀를 통해 이해해보기 단순 선형회귀는 독립변수 1개, 종속변수 1개인 선형 회귀 예로...

Read more