에임스 지방 주택 가격 예측
문제
미국 아이오와 주의 에임스(Ames) 지방의 주택 가격 정보를 알아보는 회귀 문제
성능 평가는 RMSLE(Root Mean Squared Log Error)로 진행됨
가격이 비싼 주택일수록 예측 결과 오류가 전체 오류에 미치는 비중이 커지므로 이를 상쇄하기 위해 오류 값을 로그 변환한 RMSLE로 사용함
데이터
데이터 사전 처리(Preprocessing)
import warnings
warnings.filterwarnings('ignore')
import pandas as pd
import numpy as np
import seaborn as sns
import...
클래스를 활용한 코드 리팩토링
클래스가 필요한 순간
dict 에 dict을 저장해야 구현 가능하다고 느끼는 순간 클래스로 나누는것이 필요하다
아래 예시를 통해 어떻게 그런 순간을 맞닥뜨리는지 보자
class SimpleGradebook:
def __init__(self):
self._grades = {}
def add_student(self, name):
self._grades[name] = []
def report_grade(self, name, score):
self._grades[name].append(score)
def average_grad...
객체지향 프로그래밍이란
학생들이 교실청소를 분업해서 진행해야 하는 상황 가정
진행해야 하는 작업은 총 3가지 (바닥쓸기, 창문닦이, 칠판닦이)
아래로 내려갈수록 점점 코드가 발전하는(체계화되는) 방식
절차지향 프로그래밍
학생 한명 한명에게 명령어를 직접 쳐서 바닥쓸기, 창문닦이, 칠판닦이를 시킴
같은 작업인데도 지정하는 학생이 달라질 때 마다 코드를 똑같이 다시 쳐야하기 때문에 중복이 심함
반복문으로 중복코드를 조금 없앰
학생을 인자로 받을 수 있는 함수에 2에서 활용한 반복문까지 써서 중복 코드 줄임
여전히 중복이 많음
여기 3번까지가 절차지향 프로그래밍 ...
회귀(Regression)
개념
최적의 회귀계수를 찾는 것
독립변수 개수
회귀 계수의 결합
1개: 단일회귀
선형: 선형 회귀
여러 개: 다중회귀
비선형: 비선형 회귀
분류와 회귀의 차이
지도학습은 두 가지 유형(분류, 회귀)
분류
예측값이 카테고리와 같은 이산형 클래스
회귀
예측값이 연속형 숫자 값
단순 선형회귀를 통해 이해해보기
단순 선형회귀는 독립변수 1개, 종속변수 1개인 선형 회귀
예로...
123 post articles, 25 pages.