분류(Classification)
분류에 쓰이는 머신러닝 알고리즘
베이즈통계와 생성 모델에 기반한 나이브 베이즈 (Naive Bayes)
독립변수와 종속변수의 선형 관계성에 기반한 로지스틱 회귀 (Logistic Regression)
데이터 균일도에 따른 규칙 기반의 결정 트리 (Decision Tree)
개별 클래스 간의 최대 분류 마진을 효과적으로 찾아주는 서포트 벡터 머신(Support Vector Machine)
근접 거리를 기준으로 하는 최소 근접 (Nearest Neighbor) 알고리즘
심층 연결 기반의 신경망 (Neural Network)
서로 다른(또는 같은) 머신러닝 알고리즘을 결합한 앙상블 (Ensem...
딥러닝 기초 및 주요 개념
신경망이란?
Perceptron
Perception(인지) + Neuron(신경망)의 합성어로, 다수의 신호를 받아 하나의 신호로 출력하는 것을 의미한다.
생물이 뭔가를 인지하기 위해선 그 생물 내부의 신경망이 다수의 정보를 입력받아 하나의 인지결과를 도출해야 하기 때문에 인공지능 분야에서는 이 중간 과정을 Perceptron으로 부른다.
Perceptron 입출력 도식화
Multi-layer-perceptron (신경망)
여러개의 Perceptron을 동시에 이어서 비선형적 결과를 도출 가능하게 한 구조를 의미한다.
MLP가 곧 신경망이다.
Inductive Bias
Transfor...
Self-Supervised
비지도 학습에 속하는 개념이다. 즉 레이블이 존재하지 않는다.
처음에는 레이블이 존재하지 않는다는것의 의미를 잘 이해하지 못해 아래와 같이 생각하였다.
self-supervised를 적용해서 아래 그림과 같이 데이터가 나눠진다고 할 때 각 부분이 어디 번호인지 맞추는것이 하나의 예시라고 함
나는 이 번호도 레이블이라고 생각이 들어 self-supervised는 레이블이 없다는 점을 이해하지 못했다. 결론부터 얘기하자면 저 이미지가 고양이인지, 곰 인지, 혹은 특정 사물인지 분류해주는 전문가가 없어도 세상에 존재하는 수많은 데이터에 대해 위 그림과 같은 patch 작업 및 어디 번호인...
영상처리 이론
주파수
영상처리를 공부하면서 이미지에 대한 고주파, 저주파를 말씀하시는게 이해가 되지 않았다. 링크글이 도움이 되었다.
결론을 얘기해보자면 이미지에서의 Edge는 High frequency 영역이다..!
Edge Detection
First-order derivative, Second-order derivate를 통한 엣지 검출 가능
First-order derivative (일차미분)
\({\partial f \over \partial x} = f(x+1) - f(x)\)
픽셀당 좌표 한칸씩 움직이는 것이니 분모가 1임
...
대표 딥러닝 모델 정리
순환 신경망 (RNN)
MIT 강의영상 및 정리
Illustrated Guide to LSTM’s and GRU’s: A step by step explanation
[Lecture 10
Recurrent Neural Networks](https://www.youtube.com/watch?v=6niqTuYFZLQ&t=3759s)
RNN
시퀀스 길이에 관계없이 인풋, 아웃풋을 받아드릴 수 있는 네트워크 구조여서 매우 유연함
RNN 그림
가중치 매개변수 행렬은 위 그림에서 확인할 수 있듯 3개
...
군집화
k-means 알고리즘 작동 그림
K-Means를 이용한 붓꽃(Iris) 데이터 셋 Clustering
from sklearn.preprocessing import scale
from sklearn.datasets import load_iris
from sklearn.cluster import KMeans
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
%matplotlib inline
iris = load_iris()
# 보다 편리한 데이터 Handling을 위해 DataFrame으로 변환
irisDF = pd.DataFrame...
회귀(Regression)
개념
최적의 회귀계수를 찾는 것
독립변수 개수
회귀 계수의 결합
1개: 단일회귀
선형: 선형 회귀
여러 개: 다중회귀
비선형: 비선형 회귀
분류와 회귀의 차이
지도학습은 두 가지 유형(분류, 회귀)
분류
예측값이 카테고리와 같은 이산형 클래스
회귀
예측값이 연속형 숫자 값
단순 선형회귀를 통해 이해해보기
단순 선형회귀는 독립변수 1개, 종속변수 1개인 선형 회귀
예로...
모델 성능 평가 개념
L1 Distance, L2 Distance
L1 Norm, L2 Norm1 의 개념을 알고 있어야 한다.
헷갈리지 말아야 할 점으로 $ L1 Norm != L1 Distance, L2 Norm != L2 Distance $ 라는 점이다.
Norm은 한 벡터의 크기 개념이고, Distance는 두 벡터의 거리 개념이다.
L1 Distace, L2 Distance의 수식은 다음과 같다.
\[L1 \ loss \ function = \sum^n_{i=1} \lvert y_{true} - y_{predicted} \rvert\]
L1 loss는 L2 loss에 비해 outlier의 영향력이 크지 않아 robu...