인공지능

분류(Classification)

분류에 쓰이는 머신러닝 알고리즘 베이즈통계와 생성 모델에 기반한 나이브 베이즈 (Naive Bayes) 독립변수와 종속변수의 선형 관계성에 기반한 로지스틱 회귀 (Logistic Regression) 데이터 균일도에 따른 규칙 기반의 결정 트리 (Decision Tree) 개별 클래스 간의 최대 분류 마진을 효과적으로 찾아주는 서포트 벡터 머신(Support Vector Machine) 근접 거리를 기준으로 하는 최소 근접 (Nearest Neighbor) 알고리즘 심층 연결 기반의 신경망 (Neural Network) 서로 다른(또는 같은) 머신러닝 알고리즘을 결합한 앙상블 (Ensem...

Read more

딥러닝 기초 및 주요 개념

신경망이란? Perceptron Perception(인지) + Neuron(신경망)의 합성어로, 다수의 신호를 받아 하나의 신호로 출력하는 것을 의미한다. 생물이 뭔가를 인지하기 위해선 그 생물 내부의 신경망이 다수의 정보를 입력받아 하나의 인지결과를 도출해야 하기 때문에 인공지능 분야에서는 이 중간 과정을 Perceptron으로 부른다. Perceptron 입출력 도식화 Multi-layer-perceptron (신경망) 여러개의 Perceptron을 동시에 이어서 비선형적 결과를 도출 가능하게 한 구조를 의미한다. MLP가 곧 신경망이다. Inductive Bias Transfor...

Read more

Self-Supervised

비지도 학습에 속하는 개념이다. 즉 레이블이 존재하지 않는다. 처음에는 레이블이 존재하지 않는다는것의 의미를 잘 이해하지 못해 아래와 같이 생각하였다. self-supervised를 적용해서 아래 그림과 같이 데이터가 나눠진다고 할 때 각 부분이 어디 번호인지 맞추는것이 하나의 예시라고 함 나는 이 번호도 레이블이라고 생각이 들어 self-supervised는 레이블이 없다는 점을 이해하지 못했다. 결론부터 얘기하자면 저 이미지가 고양이인지, 곰 인지, 혹은 특정 사물인지 분류해주는 전문가가 없어도 세상에 존재하는 수많은 데이터에 대해 위 그림과 같은 patch 작업 및 어디 번호인...

Read more

영상처리 이론

주파수 영상처리를 공부하면서 이미지에 대한 고주파, 저주파를 말씀하시는게 이해가 되지 않았다. 링크글이 도움이 되었다. 결론을 얘기해보자면 이미지에서의 Edge는 High frequency 영역이다..! Edge Detection First-order derivative, Second-order derivate를 통한 엣지 검출 가능 First-order derivative (일차미분) \({\partial f \over \partial x} = f(x+1) - f(x)\) 픽셀당 좌표 한칸씩 움직이는 것이니 분모가 1임 ...

Read more

이미지 필터링

이미지 필터링 Smoothing to Remove Image Noise 이미지의 노이즈를 줄이기 위한 필터가 여러개 존재한다 Box Filter Linear filter 노이즈를 제거하는 가장 간단한 방법 중 하나이며 아이디어는 필터 중간 픽셀값의 이웃 픽셀들의 평균값으로 필터 중간 픽셀값을 대체하는 것이다 3x3 box filter 예시 코드 구현부 def getBoxFilter(self, filter_length=3): # 필터의 모양은 정사각형이라고 간주하며 Normalization을 위해...

Read more

자연어 기초

NLP와 텍스트 분석의 차이 NLP 텍스트 분석을 향상하게 하는 기반 기술 기계 번역, 자동으로 질문을 해석하고 답해주는 자동 응답 시스템 등 텍스트 분석 텍스트 마이닝이라고도 불림 비정형 텍스트에서 의미있는 정보를 추출하는 것 크게 4개의 기술영역 존재 텍스트 분류 감성 분석 텍스트 요약 텍스트 군집화와 유사도 측정 데이터 전처리 숫자형 데이터는 그 자체로 의미있는 값이 되는 경우가...

Read more

대표 딥러닝 모델 정리

순환 신경망 (RNN) MIT 강의영상 및 정리 Illustrated Guide to LSTM’s and GRU’s: A step by step explanation [Lecture 10 Recurrent Neural Networks](https://www.youtube.com/watch?v=6niqTuYFZLQ&t=3759s) RNN 시퀀스 길이에 관계없이 인풋, 아웃풋을 받아드릴 수 있는 네트워크 구조여서 매우 유연함 RNN 그림 가중치 매개변수 행렬은 위 그림에서 확인할 수 있듯 3개 ...

Read more

군집화

k-means 알고리즘 작동 그림 K-Means를 이용한 붓꽃(Iris) 데이터 셋 Clustering from sklearn.preprocessing import scale from sklearn.datasets import load_iris from sklearn.cluster import KMeans import matplotlib.pyplot as plt import numpy as np import pandas as pd %matplotlib inline iris = load_iris() # 보다 편리한 데이터 Handling을 위해 DataFrame으로 변환 irisDF = pd.DataFrame...

Read more

차원축소

기본 개념 차원축소의 종류는 2가지 피처 선택(Feature selection) 다른 피처에 종속성이 강한 피처는 제거하고, 중요한 피처만 남기는 것 피처 추출(Feature extraction) 기존의 피처들을 압축해서 함축적인 의미를 가지는 새로운 피처로 만드는 것 이해를 위해 선행되어야 하는 개념 PCA 저격용 선형대수 지식 모델 PCA 3개의 Gene 축을 사용하면 위와같이 표현할 수 있다. 더 많은 Gene 축...

Read more

회귀(Regression)

개념 최적의 회귀계수를 찾는 것 독립변수 개수 회귀 계수의 결합 1개: 단일회귀 선형: 선형 회귀 여러 개: 다중회귀 비선형: 비선형 회귀 분류와 회귀의 차이 지도학습은 두 가지 유형(분류, 회귀) 분류 예측값이 카테고리와 같은 이산형 클래스 회귀 예측값이 연속형 숫자 값 단순 선형회귀를 통해 이해해보기 단순 선형회귀는 독립변수 1개, 종속변수 1개인 선형 회귀 예로...

Read more

모델 성능 평가 개념

L1 Distance, L2 Distance L1 Norm, L2 Norm1 의 개념을 알고 있어야 한다. 헷갈리지 말아야 할 점으로 $ L1 Norm != L1 Distance, L2 Norm != L2 Distance $ 라는 점이다. Norm은 한 벡터의 크기 개념이고, Distance는 두 벡터의 거리 개념이다. L1 Distace, L2 Distance의 수식은 다음과 같다. \[L1 \ loss \ function = \sum^n_{i=1} \lvert y_{true} - y_{predicted} \rvert\] L1 loss는 L2 loss에 비해 outlier의 영향력이 크지 않아 robu...

Read more