Home

MovieLens 협업 필터링 추천 시스템

아이템 기반 최근접 이웃 협업 필터링 추천 시스템을 공부하던 중 칼럼 이름을 바꿀 상황이 생겨서 글로 정리한다. MovieLens 데이터를 사용했으며 데이터 형태는 아래와 같다. import pandas as pd import numpy as np movies = pd.read_csv('./data/movies.csv') ratings = pd.read_csv('./data/ratings.csv') print(movies.shape, ratings.shape) (9742, 3) (100836, 4) movies.head() movieId tit...

Read more

TMDB 영화 데이터

Kaggle TMDB 데이터 콘텐트 기반 필터링 import pandas as pd import ast credit = pd.read_csv('./data/tmdb_5000_credits.csv') movies = pd.read_csv('./data/tmdb_5000_movies.csv') print(movies.columns) Index(['budget', 'genres', 'homepage', 'id', 'keywords', 'original_language', 'original_title', 'overview', 'popularity', 'production_companies', ...

Read more

Pandas 상황별 해결법

본 포스트는 Pandas로 대표 목적을 이루는데 있어서 필요했던 다른 문법들, 발생한 상황들, 생각들을 연결되게 정리하였다. 데이터를 다루다보면 의도치 않은 상황들을 자주 만나게 될텐데 그런 점을 대비하기 위함이다. list, dictionary 등이 string 으로 csv 파일에 저장되어 있을 때 위 그림과 같이 csv를 읽어와서 데이터에 접근했는데 데이터가 string type으로 되어 있으면 난감하다.. 이미 list, dict 형태를 갖추고 있지만 string 형식으로 저장되어 있는 데이터의 경우 ast 라이브러리를 사용하면 편하다. import ast x = '["a...

Read more

학위논문 준비

아이디어 딥러닝과 경량화를 엮으면 좋을 것 같음. 딥러닝 모델 경량화 기술 분석(2020) Deep Learning on Mobile and Embedded Devices: State-of-the-art, Challenges, and Future Directions 정석학술정보관에서 해당 논문 조회가 가능하였음.. 신세계다.. 학위논문 계획서를 작성하면서 생각났던 아이디어: Recursive Knowledge Distillation method BeatGAN 학위논문 시작 통계 활용할 자료 정리 elements_name = ['SO2', 'CO', 'O3', 'NO', 'NO2', 'NOX', 'PM10...

Read more

실험을 위한 모니터링 Tool Wandb

Wandb-Pytorch 연계 wandb 블로그 자체 포스트이며, 전체적으로 개념을 잡아줌 여기 사이트 꼭 한번 보자!. Gradient 어떻게 활용하면 좋을지 알려줌 여기는 wandb 친절하게 설명해준 사이트 Reproductibility(재현성)을 높이기 위한 코드 mnist dataset도 여기서 받음 import os import random import numpy as np import torch import torch.nn as nn import torchvision import torchvision.transforms as transforms from tqdm.notebook impor...

Read more