사이킷 런(Scikit-learn)
데이터 나누기
train_test_split과 StratifiedGroupKFold, StratifiedKFold 등의 다양한 split 방법이 존재한다.
여기서는 StratifiedKFold의 설명을 추가적으로 해보고자 한다.
train_test_split
사용할 때 간단 요령
feature data, label data 분류할 때 헷갈리지 않는 법
인자 순서대로 분리한다고 생각
아래 예시에서 norm_data[‘value’]를 먼저 train용, test용으로 나눔 -> X_train, X_te...