Numpy & Pandas

Pandas 상황별 해결법

본 포스트는 Pandas로 대표 목적을 이루는데 있어서 필요했던 다른 문법들, 발생한 상황들, 생각들을 연결되게 정리하였다. 데이터를 다루다보면 의도치 않은 상황들을 자주 만나게 될텐데 그런 점을 대비하기 위함이다. list, dictionary 등이 string 으로 csv 파일에 저장되어 있을 때 위 그림과 같이 csv를 읽어와서 데이터에 접근했는데 데이터가 string type으로 되어 있으면 난감하다.. 이미 list, dict 형태를 갖추고 있지만 string 형식으로 저장되어 있는 데이터의 경우 ast 라이브러리를 사용하면 편하다. import ast x = '["a...

Read more

Numpy 유용한 함수

np.unique 어떤 값들이 데이터에 들어있는지 알 수 있음. 추가적으로 각 데이터의 갯수 또한 return_counts 인자로 알 수 있음 unique, counts = np.unique(y, return_counts = True) print(unique, counts) np.where 다음의 2가지로 활용 가능하다. Condition 만족하는 Index 반환 1차원일 경우 import numpy as np a = np.arange(5, 15) # array([ 5, 6, 7, 8, 9, 10, 11, 12, 13, 14]) ...

Read more

axis

axis에 대한 고찰 axis 0 row 방향의 축을 의미 axis 1 column 방향의 축을 의미 코드 적용 예시 array2d = np.array([[8, 12], [7, 1 ]]) sort_array2d_axis0 = np.sort(array2d, axis=0) print('로우 방향으로 정렬:\n', sort_array2d_axis0) sort_array2d_axis1 = np.sort(array2d, axis=1) print('컬럼 방향으로 정렬:\n', sort_a...

Read more

Pandas 백과사전

Series는 칼럼이 한개 / DataFrame은 칼럼이 여러개 Series Key, value 형태로 이루어져 있음. Dict타입과 호환 가능 리스트와도 호환가능. 이때는 정수형 인덱스가 들어감 인덱스 종류 정수형 인덱스 sr[0], sr[0:2] 인덱스 이름 sr['c'], sr['c': 'e'] DataFrame 각 행이 ‘record’라고 불리며, 각 열이 ‘feature’라고 불림 초기 정보 보는법 Dat...

Read more