본문 바로가기

Python53

Numpy.sort, argsort 넘파이에서 행렬을 정렬하는 대표적인 함수로 np.sort( ) 와 ndarray.sort( ) 에 대해 알아보겠다. 행렬 정렬은 np.sort( )와 같이 넘파이에서 sort( ) 를 호출하는 방식과 ndarray.sort( )와 같이 행렬 자체에서 sort( )를 호출하는 방식이 있다. 두 방식의 차이는 np.sort( ) : 원본의 변경 없이 ( 원본 행렬 유지 ) 정렬된 배열의 복사본이 생성 ndarray.sort( ) : 원본 배열의 값이 정렬한 형태로 변경 import numpy as np original_array = np.array([ 3, 1, 9, 5]) print('원본 행렬:', original_array) #np.sort( )로 정렬 sort_array1 = np.sort(origi.. 2022. 1. 9.
Numpy Fancy Indexing, Boolean Indexing 팬시 인덱싱 (Fancy indexing) 리스트나 ndarray로 인덱싱 집합을 지정하면 해당 위치의 인덱스에 ndarray를 반환하는 인덱싱 방식이다. 다시, 쉽게 이야기하면 ndarray를 index value로 사용해서 값을 반환하는 것이다. #import numpy as np array1d = np.arange(start =1, stop = 10) array2d = array1d.reshape(3, 3) array3 = array2d[[0,1] ,2] print('array2d[[0,1],2] => ', array3.tolist()) array4 = array2d[[0,1] ,0:2] print('array2d[[0,1],0:2] => ', array4.tolist()) array5 = arra.. 2022. 1. 6.
Numpy 슬라이싱 (slicing) 슬라이싱은 연속된 인덱스상의 ndarray를 추출하는 방식이다. ' : ' (colon) 기호를 사이에 시작 인덱스와 종료 인덱스를 표시하면 시작 인덱스에서 종료 인덱스 -1 위치에 있는 데이터 ndarray 가 추출된다. 예를 들어, 1 : 5 라고 하면 시작 인덱스 1과 종료 인덱스 4까지에 해당하는 ndarray를 뜻한다. #import numpy as np array1 = np.arange(start = 1, stop = 10) array2 = array1[0:3] print(array2) print(type(array2)) [output] [1 2 3] 아래와 같이 표현도 가능하다. array1 = np.arange(start = 1, stop = 10) array3 = array1[0 : 3].. 2022. 1. 5.
python 으로 csv 파일 합치기 파이썬 모듈을 이용해서 csv 파일의 내용을 합쳐보겠다. pandas 모듈에서 concat 명령어를 이용해보겠다. import pandas as pd from glob import glob climate_files = sorted(glob('*.csv')) #'*'을 넣어줌으로써 해당 디렉토리 안에있는 모든 csv 파일을 불러온다. 합치고자 하는 데이터는 우리나라 2020년에서 2021년까지의 기상 기후 데이터 이며 전국의 관측소 대략 500 곳에서 측정된 데이터를 파싱해온 것이고 따라서 합치고자 하는 csv 파일의 갯수 또한 대략 500개 정도 된다. %%time climate = pd.concat((pd.read_csv(file).assign(filename = file) for file in cli.. 2022. 1. 4.
300x250