[Pandas] Series와 DataFrame
·
💂군대/KAIST ICT Academy
Pandas란?금융 데이터를 계량 분석하기 위해서 개발되었다.패널 데이터(panel data) 구조를 제공하기 위해 Numpy 위에 구성되도록 개발하였으며 넘파이에서 쉽게 사용할 수 있다.CSV, Excel, SQL 등 여러 형식의 데이터를 분석하고 처리할 수 있으며데이터 행과 열의 라벨로 데이터를 분석하고 처리할 수 있다. 특징● 대용량 데이터를 다루기 위해 사용하는 라이브러리● 여러 차원의 데이터를 다룰 수 있음● Numpy는 주로 숫자 정보를 다루는 용도로 사용되지만 Pandas는 다양한 타입의 데이터를 처리하기에 용이함● 각 Column의 이름을 만들거나 형태를 쉽게 변형할 수 있음 Series와 DataFrameSeries: 라벨이 있는 1차원 ArrayDataFrame: 라벨이 있는 2차원 d..
[Numpy] Random Number generation
·
💂군대/KAIST ICT Academy
Numpy의 랜던 숫자 생성 기능은 데이터 분석, 시뮬레이션, 머신러닝 등에서 많이 사용된다.numpy.random 모듈을 활용하면 다양한 확률 분포에 따른 난수를 쉽게 생성할 수 있다.numpy.random 모듈은 통계학적 분포를 따르는 난수 뿐만 아니라 여러가지 유용한 랜덤 샘플링 기법을 제공한다.1. np.random.random()● 0 이상 1 미만의 균등분포에서 난수를 생성한다.● np.random.random(size)● size 파라미터로 생성할 배열의 크기를 지정할 수 있다.import numpy as nprand_arr = np.random.random(5)print(rand_arr) ## 출력[0.85737057 0.38114576 0.67098185 0.29898713 0.4312..
[Numpy] Boolean Masking
·
💂군대/KAIST ICT Academy
Boolean Masking: 조건에 따라 배열의 요소를 선택할 수 있는 Numpy의 기능데이터 분석과 처리에서 자주 사용되며, 특정 조건을 만족하는 요소들을 쉽게 필터링할 수 있다. Boolean mask: True와 False로 이루어진 배열mask 배열을 원본 배열에 적용하면 True에 해당하는 요소들만 선택되어 필터링 된다.element-wise로 대응해 처리하기 때문에 원본 배열과 masking배열의 shape은 같아야한다.import numpy as nparr = np.array([10, 15, 20, 25, 30])mask = arr > 20 # masking배열 생성newArr = arr[mask] # 원본 배열에 masking배열 적용print(newArr)## 출력[25,30] 다음..
[Numpy] Array Indexing
·
💂군대/KAIST ICT Academy
1. 1차원 Array Indexing1) Indexing일반적인 파이썬에서 리스트를 인덱싱하는 방법과 동일하다크기가 N인 Array가 있다면 []를 활용해 0번 ~ N-1번까지 인덱싱 할 수 있다.반대로 뒤에서부터 인덱싱을 하고 싶다면 -1번 ~ -N번까지 인덱싱 할 수 있다.array_one = np.arange(1,11)print(f'array_one[0]: {array_one[0]}')print(f'array_one[5]: {array_one[5]}')print(f'array_one[9]: {array_one[9]}')print(f'array_one[-5]: {array_one[-5]}')print(f'array_one[-1]: {array_one[-1]}')## 출력array_one[0]: 1a..
[Numpy] Broadcasting
·
💂군대/KAIST ICT Academy
다음의 세 가지 과정을 통해 Broadcasting에 대해 알아보자.1) 일차원 배열  + 스칼라2) 2차원 배열 + 일차원 배열3) Broadcasting 1. 1차원 배열 + 스칼라a = np.arange(4)s = 10b = a + sprint(a.shape)print(b.shape)## 출력(4,)(4,) 앞선 포스팅에서도 언급했지만 Vectorization을 통해 연산이 빠르게 수행된다. 2. 2차원 배열 + 1차원 배열a = np.arange(8).reshape(2,4)b = np.arange(4)c = a+bprint(f'a.shape:{a.shape}, b.shape:{b.shape}')print(f'c.shape:{c.shape}')## 출력a.shape:(2, 4), b.shape:(4..
[Numpy] Array manipulation
·
💂군대/KAIST ICT Academy
1. ndarray를 다루는 여러가지 메소드1) Reshape- data는 그대로 유지한 채 배열의 형태만 변경- 변경할 shape형태에 -1을 사용하면 인터프리터가 자동으로 연산- 성립될 수 없는 shape으로 모양을 변형하려고 하면(정수로 안떨어지면) 에러 발생my_array = np.arange(10)my_new_array = my_array.reshape(2,5)my_new_array2 = np.reshape(my_array, (2,-1))print(my_array)print(my_new_array)print(my_new_array2)## 출력[0 1 2 3 4 5 6 7 8 9][[0 1 2 3 4] [5 6 7 8 9]][[0 1 2 3 4] [5 6 7 8 9]] *(1,6)과 (6,)의 차..
루오
'💂군대/KAIST ICT Academy' 카테고리의 글 목록