01 라이브러리 불러오기
import numpy as np
np라는 별칭(alias)으로 numpy를 import한다.
02 넘파이 배열 이해하기
상기 그림에서 axis 0는 분석 단위를 구성한다. 3차원 데이터의 shape가 (2500, 28, 28)이라면 (28, 28) 크기의 2차원 데이터가 2500개가 있는 것으로 해석하면 된다.
03 넘파이 배열 생성 및 변형하기
np.array()
np.array(리스트)
np.zeros(), np.ones(), np.full(), np.eye(), np.random.random()
np.zeros() | 0으로 채워진 배열 |
np.ones() | 1로 채워진 배열 |
np.full() | 특정 값으로 채워진 배열 |
np.eye() | 정방향 행렬 |
np.random.random() | 랜덤 값으로 채운 배열 |
np.reshape()
np.reshape(리스트, 변경할 shape)
- 기존 배열을 새로운 형태의 배열로 다시 구성한다.
- (m, 1) 또는 (-1, n) 처럼 한 쪽의 행 또는 열만 지정할 수 있다.
- 주의할 점은 reshape할 때 원본 배열의 약수만 넣을 수 있다.
04 넘파이 배열 조회하기
인덱싱과 슬라이싱
arr[행 인덱스, 열 인덱스]
arr[행 인덱스][열 인덱스]
arr[행 인덱스]
arr[ : , 열 인덱스]
arr[[행 인덱스들], 열 인덱스]
arr[[행 인덱스들][열 인덱스들]]
arr[[행 인덱스들]]
arr[:, 열 인덱스들]
열 인덱스는 생략 가능하지만 행 인덱스는 생략할 수 없다는 것을 유념해야한다.
조건 인덱스
arr[조건문]
05 넘파이 배열 집계하기
np.sum(배열명, axis=방향)
np.mean(배열명)
np.std(배열명)
06 넘파이 배열의 유용한 함수
np.where()
np.where(조건문, 참일 때 값, 거짓일 때 값)
np.argmax()
np.argmax(배열명, axis=방향)
가장 큰 값의 인덱스를 반환해준다.
'데이터 사이언스 > 데이터 분석·전처리' 카테고리의 다른 글
[Python] matplotlib, seaborn을 이용한 단변량 분석 (0) | 2023.02.11 |
---|---|
[데이터 분석 방법론] CRISP-DM 프로세스 (0) | 2023.02.10 |
[Python] Pandas 시계열 데이터 다루기 - 날짜, shift, rolling, diff (0) | 2023.02.08 |
[Python] Pandas DataFrame 사용법 정리 2 - 변경, 결합 (0) | 2023.02.07 |
[Python] Pandas DataFrame 사용법 정리 1 - 생성, 정보 확인, 정렬, 조회, 집계 (0) | 2023.02.07 |