python
[python/파이썬] 필수 파이썬 라이브러리
blackJ
2021. 6. 22. 13:34
- NumPy (Numerical Python)
산술 계산의 추춧돌 같은 라이브러리. 자료 구조, 알고리즘 산술 데이터를 다루는 대부분의 과학 계산 어플리케이션에서 필요한 라이브러리를 제공- 빠르고 효율적인 다차원 배열 객체 ndarray
- 배열 원소를 다루거나 배열 간의 수학 계산을 수행하는 함수
- 디스크로부터 배열 기반의 데이터를 읽거나 쓸 수 있는 도구
- 선형대수 계산, 푸리에 변환, 난수 생성기
- 파이썬 확장과 C, C++코드에서 NumPy의 자료구조에 접근하고 계산 기능을 사용할 수 있도록 해주는 CAPI
- pandas
구조화된 데이터나 표 형식의 데이터를 빠르고 쉽게 표현적으로 다루도록 설계된 고수준의 자료구조와 함수 제공- 자동적으로 혹은 명시적으로 축의 이름에 따라 데이터를 정렬할 수 있는 자료구조
- 통합된 시계열 기능
- 시계열 데이터와 비시계열 데이터를 함께 다룰 수 있는 통합 자료구조
- 메타데이터를 보존하는 산술 연산과 축약 연산
- 누락된 데이터를 유연하게 처리할 수 있는 기능
- 일반 데이터베이스처럼 합치고 관계연산을 수행하는 기능
- matplotlib
그래프나 2차원 데이터 시각화를 생성하는 유명한 파이썬 라이브러리 - SciPy
과학 계산 컴퓨팅 영역의 여러 기본 문제를 다루는 패키지 모음- scipy.intergrate : 수치적분 루틴과 미분방정식 풀이법
- scipy.linalg : numpy.linalg에서 제공하는 것보다 더 확장된 선형대수 루틴과 매트릭스 분해
- scipy.optimize : 함수 최적화기와 방정식의 근을 구하는 알고리즘
- scipy.signal : 시그널 프로세싱 도구
- scipy.sparse : 희소 행렬과 희소 선형 시스템 풀이법
- scipy.special : 감마 함수처럼 흔히 사용되는 수학 함수를 구현하는 포트란 라이브러리인 SPECFUN 래퍼
- scipy.stats : 표준 연속/이산 확률 분포(밀도 함수, 샘플러, 연속 분포 함수)와 다양한 통계 테스트 그리고 좀 더 기술적인 통계도구
- scikit-lean
파이썬 개발자를 위한 범용 머신러닝 도구
- 분류 : SVM, 최근접 이웃, 랜덤 포레스트, 로지스틱 회귀 등
- 회귀 : 라소, 리지 회귀 등
- 클러스터링 : k-평균, 스펙트럴 클러스터링 등
- 차원 축소 : PCA, 특징 선택, 행렬 인수분해 등
- 모델 선택 : 격자탐색, 교차검증, 행렬
- 전처리 : 특징 추출, 정규화
- statsmodels
다양한 R 언어용 회귀분석 모델을 규현한 스탠퍼드 대학의 통계학 교수인 조나탄 테일러의 작업을 기반으로 만들어 진 통계분석 패키지- 회귀모델 : 선형회귀, 일반화 선형 모델, 로버스트 선형 모델, 선형 혼합효과 모델 등
- 분산분석(ANOVA : analysis of variance)
- 시계열분석 : AR, ARMA, ARIMA, VAR 및 기타 모델
- 비모수 기법 : 커널밀도추정, 커널 회귀
- 통계 모델 결과의 시각화
출처 : Python for Data Analysis 파이썬 라이브러리를 활용한 데이터 분석