python

[python/파이썬] 필수 파이썬 라이브러리

blackJ 2021. 6. 22. 13:34
  • NumPy (Numerical Python)
    산술 계산의 추춧돌 같은 라이브러리. 자료 구조, 알고리즘 산술 데이터를 다루는 대부분의 과학 계산 어플리케이션에서 필요한 라이브러리를 제공
    • 빠르고 효율적인 다차원 배열 객체 ndarray
    • 배열 원소를 다루거나 배열 간의 수학 계산을 수행하는 함수
    • 디스크로부터 배열 기반의 데이터를 읽거나 쓸 수 있는 도구
    • 선형대수 계산, 푸리에 변환, 난수 생성기
    • 파이썬 확장과 C, C++코드에서 NumPy의 자료구조에 접근하고 계산 기능을 사용할 수 있도록 해주는 CAPI
  • pandas
    구조화된 데이터나 표 형식의 데이터를 빠르고 쉽게 표현적으로 다루도록 설계된 고수준의 자료구조와 함수 제공
    • 자동적으로 혹은 명시적으로 축의 이름에 따라 데이터를 정렬할 수 있는 자료구조
    • 통합된 시계열 기능
    • 시계열 데이터와 비시계열 데이터를 함께 다룰 수 있는 통합 자료구조
    • 메타데이터를 보존하는 산술 연산과 축약 연산
    • 누락된 데이터를 유연하게 처리할 수 있는 기능
    • 일반 데이터베이스처럼 합치고 관계연산을 수행하는 기능
  • matplotlib
    그래프나 2차원 데이터 시각화를 생성하는 유명한 파이썬 라이브러리

  • SciPy
    과학 계산 컴퓨팅 영역의 여러 기본 문제를 다루는 패키지 모음
    • scipy.intergrate : 수치적분 루틴과 미분방정식 풀이법
    • scipy.linalg : numpy.linalg에서 제공하는 것보다 더 확장된 선형대수 루틴과 매트릭스 분해
    • scipy.optimize : 함수 최적화기와 방정식의 근을 구하는 알고리즘
    • scipy.signal : 시그널 프로세싱 도구
    • scipy.sparse : 희소 행렬과 희소 선형 시스템 풀이법
    • scipy.special : 감마 함수처럼 흔히 사용되는 수학 함수를 구현하는 포트란 라이브러리인 SPECFUN 래퍼
    • scipy.stats : 표준 연속/이산 확률 분포(밀도 함수, 샘플러, 연속 분포 함수)와 다양한 통계 테스트 그리고 좀 더 기술적인 통계도구
  • scikit-lean
    파이썬 개발자를 위한 범용 머신러닝 도구
    • 분류 : SVM, 최근접 이웃, 랜덤 포레스트, 로지스틱 회귀 등
    • 회귀 : 라소, 리지 회귀 등
    • 클러스터링 : k-평균, 스펙트럴 클러스터링 등
    • 차원 축소 : PCA, 특징 선택, 행렬 인수분해 등
    • 모델 선택 : 격자탐색, 교차검증, 행렬
    • 전처리 : 특징 추출, 정규화
  • statsmodels 
    다양한 R 언어용 회귀분석 모델을 규현한 스탠퍼드 대학의 통계학 교수인 조나탄 테일러의 작업을 기반으로 만들어 진 통계분석 패키지
    • 회귀모델 : 선형회귀, 일반화 선형 모델, 로버스트 선형 모델, 선형 혼합효과 모델 등
    • 분산분석(ANOVA : analysis of variance)
    • 시계열분석 : AR, ARMA, ARIMA, VAR 및 기타 모델
    • 비모수 기법 : 커널밀도추정, 커널 회귀
    • 통계 모델 결과의 시각화

 

 

 

 

 

출처 : Python for Data Analysis 파이썬 라이브러리를 활용한 데이터 분석