파이썬에서 데이터 과학 (data science) 및 애플리케이션 개발 측면에서 중요하게 활용되고 있는 몇몇 파이썬 라이브러리에 대해 알아보는 시간을 갖도록 해 보자. 참고로, 파이썬 라이브러리는 모듈 또는 패키지로도 불리는데, 모듈(module)은 하나의 특정한 기능을 위한 함수들을 모아 둔 단위로서, 물리적으로는 하나의 파이썬 스크립트 (파일)가 된다. 패키지(package)는 이러한 모듈을 여러개 모아 둔 단위로서, 형태적으로 하나의 폴더에 해당하게 된다.
유용하게 활용되고 있는 라이브러리들은 다음과 같다. 각각의 특징 및 기능에 대해서는 하나씩 차근차근 살펴보도록 하겠다.
- 수학연산을 위한 math
- 기본 통계값 계산을 위한 statistics
- n 차원 배열 또는 행렬 (ndarray)의 표현과 연산을 위한 numpy (넘피 또는 넘파이로 읽음)
- 과학기술계산 라이브러리인 scipy 패키지 중 통계 모듈인 scipy.stats (사이파이쩜 스탯)
- 행과 열로 이루어진 데이터를 처리할 수 있는 대표적인 데이터분석 라이브러리인 pandas (판다스)
- 데이터 시각화 (data visualization) 를 위한 2D 그래픽 도구인 matplotlib (특히, matplotlib.pyplot)
- 애플리케이션 UI (사용자 인터페이스, User Interface) 개발을 위한 Tkinter, PyQt, PyGTK, wxPython
- 웹 UI 개발을 위한 django (장고)
- 데이터베이스 연동을 위한 SQLite, PyMySql