大家都在媒體平臺聽說過Python,那么Python庫都有哪些呢?Python常用庫包括圖像處理,文件處理,大數據與科學計算,游戲與多媒體,人工智能與機器學習,數據庫等等。要知道Python的大多數機器學習庫都依賴于這兩個模塊,Scipy和Numpy經常是合并使用的。pycuda/opencl,GPU高性能并發計算。python實現的是分析平臺,數據統計,類似于R語言。以Matplotlib和NumPy為基礎,它主要用于數據分析以及數據可視化,其數據結構DataFrame和R語言中的data.frame類似,特別是對具有自己的時序數據分析機制的DataFrame來說,特別常好。

商業智能(BI),Pandas的網絡接口。Blaze,NumPy和Pandas的大數據接口。SciPy是一個開源的Python算法庫和數學工具箱,它包含了優化、線性代數、積分、插值、特殊函數、快速傅里葉變換、信號處理和圖像處理、常微分方程求解以及其它科學與工程中常用的計算模塊。
它的功能類似于MATLAB,Scilab和GNUOctave軟件。Python的大多數機器學習庫都依賴于這兩個模塊,Numpy和Scipy經常合并使用。ScientificPython是一組Python程序模塊,用于科學計算,包括幾何(矢量、張量、變換、矢量和張量場),四元數,自動求導,(線性)插值,多項式,基礎統計學,非線性最小二乘擬合,單位計算,Fortran兼容文本格式,通過VRML的3D顯示,以及兩個Tk小工具,分別用于繪制線圖和3D網格模型。
另外還有與netCDF、MPI和BSPlib庫的接口。科學計算庫NumPy提供了矩陣、線性代數、傅立葉變換等,以及最常用的N維數組對象。
NumPy提供了兩個基本對象:
N-dimensionalarrayobject)和ufunc(universalfunctionobject)。
ndarray是一個用于存儲單一數據類型的多維數組,ufunc是一個函數,它可以處理該數組。
計算包最優化,可進行線性規劃,二次規劃,半正定規劃等的計算。
科學計算速度優化編譯器。Pymvpa2,一個Python工具包,為大數據集提供統計學分析,提供一個靈活的可擴展框架。
其主要功能有分類、回歸、特征選擇、導入輸出、可視化等,還提供了復雜網絡優化軟件包。Zipline,交易算法的函數庫
PyDy,Python動態建模函數庫。
SymPy,符號數學的Python庫。statsmodels,Python的統計建模和計量經濟學。
astropy,天文學界的Python庫。
orange,橙色,數據挖掘,數據可視化,通過可視化編程或Python腳本學習機分析。
RDKit,化學信息學和機器學習的軟件。
OpenBabel,巴貝爾,開放的化學工具箱。
cclib,化學軟件包的計算函數庫。
Biopython,免費的生物計算工具包。
bccb,生物分析相關的代碼集。bcbio-nextgen,提供完全自動化、高通量、測序分析的工具包。
visvis,可視化計算模塊庫,可進行一維到四維數據的可視化。
MapReduce是Google提出的一個軟件[架構],用于大規模數據集(大于1TB)的并行運算。
概念“Map(映射)”和“Reduce(歸納)”,及他們的主要思想,都是從函數式編程語言借來的MapReduce函數庫。Framworks
andlibrariesforMapReduce.,PySpark,[Spark]的Python
API。dpark,Spark的Python克隆,Python中的MapReduce框架。luigi,為批量工作,建立復雜的管道。mrjob,運行在[Hadoop],或亞馬遜網絡服務的,MapReduce工作。
以上我們介紹了Python大數據與科學計算的庫相關知識,如果您想了解更多相關信息,請您繼續關注中培偉業。