admin 发表于 2017-11-2 15:51:04

Python 科学计算和数据分析中常用库介绍


Python 科学计算和数据分析中常用库介绍任何科学计算和数据分析中用到:
[*]NumPy代表数值Python。NumPy最强大的功能是n维数组。该库还包含基本的线性代数函数,傅里叶变换,高级的随机数功能,以及集成其他低级语言如Fortran,C和C++的工具。
[*]SciPy代表科学的Python。SciPy是基于NumPy的。它是最有用的库之一,具有各种高层次的科学和工程模块,如离散傅立叶变换,线性代数,优化和稀疏矩阵。
[*]Matplotlib用于绘制各种各样的图表,从直方图到线图,再到热图。你可以在IPython notebook中使用PyLab(IPython notebook–PyLab = inline)以此使用这些绘图功能的inline。如果你忽略inline选项, PyLab 会将IPython notebook环境转换成类似于Matlab的环境。你也可以使用 Latex命令将math库添加到您的绘图中。
[*]Pandas对于结构化数据操作和控制。它广泛用于数据再加工和数据准备。Pandas说最近一直在推动对Python Python的使用数据科学家共同体的工具。
[*]Scikit Learn机器学习库。建立在NumPy、SciPy和matplotlib的基础上,这个库包含了机器学习和统计模型包括分类、回归、聚类和降维等很多有效的工具。
[*]Statsmodels用于统计建模。statsmodels是一个Python模块,允许用户探索数据,估计统计模型,并进行统计检验。一个广泛的描述性统计,统计检验的列表。绘图功能,和结果统计可用于不同类型的数据和每个估计。
[*]Seaborn用于统计数据的可视化。Seaborn是Python中用来绘制让人喜欢的并能提供大量信息的统计图形库。它是基于matplotlib。Seaborn旨在使可视化成为探索和理解数据的核心部分。
[*]Bokeh创建交互式图、仪表盘和现代Web浏览器上的数据应用。它允许用户生成的优雅和简洁的d3.js风格的图形。此外,在非常大的或流媒体数据集上,它具有高性能的交互性的能力。
[*]Blaze扩展NumPy和Pandas的分布式和流媒体数据集。它可以用来访问来自多种来源的数据,包括bcolz,MongoDB,SQLAlchemy,Apache Spark, PyTables等等,结合Bokeh,Blaze可以作为一个非常强大的工具,用于对大规模数据创建高效的的可视化和仪表板。
[*]Scrapy用于网络爬虫。它是用于获取特定数据模式的一个非常有用的框架,。它可以通过开始的一个网站主页的网址,然后通过挖掘网页内的网站收集信息。
[*]SymPy用于符号计算。它具有广泛的功能,从基本的符号运算到微积分,代数,离散数学和量子物理学。另一个有用的功能是将计算的结果格式化为LaTeX码的能力。
[*]Requests用于访问网络。它的工作原理类似于Python标准库urllib2,但是更容易编码。但对于初学者,你会发现和urllib2细微的差别,Requests可能更方便。
其它的库,你可能需要:
[*]os 用于操作系统和文件操作
[*]networkx和 igraph基于数据操作绘制图形
[*]regular expressions 用于在文本数据中查找模式
[*]BeautifulSoup将探索Web。它不如Scrapy,它一次运行将从一个单一的网页中提取信息。

页: [1]
查看完整版本: Python 科学计算和数据分析中常用库介绍