主要内容 #
- 了解numpy和pandas,安装并进行简单使用。
- 熟悉numpy的几种属性。
1. Numpy与Pandas的介绍 #
Numpy 和 Pandas 都是当下最重要的 Python 科学运算模块, 他们集成了优秀的算法, 让你的计算速度飞速提升,同样也是数据整理的好助手,将你凌乱的数据划分成整齐好看的数据。这两个模块主要应用在:数据分析、机器学习和深度学习中。
为什么使用 Numpy 和 Pandas:
(1)运算速度快:numpy 和 pandas 都是采用 C 语言编写,pandas 又是基于 numpy,是 numpy 的升级版本。
(2)消耗资源少:采用的是矩阵运算,会比 python 自带的字典或者列表快好多。
2. Numpy与Pandas的安装及简单使用 #
在Pycharm的Terminal下安装
代码如下:
pip install numpy pip install pandas
- 安装完成后,通过导入模块来进行测试
使用numpy、pandas首先要导入模块。
代码如下:
import numpy as np #为了方便使用numpy 采用np简写 import pandas as pd array = np.array([[1,2,3],[2,3,4]]) #列表转化为矩阵 print(array) """ array([[1, 2, 3], [2, 3, 4]]) """
3. numpy的几种属性 #
在 NumPy中,每一个线性的数组称为是一个轴(axis),也就是维度(dimensions)。比如说,二维数组相当于是两个一维数组,其中第一个一维数组中每个元素又是一个一维数组。所以一维数组就是 NumPy 中的轴(axis),第一个轴相当于是底层数组,第二个轴是底层数组里的数组。
很多时候可以声明 axis。axis=0,表示沿着第 0 轴进行操作,即对每一列进行操作;axis=1,表示沿着第1轴进行操作,即对每一行进行操作。
NumPy 的数组中比较重要的numpy属性有:
(1)轴的数量或维度的数量
ndarray.ndim
代码如下:
print('number of dim:',array.ndim) # 维度 # number of dim: 2
(2)数组的维度,对于矩阵,n 行 m 列
ndarray.shape
代码如下:
print('shape :',array.shape) # 行数和列数 # shape : (2, 3)
(3)数组元素的总个数,相当于 .shape 中 n*m 的值
ndarray.size
代码如下:
print('size:',array.size) # 元素个数 # size: 6
5. 小结 #
- 认识科学运算的两个模块:numpy和pandas
- 正确安装并导入模块
- 熟悉numpy,并掌握numpy的几种重要属性
习题 #
无