NumPy数据类型

类型解释
bool布尔类型,1 个字节,值为 True 或 False。
int整数类型,通常为 int64 或 int32 。
intc与 C 里的 int 相同,通常为 int32 或 int64。
intp用于索引,通常为 int32 或 int64。
int8字节(从 -128 到 127)
int16整数(从 -32768 到 32767)
int32整数(从 -2147483648 到 2147483647)
int64整数(从 -9223372036854775808 到 9223372036854775807)
uint8无符号整数(从 0 到 255)
uint16无符号整数(从 0 到 65535)
uint32无符号整数(从 0 到 4294967295)
uint64无符号整数(从 0 到 18446744073709551615)
floatfloat64 的简写。
float16半精度浮点,5 位指数,10 位尾数
float32单精度浮点,8 位指数,23 位尾数
float64双精度浮点,11 位指数,52 位尾数
complexcomplex128 的简写。
complex64复数,由两个 32 位浮点表示。
complex128复数,由两个 64 位浮点表示。
import numpy as np  # 导入 NumPy 模块

a = np.array([1.1, 2.2, 3.3], dtype=np.float64)  # 指定 1 维数组的数值类型为 float64
a, a.dtype  # 查看 a 及 dtype 类型

a.astype(int).dtype  # 将 a 的数值类型从 float64 转换为 int,并查看 dtype 类型

NumPy数组生成

在 Python 内建对象中,数组有三种形式:

  • 列表:[1, 2, 3]
  • 元组:(1, 2, 3, 4, 5)
  • 字典:{A:1, B:2}

NumPy 中,ndarray 类具有六个参数,它们分别为:

  • shape:数组的形状。
  • dtype:数据类型。
  • buffer:对象暴露缓冲区接口。
  • offset:数组数据的偏移量。
  • strides:数据步长。
  • order{'C','F'},以行或列为主排列顺序。

主要通过以下 5 种途径创建数组,它们分别是:

  • 从 Python 数组结构列表,元组等转换。
  • 使用 np.arangenp.onesnp.zeros 等 NumPy 原生方法。
  • 从存储空间读取数组。
  • 通过使用字符串或缓冲区从原始字节创建数组。
  • 使用特殊函数,如 random

在 NumPy 中,我们使用 numpy.array 将列表或元组转换为 ndarray 数组。其方法为:

numpy.array(object, dtype=None, copy=True, order=None, subok=False, ndmin=0)

其中,参数:

  • object:列表、元组等。
  • dtype:数据类型。如果未给出,则类型为被保存对象所需的最小类型。
  • copy:布尔类型,默认 True,表示复制对象。
  • order:顺序。
  • subok:布尔类型,表示子类是否被传递。
  • ndmin:生成的数组应具有的最小维数。

下面,通过列表创建一个 ndarray 数组。

np.array([[1, 2, 3], [4, 5, 6]])

或者是列表和元组。

  np.array([(1, 2), (3, 4), (5, 6)])

arange 方法创建

除了直接使用 array 方法创建 ndarray,在 NumPy 中还有一些方法可以创建一些有规律性的多维数。首先,我们来看一看 arange()arange() 的功能是在给定区间内创建一系列均匀间隔的值。方法如下:

numpy.arange(start, stop, step, dtype=None)

你需要先设置值所在的区间 [开始, 停止),这是一个半开半闭区间。然后,在设置 step 步长用于设置值之间的间隔。最后的可选参数 dtype 可以设置返回ndarray 的值类型。

# 在区间 [3, 7) 中以 0.5 为步长新建数组
np.arange(3, 7, 0.5, dtype='float32')

linspace 方法创建

linspace 方法也可以像arange方法一样,创建数值有规律的数组。linspace 用于在指定的区间内返回间隔均匀的值。其方法如下:

numpy.linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None)
  • start:序列的起始值。
  • stop:序列的结束值。
  • num:生成的样本数。默认值为50。
  • endpoint:布尔值,如果为真,则最后一个样本包含在序列内。
  • retstep:布尔值,如果为真,返回间距。
  • dtype:数组的类型。
np.linspace(0, 10, 10, endpoint=True)

将 endpoint 参数改成 False 看看区别:

np.linspace(0, 10, 10, endpoint=False)

ones 方法创建

numpy.ones 用于快速创建数值全部为 1 的多维数组。其方法如下:

numpy.ones(shape, dtype=None, order='C')

其中:

  • shape:用于指定数组形状,例如(1, 2)或 3。
  • dtype:数据类型。
  • order{'C','F'},按行或列方式储存数组。
np.ones((2, 3))

zeros 方法创建

zeros 方法和上面的 ones 方法非常相似,不同的地方在于,这里全部填充为 0zeros 方法和 ones 是一致的。

numpy.zeros(shape, dtype=None, order='C')

其中:

  • shape:用于指定数组形状,例如(1, 2) 3
  • dtype:数据类型。
  • order{'C','F'},按行或列方式储存数组。
np.zeros((3, 2))

eye 方法创建

numpy.eye 用于创建一个二维数组,其特点是 k 对角线上的值为 1,其余值全部为 0。方法如下:

numpy.eye(N, M=None, k=0, dtype=<type 'float'>)

其中:

  • N:输出数组的行数。
  • M:输出数组的列数。
  • k:对角线索引:0(默认)是指主对角线,正值是指上对角线,负值是指下对角线。
np.eye(5, 4, 3)

从已知数据创建

我们还可以从已知数据文件、函数中创建 ndarray。NumPy 提供了下面 5 个方法:

  • frombuffer(buffer):将缓冲区转换为 1 维数组。
  • fromfile(file,dtype,count,sep):从文本或二进制文件中构建多维数组。
  • fromfunction(function,shape):通过函数返回值来创建多维数组。
  • fromiter(iterable,dtype,count):从可迭代对象创建 1 维数组。
  • fromstring(string,dtype,count,sep):从字符串中创建 1 维数组。
np.fromfunction(lambda a, b: a + b, (5, 4))

ndarray 数组属性

首先,我们创建一个 ndarray 数组,首先,新建 a 并随意设定为一个 2 维数组。

a = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
  • ndarray.T 用于数组的转置,与 .transpose() 相同。
  • ndarray.dtype 用来输出数组包含元素的数据类型。
  • ndarray.imag 用来输出数组包含元素的虚部。
  • ndarray.real用来输出数组包含元素的实部。
  • ndarray.size用来输出数组中的总包含元素数。
  • ndarray.itemsize输出一个数组元素的字节数。
  • ndarray.nbytes用来输出数组的元素总字节数。
  • ndarray.ndim用来输出数组维度。
  • ndarray.shape用来输出数组形状。
  • ndarray.strides用来遍历数组时,输出每个维度中步进的字节数组。

数组维度和形状

前面,我们已经对 NumPy 数组的类型和常用的生成方法进行了介绍。再继续了解更多内容前,必须先搞清楚一个重要的问题,那就是 NumPy 数组的维度和形状。

NumPy 数组又被称之为 ndarray 多维数组,那么 n 就可以从 1 维依次递增。下图,我们展示了 1 至 3 维的 NumPy 数组示例。

1 维数组可以被看作数学中的向量,2 维数组可以看作是矩阵,而 3 维数组则是一个数据立方。

接下来,我们尝试生成如图所示的示例数组。三维数组中部分数值无法从图示中获得,我们全部用 1 替代。

one = np.array([7, 2, 9, 10])
two = np.array([[5.2, 3.0, 4.5],
                [9.1, 0.1, 0.3]])
three = np.array([[[1, 1], [1, 1], [1, 1]],
                  [[1, 1], [1, 1], [1, 1]],
                  [[1, 1], [1, 1], [1, 1]],
                  [[1, 1], [1, 1], [1, 1]]])
one.shape, two.shape, three.shape

可以发现规律,.shape 得到的形状实际上是数组在每个轴 Axis 上面的元素数量,而 .shape 的长度的表明了数组的维度。

数组基本操作

重设形状

reshape 可以在不改变数组数据的同时,改变数组的形状。其中,numpy.reshape() 等效于 ndarray.reshape()reshape 方法非常简单:

numpy.reshape(a, newshape)

其中,a 表示原数组,newshape 用于指定新的形状(整数或者元组)。

数组展开

ravel 的目的是将任意形状的数组扁平化,变为 1 维数组。ravel 方法如下:

numpy.ravel(a, order='C')

其中,a 表示需要处理的数组。order 表示变换时的读取顺序,默认是按照行依次读取,当 order='F' 时,可以按列依次读取排序。

轴移动

moveaxis 可以将数组的轴移动到新的位置。其方法如下:

numpy.moveaxis(a, source, destination)

其中:

  • a:数组。
  • source:要移动的轴的原始位置。
  • destination:要移动的轴的目标位置。

轴交换

和 moveaxis 不同的是,swapaxes 可以用来交换数组的轴。其方法如下:

numpy.swapaxes(a, axis1, axis2)

其中:

  • a:数组。
  • axis1:需要交换的轴 1 位置。
  • axis2:需要与轴 1 交换位置的轴 1 位置。