NumPy学习笔记(一)

Author Avatar
Brian Lee 3月 16, 2018
  • 在其它设备中阅读本文章

NumPy是一个开源的Python科学计算基础库,是SciPy、Pandas等数据处理或科学计算库的基础


构成

  • 一个强大的N维数组对象 ndarray
  • 广播功能函数,用于在数组之间进行计算
  • 整合C/C++/Fortran代码的工具
  • 线性代数、傅里叶变换、随机数生成等功能

引用

import numpy as np

其中np为模块别名,方便编程时引用


ndarray

ndarray是一个N维数组对象

构成

  • 实际的数据
  • 描述这些数据的元数据(数据维度、数据类型等)

特点

  • 一般要求所有元素类型相同
  • 数组下标从0开始

轴与秩

  • 轴(axis):即数轴的意思,每个维度的数据存储于其中
    例如对于一个三维平面,将其看做是多个二维平面层叠起来的,则 $axis=0$ 表示全部平面上对应的位置,$axis=1$ 表示平面的每一列,$axis=2$ 表示平面的每一行
  • 秩(rank):轴的数量,即维度的数量

优点

  • 数组对象可以去掉元素间运算所需要的循环,使一维向量更像单个数据
    例如,计算 $A^2 + B^3$,其中A和B是一位数组
    若使用Python的列表:
    def pySum():
        a = [0, 1, 2, 3, 4]
        b = [9, 8, 7, 6, 5]
        c = []
        for i in range(len(a)):
            c.append(a[i]**2 + b[i]**3)
        return c
    print(pySum())
    
    可见要使用循环对列表中每一个元素进行运算
    若使用ndarray:
    import numpy as np
    def npSum():
        a = np.array([0, 1, 2, 3, 4])
        b = np.array([9, 8, 7, 6, 5])
        c = a**2 + b**3
        return c
    print(npSum())
    
    此时可以对数组直接进行操作,编程得到了简化
  • 设置专门的数组对象,经过优化,可以提升这类应用的运算速度(这是由于numpy的底层实现由C语言完成,进行数组运算时,可以提供高效快速的运算性能)
  • 数组对象采用相同的数据类型,有助于节省运算和存储空间

属性

属性 说明
.ndim 秩,即轴或维度的数量
.shape ndarray对象的尺度,对于矩阵,n行m列
.size ndarray对象元素的个数,相当于.shape中n*m的值
.dtype ndarray对象的元素类型
.itemsize ndarray对象中每个元素的大小,以字节为单位

元素类型

数据类型 说明
bool 布尔类型,True或False
intc 与C语言中的int类型一致,一般是int32或int64
intp 用于索引的整数,与C语言中的ssize_t一致,int32或int64
int8 字节长度的整数,取值:[-128, 127]
int16 16位长度的整数,取值:[-32768, 32767]
int32 32位长度的整数,取值:[$-2^{31}$, $2^{31}-1$]
int64 64位长度的整数,取值:[$-2^{63}$, $2^{63}-1$]
uint8 8位无符号整数,取值:[0, 255]
uint16 16位无符号整数,取值:[0, 65535]
uint32 32位无符号整数,取值:[0,$2^{32}-1$]
uint64 64位无符号整数,取值:[0,$2^{64}-1$]
float16 16位半精度浮点数:1位符号数,5位指数,10位尾数
float32 32位半精度浮点数:1位符号数,8位指数,23位尾数
float64 64位半精度浮点数:1位符号数,11位指数,52位尾数
complex64 复数类型,实部和虚部都是32位浮点数
complex128 复数类型,实部和虚部都是64位浮点数

科学计算涉及数据较多,对存储和性能都有较高要求。所以对元素类型进行精确定义,有助于Numpy合理使用存储空间并优化性能,有助于程序员对程序规模有合理评估

创建方法

从Python中的列表、元祖等类型创建ndarray数组

如:

x = np.array(list/tuple)
x = np.array(list/tuple, dtype = np.int32)
x = np.array([0, 1, 2, 3])
x = np.array((4, 5, 6, 7))
使用NumPy中函数创建ndarray数组,如:arange, ones, zeros等
函数 说明
np.arange(n) 类似range()函数,返回ndarray类型,元素从0到n-1
np.ones(shape) 根据shape生成一个全1数组,shape是元祖类型
np.zeros(shape) 根据shape生成一个全0数组,shape是元祖类型
np.full(shape,val) 根据shape生成一个数组,每个元素值都是val
np.eye(n) 创建一个正方的n*n单位矩阵,对角线为1,其余为0
np.ones_like(a) 根据数组a的形状生成一个全1数组
np.zeros_like(a) 根据数组a的形状生成一个全0数组
np.full_like(a,val) 根据数组a的形状生成一个数组,每个元素值都是val
使用NumPy中其他函数创建ndarray数组
函数 说明
np.linspace() 根据起止数据等间距地填充数据,形成数组
np.concatenate() 将两个或多个数组合并成一个新的数组

例如:

a = np.linspace(1, 10, 4)    
#1表示数组的起始数值,10表示终止数值,4为元素个数,元素为浮点数
#a为array([1., 4., 7., 10.])

b = np.linspace(1, 10, 4, endpoint = False) 
#endpoint为False表示不包括终止数字10
#b为array([1., 3.25, 5.5, 7.75])

c = np.concatenate((a, b))
#c为array([1., 4., 7., 10., 1., 3.25, 5.5, 7.75])

维度变换

方法 说明
.reshape(shape) 不改变数组元素,返回一个shape形状的数组,原数组不变
.resize(shape) 与.reshape()功能一致,但修改原数组
.swapaxes(ax1,ax2) 将数组n个维度中两个维度进行调换
.flatten() 对数组进行降维,返回折叠后的一维数组,原数组不变

类型变换

new_a = a.astype(new_type)

astype()方法会创建一个新的数组

数组转化为列表

ls = a.tolist()

数组的索引

索引:获取数组中特定位置的元素

一维数组
a = np.array([9, 8, 7, 6, 5])
#如a[2]为数组中第二个位置(从0开始)的元素,即7。此规则与列表的索引相似
多维数组
a = np.arange(24).reshape((2, 3, 4))
#此时a = array([[[0, 1, 2, 3],
#                [4, 5, 6, 7],
#                [8, 9, 10, 11]],
#
#               [[12, 13, 14, 15],
#                [16, 17, 18, 19],
#                [20, 21, 22, 23]]])

#a[1, 2, 3]表示第一维在第一个位置,第二维在第二个位置,第三维在第三个位置,所以值为23
#a[-1, -2, -3]等同于a[1, 1, 1],值为17

数组的切片

切片:获取数组元素子集的过程

一维数组
a = np.array([9, 8, 7, 6, 5])
#如a[1 : 4 : 2],三个值分别为起始编号、终止编号(不包含)、步长。
#此切片的值为array([8, 6])
多维数组
a = np.arange(24).reshape((2, 3, 4))
#此时a = array([[[0, 1, 2, 3],
#                [4, 5, 6, 7],
#                [8, 9, 10, 11]],
#
#               [[12, 13, 14, 15],
#                [16, 17, 18, 19],
#                [20, 21, 22, 23]]])

#a[:, 1, -3]表示第一维全选,第二维选第一个位置,第三维选第一个位置,所以此切片为:
#array[(5,17)]

#a[:, 1:3, :]表示第一维全选,第二维选位置一到三(不包含),第三维全选,所以此切片为:
#array([[4, 5, 6, 7],
#        [8, 9, 10, 11]],
#
#        [[12, 13, 14, 15],
#        [16, 17, 18, 19]])

#a[:, :, ::2]表示第一维全选,第二维全选,第三维间隔为2选择,所以此切片为:
#array([[[0, 2],
#        [4, 6],
#        [8, 10]],
#
#        [12, 14],
#        [16, 18],
#        [20, 22]])

数组的运算

标量运算

数组与标量之间的运算作用于数组的每一个元素

一元函数

指对单一的数组进行运算的函数,对数组中每一个元素进行运算

函数 说明
np.abs(x) np.fabs(x) 计算数组各元素的绝对值
np.sqrt(x) 计算数组各元素的平方根
np.square(x) 计算数组各元素的平方
np.log(x) np.log10(x) np.log2(x) 计算数组各元素的自然对数,10 / 2底对数
np.ceil(x) np.floor(x) 计算数组各元素的ceiling值 / floor值
np.rint(x) 计算数组各元素的四舍五入值
np.modf(x) 将数组各元素的小数和整数部分以两个独立数组形式返回
np.cos(x) np.cosh(x) 计算数组各元素的普通型和双曲型三角函数
np.sin(x) np.sinh(x)
np.tan(x) np.tanh(x)
np.exp(x) 计算数组各元素的指数值,即$e^x$
np.sign(x) 计算数组各元素的符号值,1(+),0,-1(-)
二元函数
函数 说明
+ - / * 两个数组各元素进行对应运算
np.maximum(x,y) np.fmax() 元素的最大值计算
np.minimum(x,y) np.fmin() 元素的最小值计算
np.mod(x,y) 元素级的模运算
np.copysign(x,y) 将数组y中各元素值的符号赋值给数组x对应元素
> < >= <= == != 算术比较,产生布尔型数组

本博客采用 CC BY-NC-SA 3.0 许可协议。转载请注明出处!
本文链接:http://brianleelxt.top/2018/03/16/numpy-learn/