数组构建
信息
默认省略导入import numpy as np
.
NumPy中最重要的概念就是nd数组. nd数组的构建有6种方式:
- 从Python数据类型转换而来, 如列表和元祖, 详情见这里
- 内建的nd数组创建函数, 如
arange()
,ones()
,zeros()
等, 详情见这里 - 复制, 扩展或者改变现有的nd数组, 详情见这里
- 从磁盘中读取nd数组, 无论是标准格式还是自定义格式, 详情见这里
- 从字符串或者缓冲区中读取原始字节创建nd数组
- 使用特殊函数, 如
random()
创建方法
转换Python数据类型
可以通过np.array()
方法转换Python列表或者元祖为nd数组, 嵌套结构决定了nd数组的维度.
例子
内建创建函数
NumPy由大约40个内建函数用于创建nd数组, 这些函数大概可以被分为3类:
- 一维数组创建函数
- 二维数组创建函数
- nd数组创建函数
一维数组创建函数
一维数组创建函数如np.arange()
和np.linspace()
需要大致上两个输入, [start]
和[stop]
.
np.arange()
: 创造值逐渐递增的nd数组, 可以自定义步长.np.linspace()
: 创建含有特定个数元素的数组, 元素在[start]
和[stop]
之间均匀分布.
注意
np.arange()
产生的数组不会包含[stop]
.np.linspace()
产生的数组会包含[stop]
.
例子
二维数组创建函数
二维数组创建函数如np.eye()
, np.diag()
和np.vander()
可以用于创建一些特殊结构的矩阵.
np.eye()
: 创建一个单位矩阵np.diag()
: 创建一个对角线为给定值的矩阵, 或者返回给定矩阵的对角线np.vander()
: 创建一个范特蒙德矩阵
例子
nd数组创建函数
nd数组创建函数如np.ones()
, np.zeros()
和random
可以用于创建一下特殊结构的矩阵.
np.zeros()
: 创建一个零矩阵np.ones()
: 创建一个一矩阵random()
: 创建一个随机矩阵, 需要配合default_rng
使用np.indices()
: 创建一个索引矩阵
例子
操作现有的nd数组
当你已经有一个数组的时候, 你可以复制, 扩展或者改变现有的数组.
注意
当需要将数组或者元素分配给新变量的时候, 必须显式地np.copy()
数组, 否则该变量只是原始数组的视图.
可以使用np.vstack()
, np.hstack()
和np.block()
.
例子
从磁盘中读取
这是最常见的创建大型数组的情况, 主要分为读取二进制文件和读取文本文件. 文本文件和二进制文件的区别在这里.
更多内容, 请参考这里.
读取二进制文件
一般常用于数据科学的编码方式有HDF5和FITS, 分别可以用h5py
和Astropy
模块将数据编码为二进制文件.
例子
定义:
import h5py
import numpy as np
# 创建并写入HDF5文件
data_to_write = np.array([1.1, 2.2, 3.3, 4.4])
with h5py.File('data.h5', 'w') as f:
f.create_dataset('dataset_name', data=data_to_write)
# 读取HDF5文件
with h5py.File('data.h5', 'r') as f:
data_read = f['dataset_name'][:]
print(data_read)
执行:
Tip
在使用h5py
读取HDF5编码之后文件的时候, 读取的数据会被直接转换为NumPy数组, 这是因为h5py
设计的时候就与NumPy深度集成, 自动处理了数据类型转换.
读取文本文件
一般用的比较多的文本文件是CSV文件, 用的一般是UTF-8编码.
例子
simple.csv
文件:
定义:
-
Array creation—NumPy v2.0 Manual. (n.d.). From https://numpy.org/doc/stable/user/basics.creation.html ↩