正文
numpy中的np.random.mtrand.RandomState
小程序:扫一扫查出行
【扫一扫了解最新限行尾号】
复制小程序
【扫一扫了解最新限行尾号】
复制小程序
1 RandomState 的应用场景概述
在训练神经网络时,苦于没有数据,此时numpy为我们提供了 “生产” 数据集的一种方式。
例如在搭建神经网络(一)中的 4.3 准备数据集 章节中就是采用np.random.mtrand.RandomState “生产” 数据的。
常用的方式如下
import numpy as np# 设置seed值,生成ndarray对象SEED = 23455# 基于seed产生随机数rdm = np.random.mtrand.RandomState(SEED)# rand函数产生随机数,返回32行2列矩阵# 32行代表32组数据,2代表输入数据的2个特征X = rdm.rand(32, 2)# 为每组数据制备标签# 若(体积+重量) ≥ 1,则 Y 赋值 0# 若(体积+重量) < 1,则 Y 赋值 1# Y 值为输入数据集的标签(正确答案),这里记为 Y_Y_ = [[int(x0 + x1 < 1)] for (x0, x1) in X]# 在神经网络中,print函数是可不写的# 此处仅为了便于观察过程数据print("X:\n",X)print("Y_:\n",Y_)
2 RandomState 对象介绍
为了更为清晰地看RandomState,使用help函数打印出RandomState信息。
无论是从命名规则和帮助文档可确定RandomSate是一个类。
import numpy as nprdm = np.random.mtrand.RandomState()print(rdm)
运行
<mtrand.RandomState object at 0x00000166B6599BD0>
2.1 RandomState用途
RandomState作为Mersenne Twister伪随机数发生器的容器。
RandomState类中有许多方法,用于从各种概率分布中生成随机数。类中的每个方法都有特定于分布的参数,但所有方法中都包含有一个 'size' 参数。
- None - 生成并返回单个值
- 整数integer - 生成并返回一个生成值的1-D数组
- 元组tuple- 生成并返回一个具有该形状shape的数组。
类中的方法及其方法中的参数详见 numpy.random.mtrand.RandomState
备注:
类RandomState调用的固定的种子和系列( A fixed seed and a fixed series)等相同的参数将会产生相同的结果,也可理解为类RandomState中使用相同integer或array_like参数等固定种子将会产生相同的结果。
Python stdlib模块 “random” 还包含一个Mersenne Twister伪随机数生成器,其中有许多方法类似于`RandomState`中可用的方法。 除了NumPy感知之外,`RandomState`的优点是它提供了更多的概率分布可供选择。
2.2 类的参数
可选参数为随机种子seed(用于初始化initialize伪随机数pseudo-random number生成器igenerator),可以是0~2**32-1间的任一整数integer,或array_like(array or other sequence)的整数integers。或默认值None。
- None - 生成并返回单个值,此时RandomState将尝试从‘/dev/urandom’或windows analogue读取数据(如果可用),否则将从时钟clock读取种子seed。
- int - 生成并返回一个生成值的一维数组
- array_like - 生成并返回一个具有该形状shape的数组。
2.3 RandomState的引用方法# 两个语句等价# 可认为是简写版rdm = np.random.RandomState(SEED)# 在多场合可看到的版本rdm = np.random.mtrand.RandomState(SEED)
# 两个语句等价# 可认为是简写版rdm = np.random.RandomState(SEED)# 在多场合可看到的版本rdm = np.random.mtrand.RandomState(SEED)
在官方文档中(numpy.random.mtrand.RandomState)看到的结果。
2.4 RandomState的结果值
由于RandomState是类,所以打印不出具体结果,是对象地址
<mtrand.RandomState object at 0x00000170BB6A9AF8>
当使用RandomState类中的方法时,就可以print出具体值。但不同的方法function会得到不同的结果。
rand()方法就可以得到0~1的随机值。
import tensorflow as tfimport numpy as npSEED = 23455rdm = np.random.mtrand.RandomState(SEED)print(rdm)a = rdm.rand(32,2)print(a)
运行
<mtrand.RandomState object at 0x00000170BB6A9AF8>[[0.83494319 0.11482951] [0.66899751 0.46594987] [0.60181666 0.58838408] [0.31836656 0.20502072] [0.87043944 0.02679395] [0.41539811 0.43938369] [0.68635684 0.24833404] [0.97315228 0.68541849] [0.03081617 0.89479913] [0.24665715 0.28584862] [0.31375667 0.47718349] [0.56689254 0.77079148] [0.7321604 0.35828963] [0.15724842 0.94294584] [0.34933722 0.84634483] [0.50304053 0.81299619] [0.23869886 0.9895604 ] [0.4636501 0.32531094] [0.36510487 0.97365522] [0.73350238 0.83833013] [0.61810158 0.12580353] [0.59274817 0.18779828] [0.87150299 0.34679501] [0.25883219 0.50002932] [0.75690948 0.83429824] [0.29316649 0.05646578] [0.10409134 0.88235166] [0.06727785 0.57784761] [0.38492705 0.48384792] [0.69234428 0.19687348] [0.42783492 0.73416985] [0.09696069 0.04883936]]