numpy random multinomial 多项式分布 函数入门介绍

NumPy是一个开源的Python科学计算库,我们在之前的文章中已经对其做了基本的介绍,而且也对numpy的数据结构、基础函数等做了入门的讲解。

numpy random是其很重要的一个模块,在此模块中有很多有实际应用价值的函数,每个函数都会对应一个或者多个数学场景。本篇旨在介绍其中的一个关于多项式分布取样本的函数– multinomial

1、multinomial介绍

numpy.random.multinomial(npvalssize=None)

  • n : int:实验次数
  • pvals:浮点数序列,长度p。P个不同结果的概率。这些值应该和为1(但是,只要求和(pvals[:-1])<=1,最后一个元素总是被假定为考虑剩余的概率)。
  • size : int 或 int的元组,可选。 输出形状。如果给定形状为(m,n,k),则绘制 mnk 样本。默认值为无,在这种情况下返回单个值。

返回值: ndarray,每个条目 [i,j,…,:] 都是从分布中提取的一个n维值。

多项式分布,从多项式分布中提取样本。

多项式分布是二项式分布的多元推广。做一个有P个可能结果的实验。这种实验的一个例子是掷骰子,结果可以是1到6。从分布图中提取的每个样本代表n个这样的实验。其值x_i = [x_0,x_1,…,x_p] 表示结果为i的次数。

2、实例介绍

官方文档中已经给出了非常简洁易懂的实例,我们直接拿过来摆一下。这个实例就是掷骰子

场景描述:我们知道骰子一共是6面,每个面代表一个数字,分别是1、2、3、4、5、6.我们每次抛骰子得到的数字公概率上来讲都是等概率的1/6;那么我们做一组实验,抛20次骰子得到的样本会是什么样的呢?通过 numpy.random.multinomial 函数将此场景再现出来就是以下代码:

>>> np.random.multinomial(20, [1/6.]*6, size=1)
array([[4, 1, 7, 5, 2, 1]])

以上的代码和结果输出表示的是:我们得到数字是1的次数是4次,得到2的次数是1词,得到3的次数是7次,以此类推。

返回值的数字表示样本值的次数,而对应数字的数组索引位置表示的是实际的值

如果我们循环来对同一场景做多次样本实验呢?

for i in range(4):
    a =np.random.multinomial(20, [1/6.]*6, size=1)
    print(a)

#[[2 6 3 5 3 1]]
#[[4 4 1 3 4 4]]
#[[0 4 3 5 2 6]]
#[[4 3 2 5 3 3]]

我们可以看出每次的实验结果都是不一样的。这也体现了实际情况下有限实现取样的随机性。

多次取样在官方实验的代码demo是通过参数来控制的。

>>> np.random.multinomial(20, [1/6.]*6, size=2)
array([[3, 4, 3, 3, 4, 3],
       [2, 4, 3, 4, 0, 7]])

size在这个地方跟我们通过循环多次实验是一样的效果。

numpy array functions 数组操作的基本函数入门(一)

NumPy 是 Python 科学计算的基础包。之前的文章中我们也numpy的数据类型,基本结构做了入门的讲解,本篇开始介绍numpy 数组相对应的操作函数。

NumPy 包含大量的各种数学运算的函数,包括三角函数,算术运算的函数,复数处理函数等。

三角函数

    # 标准的三角函数:sin()、cos()、tan();
    # arcsin,arccos,和 arctan 函数返回给定角度的 sin,cos 和 tan 的反三角函数。
    # 函数的结果可以通过 numpy.degrees() 函数将弧度转换为角度
    a = np.array([0, 30, 45, 60, 90])
    print("a = ", a)
    print("正弦: np.sin(a * np.pi /180) = ", np.sin(a * np.pi/180))
    print("余弦: np.cos(a * np.pi / 180) = ", np.cos(a * np.pi / 180))
    sin = np.sin(a * np.pi/180)
    inv = np.arcsin(sin)
    print("sin = np.sin(a * np.pi/180)", "\n", "inv = np.arcsin(sin)")
    print("反正弦(弧度):np.arcsin(sin) = ", inv)
    deg = np.degrees(inv)
    print("角度:np.degrees(inv) ", deg)
输出的结果:
a =  [ 0 30 45 60 90]
正弦: np.sin(a * np.pi /180) =  [0.         0.5        0.70710678 0.8660254  1.        ]
余弦: np.cos(a * np.pi / 180) =  [1.00000000e+00 8.66025404e-01 7.07106781e-01 5.00000000e-01
 6.12323400e-17]
sin = np.sin(a * np.pi/180) 
 inv = np.arcsin(sin)
反正弦(弧度):np.arcsin(sin) =  [0.         0.52359878 0.78539816 1.04719755 1.57079633]
角度:np.degrees(inv)  [ 0. 30. 45. 60. 90.]

舍入函数

    # numpy.around(a,decimals) 函数返回指定数字的四舍五入值。
    # a: 数组
    # decimals: 舍入的小数位数。 默认值为0。 如果为负,整数将四舍五入到小数点左侧的位置
    a = np.array([1.0, 5.55, 123, 0.567, 25.532])
    print("原始 a = ", a)
    print("np.around(a, decimals=1) = ", np.around(a, decimals=1))
    print("np.around(a, decimals=-1) = ", np.around(a, decimals=-1))

    # numpy.floor() 返回小于或者等于指定表达式的最大整数,即向下取整。
    # numpy.ceil() 返回大于或者等于指定表达式的最小整数,即向上取整。
    a = np.array([-1.7, 1.5, -0.2, 0.6, 10])
    print('提供的数组:', a)
    print('np.floor(a) = ', np.floor(a))
    print("np.ceil(a) = ", np.ceil(a))
输出结果:
原始 a =  [  1.      5.55  123.      0.567  25.532]
np.around(a, decimals=1) =  [  1.    5.6 123.    0.6  25.5]
np.around(a, decimals=-1) =  [  0.  10. 120.   0.  30.]
提供的数组: [-1.7  1.5 -0.2  0.6 10. ]
np.floor(a) =  [-2.  1. -1.  0. 10.]
np.ceil(a) =  [-1.  2. -0.  1. 10.]
a = np.arange(9, dtype=np.float_).reshape(3, 3)
b = np.array([10., 5., 1.])

算术函数

    # 算术函数包含简单的加减乘除: add(),subtract(),multiply() 和 divide()。
    a = np.arange(9, dtype=np.float_).reshape(3, 3)
    b = np.array([10., 5., 1.])
    print("a = np.arange(9, dtype=np.float_).reshape(3, 3)")
    print("b = np.array([10., 5., 1.])")
    print("a = ", a)
    print("np.add(a, b) = ", np.add(a, b))
    print("np.subtract(a, b) =", np.subtract(a, b))
    print("np.multiply(a, b) = ", np.multiply(a, b))
    print("np.divide(a, b) = ", np.divide(a, b))

    # numpy.reciprocal() 函数返回参数逐元素的倒数。如 1/4 倒数为 4/1。
    # numpy.power() 函数将第一个输入数组中的元素作为底数,计算它与第二个输入数组中相应元素的幂
    print("np.reciprocal(b) = ", np.reciprocal(b))
    a = np.array([10, 100, 1000])
    print("a = np.array([10,100,1000])")
    print("np.power(a, 2) = ", np.power(a, 2))

    # numpy.mod()/numpy.remainder()  计算输入数组中相应元素的相除后的余数
    a = np.array([10, 20, 30])
    b = np.array([3, 5, 7])
    print("np.mod(a, b) = ", np.mod(a, b))
    print("np.remainder(a, b) = ", np.remainder(a, b))
输出结果:
a = np.arange(9, dtype=np.float_).reshape(3, 3)
b = np.array([10., 5., 1.])
a =  [[0. 1. 2.]
 [3. 4. 5.]
 [6. 7. 8.]]
np.add(a, b) =  [[10.  6.  3.]
 [13.  9.  6.]
 [16. 12.  9.]]
np.subtract(a, b) = [[-10.  -4.   1.]
 [ -7.  -1.   4.]
 [ -4.   2.   7.]]
np.multiply(a, b) =  [[ 0.  5.  2.]
 [30. 20.  5.]
 [60. 35.  8.]]
np.divide(a, b) =  [[0.  0.2 2. ]
 [0.3 0.8 5. ]
 [0.6 1.4 8. ]]
np.reciprocal(b) =  [0.1 0.2 1. ]
a = np.array([10,100,1000])
np.power(a, 2) =  [    100   10000 1000000]
np.mod(a, b) =  [1 0 2]
np.remainder(a, b) =  [1 0 2]

numpy index slicing 数组的切片和索引 numpy数组初恋

之前numpy 数组创建的文章中我们介绍了数组的创建入门,本篇我们旨在简单介绍数组的基本操作–定向定点的取值,ndarray对象的内容可以通过索引或切片来访问和修改,与 Python 中 list 的切片操作一样。

ndarray 数组可以基于 0 – n 的下标进行索引,切片对象可以通过内置的 slice 函数,并设置 start, stop 及 step 参数进行,从原数组中切割出一个新数组。

基本索引

    # 一维数组切片
    a = np.arange(10)
    s = slice(2, 7, 2)  # 从索引 2 开始到索引 7 停止,间隔为2
    print("a = ", a)
    print("s = slice(2, 7, 2) # 从索引 2 开始到索引 7 停止,间隔为2")
    print("a[s] = ", a[s])
    print("a[2:7:2] = ", a[2:7:2])
    print("a[2:7] = ", a[2:7])
    print("a[2:] = ", a[2:] )
    print("a[2] = ", a[2])
a =  [0 1 2 3 4 5 6 7 8 9]
s = slice(2, 7, 2) # 从索引 2 开始到索引 7 停止,间隔为2
a[s] =  [2 4 6]
a[2:7:2] =  [2 4 6]
a[2:7] =  [2 3 4 5 6]
a[2:] =  [2 3 4 5 6 7 8 9]
a[2] =  2
    # 多维数组
    a = np.array([[1, 2, 3], [3, 4, 5], [4, 5, 6]])
    print("a = ", a)
    print("a[::-1] = ", a[::-1])
    print("a[:, ::-1] = ", a[:, ::-1])
    print("a[...,1] = ", a[..., 1])
    print("a[1,...] = ", a[1, ...])
    print("a[...,1:] = ", a[..., 1:])
a =  [[1 2 3]
 [3 4 5]
 [4 5 6]]
a[::-1] =  [[4 5 6]
 [3 4 5]
 [1 2 3]]
a[:, ::-1] =  [[3 2 1]
 [5 4 3]
 [6 5 4]]
a[...,1] =  [2 4 5]
a[1,...] =  [3 4 5]
a[...,1:] =  [[2 3]

花里胡哨索引

    # 数组索引
    print("a[[0, 1, 2], [0, 1, 0]] =", a[[0, 1, 2], [0, 1, 0]])
    x = np.array([[0, 1, 2], [3, 4, 5], [6, 7, 8], [9, 10, 11]])
    print('我们的数组是x:', x)
    rows = np.array([[0, 0], [3, 3]])
    cols = np.array([[0, 2], [0, 2]])
    print("x[rows, cols] = ", x[rows, cols])
    # 布尔索引
    print("x[x > 3] = ", x[x> 3])
a[[0, 1, 2], [0, 1, 0]] = [1 4 4]
我们的数组是x: [[ 0  1  2]
 [ 3  4  5]
 [ 6  7  8]
 [ 9 10 11]]
x[rows, cols] =  [[ 0  2]
 [ 9 11]]
x[x > 3] =  [ 4  5  6  7  8  9 10 11]