Numpy 快速生成1000000个以上的随机数

在Python中，生成随机数是一个常见的操作，可以用于许多应用场景，例如随机化数据集、模拟随机事件和生成随机的密钥等等。Python自带的random库是生成随机数非常常用的一个工具，但是它的速度无法满足大量数据生成的需求。在这种情况下，我们可以考虑使用Numpy来生成随机数。

Numpy是Python中常用的数值计算库，它包含了丰富的数学函数和高效的矩阵计算方法。Numpy库不仅可以用于数组操作、数学计算、线性代数、随机数生成，还可以用于图像处理、机器学习等领域，因此它被广泛应用于科学计算和数据分析。

阅读更多：Numpy 教程

使用Numpy生成随机数

要使用Numpy生成随机数，我们需要调用Numpy中的random模块。可以通过以下代码导入：

import numpy as np

np.random.seed(0) # 设置随机数种子，保证每次生成的随机数一样

随机数生成常用的有以下几个方法：

np.random.rand()

该方法用于生成0到1之间的均匀分布随机数。我们可以通过为该方法传递相应的参数即可获得任意形状、任意范围、均匀分布的随机数。

例如生成形状为(3,3)的随机数矩阵：

random_matrix = np.random.rand(3,3)

print(random_matrix)
# 输出：
# [[0.5488135  0.71518937 0.60276338]
#  [0.54488318 0.4236548  0.64589411]
#  [0.43758721 0.891773   0.96366276]]

np.random.randn()

该方法用于生成标准正态分布随机数。我们可以通过为该方法传递相应的参数即可获得任意形状、任意范围、标准正态分布的随机数。

例如生成形状为(3,3)的标准正态分布随机数矩阵：

random_matrix = np.random.randn(3,3)

print(random_matrix)
# 输出：
# [[ 0.66278767  0.05117344 -0.26151326]
#  [-1.07081685  0.14774876 -0.72512338]
#  [ 0.96953739  0.29991348 -0.01777179]]

np.random.randint()

该方法用于生成指定范围内的整数随机数。我们可以通过为该方法传递相应的参数即可获得任意形状、任意范围、整数的随机数。

例如生成0到9之间的随机数：

random_int = np.random.randint(0,10)
print(random_int)
# 输出：
# 5

如果需要生成有多个元素的随机数向量，只需要指定向量的长度即可。

例如生成10个0到9之间的随机数：

random_vector = np.random.randint(0,10,10)

print(random_vector)
# 输出：
# [6 7 8 1 5 9 8 9 4 3]

np.random.choice()

该方法用于从给定的列表或数组中生成随机数。

例如从给定的列表[1,2,3,4,5]中随机选择一个数：

random_num = np.random.choice([1,2,3,4,5])

print(random_num)
# 输出：
# 2

如果需要生成有多个元素的随机数向量，只需要指定向量的长度即可。

例如从给定的列表[1,2,3,4,5]中随机选择3个数：

random_vector = np.random.choice([1,2,3,4,5], 3)

print(random_vector)
# 输出：
# [4 2 1]

np.random.shuffle()

该方法用于将给定的列表或数组打乱顺序。注意，该方法修改了原有的列表或数组。

例如将给定的列表[1,2,3,4,5]打乱顺序：

arr = [1,2,3,4,5]

np.random.shuffle(arr)

print(arr)
# 输出：
# [3, 5, 2, 4, 1]

利用Numpy生成大量随机数

由于Numpy库的高效性，在需要生成大量随机数时，Numpy库往往能够提供更好的性能表现。下面我们可以通过比较使用Python内置random库和Numpy库生成大量随机数的效率来证明这一点。

Python内置random库

以下是使用Python内置random库生成1000000个随机数的代码：

import random
import time

random_list = []

start_time = time.time()

for i in range(1000000):
    random_list.append(random.randint(0, 100))

end_time = time.time()

print("Total Time: ", end_time - start_time)

输出结果如下：

Total Time:  0.2947404384613037

Numpy库

以下是使用Numpy库生成1000000个随机数的代码：

import numpy as np
import time

np.random.seed(0)

start_time = time.time()

random_list = np.random.randint(0, 100, 1000000)

end_time = time.time()

print("Total Time: ", end_time - start_time)

输出结果如下：