Excel 生成随机样本
前言
在数据分析和统计学中,我们常常需要使用随机样本来进行数据分析和模型建立。Excel中自带了多种随机数函数,可以方便地生成随机样本,本文将介绍Excel中较为常用的两种随机数函数:RAND和RANDBETWEEN。
RAND()函数
RAND()函数是Excel中内置的随机数函数,它可以生成介于0和1之间的伪随机数。使用该函数可以生成任意大小的随机数据。下面是一个简单的例子:
=RAND()
单元格中出现的数值即为一个伪随机数。该数值可能是小数或分数,也可以按科学计数法显示。当我们需要生成多个随机数时,只需要拖动函数到其他单元格即可。
但是,使用RAND()函数生成的随机数是伪随机数,它们不是真正的随机数,因为它们的产生是根据一个特定的算法进行计算的。如果需要生成更随机的数据,可以考虑使用RANDBETWEEN()函数。
RANDBETWEEN()函数
RANDBETWEEN()函数是Excel中另一个常用的随机数函数,它可以根据指定的范围生成一个整数随机数。语法如下:
=RANDBETWEEN(bottom, top)
其中,bottom和top分别是所需的随机数范围的下界和上界。下面是一个简单的例子:
这里的随机数范围是1到100,所以函数会返回1~100的随机整数。同样地,我们可以拖动该函数到其他单元格来生成多个随机数。
注意,RANDBETWEEN()函数可以生成整数随机数,但不包括top所指定的数值(即top是闭区间,bottom是开区间)。因此,在使用时需要注意。
另外,RANDBETWEEN()函数只能生成整数随机数,如果需要生成小数随机数,我们可以使用如下方法:
=RAND() * (max-min) + min
其中,max和min分别为所需随机数的上界和下界。下面是一个例子:
此方法和RANDBETWEEN()函数不同的是,它生成的是小数随机数。同样地,我们可以将该函数拖动到其他单元格以生成多个小数随机数。
抽样
使用Excel生成随机样本时,除了需要生成随机数外,还需要进行抽样。在Excel中进行抽样通常有两种方式:使用随机排列和使用筛选器,下面分别介绍。
通过随机排列进行抽样
随机排列是一种简单有效的抽样方式。它的主要原理是将所需样本随机地从总体中选出。下面是一个简单的例子:
假设我们有一个数据源,包含10个数值,将这10个数值抽样成5个数值:
首先,我们需要添加一个列来表示随机数,使用RAND()函数即可:
然后,我们需要将这些随机数排序。使用Excel的排序功能即可,将随机数列排序,之后将前5行的数值作为抽样后的样本即可。下面是整个的操作:
在这个例子中,我们将通过随机排列的方式抽样5个数值。
通过筛选器进行抽样
使用筛选器进行抽样也是一种常用的方法。它的主要原理是使用Excel筛选器筛选随机数,并选取前N行作为样本。下面是一个简单的例子:
假设我们有一个数据源,包含10个数值,将这10个数值抽样成5个数值:
首先,我们需要添加一个列来表示随机数,使用RAND()函数即可:
接下来,我们需要使用筛选器来选取前5个数值。选中整个数据源,然后打开筛选器:
在随机数列中选择:数字筛选 > 小于或等于 > 0.5即可。这里的0.5是一个随机选取的数值,我们可以根据需要进行调整。
筛选后即可得到所需的5个随机数值:
在这个例子中,我们将通过筛选器的方式抽样5个数值。
结论
使用Excel可以方便地生成随机样本,常用的随机数函数和抽样方式即为RAND()函数和RANDBETWEEN()函数以及随机排列和使用筛选器。当我们需要在数据分析和模型建立中使用随机样本时,Excel是一个值得考虑的工具。