如何在PyBrain中使用sklearn导入数据集
在本教程中,我们将解释如何在PyBrain中使用Sklearn导入数据集。
数据集可以被描述为可以用于测试、验证和训练网络的数据集合。相比较更灵活的数组,数据集被认为更灵活且更易于使用。数据集类似于一个二维数组。数据集用于执行机器学习任务。
本教程所需的库:
- sklearn
- Pybrain
安装这些库的语法:
!pip3 install sklearn pybrain
示例1
在这个示例中,首先,我们从sklearn库中导入了datasets包和 ClassificationDataset 从 pybrain.datasets 。之后,我们加载了数字数据集。在下一行中,我们将定义特征变量和目标变量。然后,我们通过创建64个输入、1个输出以及15个类别的分类算法来对数据集进行分类。然后,我们向我们创建的数据集添加信息。
代码:
# First we will import the libraries
from sklearn import datasets as DS
from pybrain.datasets import ClassificationDataSet as CDS
# Here, we will load the digits
loaded_digits1 = DS.load_digits()
# Now, we will set the data items
Q_data, P_data = loaded_digits1.data, loaded_digits1.target
# now, we will upload the Classification dataset
dataset1 = CDS(64, 1, nb_classes=15)
# Now, we will perform the Iterations over the length of Q
for k in range(len(Q_data)):
dataset1.addSample(Q_data[k], P_data[k])
# Print the dataset
print(dataset1)
输出:
示例2
在这个示例中,首先,我们从sklearn库导入了datasets包,从pybrain.datasets中导入了ClassificationDataset。之后,我们加载了Iris数据集。在接下来的一行中,我们将定义特征变量和目标变量。然后,我们通过定义四个输入、一个输出和两个类别来创建一个用于分类数据集的算法。之后,我们向新创建的数据集中添加数据。
代码:
# First we will import the libraries
from sklearn import datasets as DS
from pybrain.datasets import ClassificationDataSet as CDS
# Here, we will load the iris
loaded_digits1 = DS.load_iris()
# Now, we will set the data items
Q_data, P_data = loaded_digits1.data, loaded_digits1.target
# now, we will create the Classification dataset
dataset1 = CDS(4, 1, nb_classes=2)
# Now, we will perform the Iterations over the length of Q
for k in range(len(Q_data)):
dataset1.addSample(Q_data[k], P_data[k])
# Print the dataset
print(dataset1)
输出:
结论
在本教程中,我们讨论了如何使用PyBrain中的sklearn库导入各种数据集。