机器学习基础 互动版

在线工具推荐: Three.js AI纹理开发包 - YOLO合成数据生成器 - GLTF/GLB在线编辑 - 3D模型格式在线转换 - 可编程3D场景编辑器

交叉选择验证法

交叉选择验证法是从数据集中按一定比例随机选取若干数据集作为训练集用于模型的训练,并将剩下的数据作为测试集。将测试集数据的自变量输入模型,并将模型输出的预测值与对应数据的因变量进行比较,判断并统计准确率的方法。

from sklearn import datasets            #鸢尾花数据集被sklearn的datasets所包含,需要引用
from sklearn.cross_validation import train_test_split
from sklearn.svm import SVC
from numpy import *

iris_dataset = datasets.load_iris();    #加载鸢尾花数据集    
iris_data = iris_dataset.data;            
iris_target = iris_dataset.target;
x_train,x_test,y_train,y_test = train_test_split(iris_data,iris_target,test_size=0.2);
'''
将鸢尾花数据iris_data分成训练集x_train和测试集x_test
将鸢尾花种类iris_target分成训练集y_train和测试集y_test
test_size=0.2,测试集数据占总数据的0.2倍
'''
示例代码:svm-cross-validate.py