1、机器学习课程day10,Contents,目,录,SVM算法原理介绍(重点)SVM损失函数介绍(重点)SVM核函数及回归SVM(重点)SVM案例数字识别器(重点),Section,章,节,SVM算法原理介绍SVM基本介绍SVM算法API初步使用SVM算法推导的目标函数SVM目标函数推导过程及举例,1.SVM算法原理介绍,1.1 视频讲解,什么是SVM?,1.SVM算法原理介绍,1.2 知识检测,1、下列关于SVM的描述错误的是?,A)它的全称为支撑向量机(Supported Vector Machine)B)它的主要任务是找到一个超平面将不同的样本划分开来C)硬间隔和软间隔都是SVM分割超平面
2、中的一种D)sklearn中的SVM模型可以通过调小C参数来减少间隔违例,答案:D。C值越小,间隔违例越多。,Section,章,节,SVM算法原理介绍SVM基本介绍SVM算法API初步使用SVM算法推导的目标函数SVM目标函数推导过程及举例,1.SVM算法原理介绍,2.1 视频讲解,SVM的API如何使用?,1.SVM算法原理介绍,2.2 知识检测,1、下列关于SVM的API使用的正确顺序是(排序):,A)实例化模型:ss=svm.SVC()B)构造样本数据:X=0,0,1,1,y=0,1C)样本预测:ss.predict(2.,2.)D)from sklearn import svmE)模
3、型训练:ss.fit(X,y),答案:DBAEC。,Section,章,节,SVM算法原理介绍SVM基本介绍SVM算法API初步使用SVM算法推导的目标函数SVM目标函数推导过程及举例,1.SVM算法原理介绍,3.1 视频讲解,SVM的实现原理是怎样的?,1.SVM算法原理介绍,3.2 知识检测,1、下列关于SVM实现原理的描述正确的是(多选):,A)SVM的分类决策函数就是它的分类超平面的代数表达式B)核函数的作用就是将特征映射到更高维度的特征空间C)离SVM分割超平面最近且满足条件的样本点叫做支撑向量D)分割间距越小SVM的分割性能越好,答案:ABC。分割间距越大代表SVM的分割性能越好。
4、,Section,章,节,SVM算法原理介绍SVM基本介绍SVM算法API初步使用SVM算法推导的目标函数SVM目标函数推导过程及举例,1.SVM算法原理介绍,4.1 视频讲解,SVM的目标函数是如何推导出来的?,1.SVM算法原理介绍,4.2 知识检测,1、下列关于SVM目标函数的推导描述错误的是:,A)目标函数带有约束条件,需要使用拉格朗日乘子法求解极值B)通过拉格朗日乘子法得到的目标函数是求解极大极小值问题C)需要通过对偶问题将目标函数转换为求解极大极小值D)最终的目标函数可转换为求解下式的极小值,答案:B。通过拉格朗日乘子法得到的目标函数是一个极小极大值问题。,Section,章,节,
5、SVM损失函数介绍SVM损失函数,2.SVM损失函数介绍,5.1 视频讲解,SVM的损失如何计算?,2.SVM损失函数介绍,5.2 知识检测,1、下列关于常见分类损失函数的描述正确的是(多选):,A)0/1损失只要样本被正确分类,损失就是0,否则损失是1B)合页损失不仅要求样本被正确分类,还要求样本离分割面的距离越大越好C)logistic损失与自然对数有关,答案:ABC。,Section,章,节,SVM核函数及回归SVMSVM的核方法介绍SVM回归介绍SVM算法API再介绍,3.SVM核函数及回归SVM,6.1 视频讲解,SVM中的核函数如何理解?,3.SVM核函数及回归SVM,6.2 知识
6、检测,1、下列关于SVM中核函数的描述错误的是:,A)引入核函数的目的就是为了解决线性不可分的问题B)核函数往往是将原始特征向更低维度的空间进行映射C)常用的核函数有线性核、高斯核、sigmoid核D)在大多数场景下,高斯核都能取得不错的效果,答案:B。应该是向更高维度映射。,Section,章,节,SVM核函数及回归SVMSVM的核方法介绍SVM回归介绍SVM算法API再介绍,3.SVM核函数及回归SVM,7.1 视频讲解,SVM如何解决回归问题?,3.SVM核函数及回归SVM,7.2 知识检测,1、下列关于回归SVM的描述错误的是:,A)SVM的思想既能解决分类问题又能解决回归问题B)回归
7、SVM是要找到这样的一条曲线尽可能的让样本分布在曲线的近距离处C)回归SVM没有间隔违例D)回归SVM需要通过超参数来调节满足条件的线距宽度,答案:C。回归SVM也有间隔违例,需要根据样本去尽量调整减少。,Section,章,节,SVM核函数及回归SVMSVM的核方法介绍SVM回归介绍SVM算法API再介绍,3.SVM核函数及回归SVM,8.1 视频讲解,SVM的API参数和各类模型如何应用?,3.SVM核函数及回归SVM,8.2 知识检测,1、下列关于SVM的API描述错误的是:,A)在众多SVM分类API中使用最广泛的是SVC、NuSVC和LinearSVCB)SVC可以指定使用不同的核函
8、数C)SVC、NuSVC和LinearSVC中都有正则化参数CD)正则化参数C越大,代表正则项惩罚越小,对误分类的惩罚越大,模型可能过拟合,答案:C。NuSVC中没有正则化参数C。,Section,章,节,SVM案例数字识别器数字识别器案例初步介绍数字识别器-获取数据数字识别器-数据基本处理及模型训练SVM总结,4.SVM案例数字识别器,9.1 视频讲解,数字识别器案例中的特征数据是怎样的?,4.SVM案例数字识别器,9.2 知识检测,1、下列关于此案例特征数据的描述正确的是(多选):,A)特征数据包含图片和标签B)图片的大小是28像素28像素C)标签是该图片对应的手写数字值D)特征数据中包含
9、的是每个像素点在图片上的索引位置,答案:BC。特征数据中没有真正的图片,只有在图片上固定位置像素点的像素值。,Section,章,节,SVM案例数字识别器数字识别器案例初步介绍数字识别器-获取数据数字识别器-数据基本处理及模型训练SVM总结,4.SVM案例数字识别器,10.1 视频讲解,数字识别器案例中的特征数据如何获取?,4.SVM案例数字识别器,10.2 知识检测,1、下列关于此案例中特征数据获取的描述正确的是(多选):,A)特征数据可用于直接表示图片样本的真实形态B)特征数据需要通过形状塑形才能表示图片样本C)分别找出特征数据和标签值是为了后期方便数据集划分D)下列两行代码是等价的:tr
10、ain_image=train.ix:,1:train_image=train.iloc:,1:,答案:BCD。原始特征数据需要经过形状处理后才能表示真实的图片样本。,Section,章,节,SVM案例数字识别器数字识别器案例初步介绍数字识别器-获取数据数字识别器-数据基本处理及模型训练SVM总结,4.SVM案例数字识别器,11.1 视频讲解,如何处理数据并训练模型?,4.SVM案例数字识别器,11.2 知识检测,1、下列关于此案例中数据处理和模型训练的描述错误的是:,A)此案例中的数据归一化处理前后对模型没有太大影响B)在进行最优参数确定时,需要保证其他参数和数据是一致的C)需要保留的主成分
11、信息量越大,PCA的耗时越多D)当前案例只使用了train.scv的数据,并没有使用test.csv中的数据,答案:A。对于类似于SVM这样的“距离型”模型,使用特征预处理能提升模型的学习效率。,Section,章,节,SVM案例数字识别器数字识别器案例初步介绍数字识别器-获取数据数字识别器-数据基本处理及模型训练SVM总结,4.SVM案例数字识别器,12.1 视频讲解,SVM有哪些优缺点?,4.SVM案例数字识别器,12.2 知识检测,1、下列关于SVM的描述正确的是(多选):,A)SVM只能用于二分类场景B)SVM在处理线性不可分问题时,使用高维空间映射特征后的效果显著C)在样本数据维度较高时也能达到很好的效果D)关于核函数的选择需要依据特定的场合去试验分析并最终确定,答案:BCD。SVM可用于二分类、多分类和回归场景,在二分类场景下的效果更加卓越。,