支持向量机分类为什么会出现分3类比分2类准确度高很多分类精度评价

2024-05-09m.verywind.com

支持向量机为什么对小样本分类精度高~

支持向量机SVM ( Support Vector Machines)是由Vanpik领导的ATTBell实验室研究小组
在1963年提出的一种新的非常有潜力的分类技术, SVM是一种基于统计学习理论的模式识别方法，主要应用于模式识别领域.由于当时这些研究尚不十分完善,在解决模式识别问题中往往趋于保守,且数学上比较艰涩,因此这些研究一直没有得到充的重视.直到90年代,一个较完善的理论体系—统计学习理论 ( StatisticalLearningTheory,简称SLT) 的实现和由于神经网络等较新兴的机器学习方法的研究遇到一些重要的困难,比如如何确定网络结构的问题、过学习与欠学习问题、局部极小点问题等,使得SVM迅速发展和完善,在解决小样本、非线性及高维模式识别问题中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中.从此迅速的发展起来，现在已经在许多领域（生物信息学，文本和手写识别等）都取得了成功的应用。
SVM的关键在于核函数，这也是最喜人的地方。低维空间向量集通常难于划分，解决的方法是将它们映射到高维空间。但这个办法带来的困难就是计算复杂度的增加，而核函数正好巧妙地解决了这个问题。也就是说，只要选用适当的核函数，我们就可以得到高维空间的分类函数。在SVM理论中，采用不同的核函数将导致不同的SVM算法
它是一种以统计学理论为基础的，以结构风险最小化的学习机学习方法，要优于神经网络学习。

通过比较原始遥感图像和经过MNF变换后的图像（图2.4）及其经过MNF＿SAM（图版1.1）、SVM（图版1.2）、MNF＿SVM（图版1.3）分类后的分类结果，可以明显地发现基于最小噪声分类的支持向量机算法（MNF＿SVM）最接近真实的地物信息，支持向量机算法的分类结果也好于光谱角制图法的分类结果。分类结果的精度是通过三种分类模型的混淆矩阵来进行计算的。MNF＿SAM分类结果的混淆矩阵见表2.2，SVM分类结果的混淆矩阵见表2.3，MNF＿SVM分类结果的混淆矩阵见表2.4。
表2.2 MNF＿SAM分类精度的混淆矩阵（单位：像元数目/％）

注：总体精度＝8472/9368＝90.44％；Kappa系数＝0.89。
表2.3 SVM分类精度的混淆矩阵（单位：像元数目/％）

注：总体精度＝8896/9368＝94.96％；Kappa系数＝0.94。
表2.4 MNF＿SVM分类精度的混淆矩阵（单位：像元数目/％）

注：总体精度＝8929/9368＝95.31％；Kappa系数＝0.95。
从表2.2～2.4中可以明显的得出，MNF ＿ SAM的总体分类精度＝8472/9368 ＝90.44％，Kappa系数＝0.89；SVM的总体分类精度＝8896/9368＝94.96％，Kappa系数＝0.94；MNF＿SVM总体分类精度＝8929/9368＝95.31％，Kappa系数＝0.95。即：(1)SVM的总体分类精度要比MNF＿SAM的总体分类精度高4.53％，Kappa系数提高0.05；(2)MNF＿SVM的总体分类精度要比MNF＿SAM的总体分类精度高4.88％，Kappa系数提高0.06；(3)MNF＿SVM的总体分类精度要比SVM的总体分类精度高0.35％，Kappa系数提高0.01。
MNF＿SAM分类结果显示树木和草地的地物分类有许多错误的分类点，在SVM的分类结果图中也有类似的错误，而它的错误信息要比MNF＿SAM分类图少；但是这种现象在MNF＿SVM分类图中虽然也存在，但是错误量极少。尽管MNF＿SVM的分类方法不能做到百分之百的分类正确性，但是相对于MNF＿SAM和SVM，不失为一种很好的分类方法，在三种分类方法中是最佳的一种。
由此可见，无论从总体分类考虑还是具体地物类别考虑，MNF＿SVM方法和SVM方法分类精度都高于MNF＿SAM方法，这说明了SVM方法在高光谱影像分类中有着突出表现，同时MNF＿SVM方法比SVM方法有更好的表现，其原因主要是因为MNF ＿SVM方法在分类前经过了MNF变换，去除了噪音波段，对原始信息进行了优化处理，选择了有效的特征信息参加分类，这不仅可以降低高光谱数据的维数，还可以在一定程度上克服Hughes现象，最终达到了高维信息的数据降维和高效利用以及高精度分类的目的。

分类问题和回归问题都要根据训练样本找到一个实值函数g(x). 回归问题的要求是：给定一个新的模式，根据训练集推断它所对应的输出y（实数）是多少。也就是使用y=g(x)来推断任一输入x所对应的输出值。分类问题是：给定一个新的模式，根据训练集推断它所对应的类别（如：+1，-1）。也就是使用y=sign(g(x))来推断任一输入x所对应的类别。综上，回归问题和分类问题的本质一样，不同仅在于他们的输出的取值范围不同。分类问题中，输出只允许取两个值；而在回归问题中，输出可取任意实数。

支持向量机分类为什么会出现分3类比分2类准确度高很多

答：综上，回归问题和分类问题的本质一样，不同仅在于他们的输出的取值范围不同。分类问题中，输出只允许取两个值；而在回归问题中，输出可取任意实数。

多类支持向量分类

答：这种分类方案存在一个明显的缺点，就是子分类器过多，测试时需要对每两类都进行比较，导致测试速度慢。它的优点在于，对训练结果的推广性进行了分析。另外，它的测试速度比一般的方案要快。（3）支持向量机决策树它通常和...

支持向量机—从推导到python手写

答：支持向量机分为三类: (1)线性可分支持向量机,样本线性可分,可通过硬间隔最大化训练一个分类器。 (2)线性支持向量机,样本基本线性可分,可通过软间隔最大化训练一个分类器。 (3)非线性支持向量机,样本线性不可分,可通过核函数和...

支持向量机分为哪三个超平面

答：支持向量机分为分类超平面、间隔最大化和凸二次规划三个超平面。分类超平面是最基础也最典型的支持向量机，要求所有样本都必须被正确地划分到各自所属类别中。在此基础上发展出了间隔最大化方法，该方法旨在找到一个能够使得...

支持向量机的基本原理

答：3、用于手写字体识别。4、用于医学中分类蛋白质，超过90%的化合物能够被正确分类。基于支持向量机权重的置换测试已被建议作为一种机制，用于解释的支持向量机模型。支持向量机权重也被用来解释过去的SVM模型。为识别模型用于进行...

支持向量机(SVM)

答：支持向量机(support vector machine),故一般简称SVM,通俗来讲,它是一种二分类模型,其基本模型定义为特征空间上的间隔最大的线性分类器,这族分类器的特点是他们能够同时最小化经验误差与最大化几何边缘区,因此支持向量机也被称为最大边...

支持向量机分类法

答：结合二分类问题，可以通过线性超平面把给定数据集划分成两类，如图2.2（b）所示。因此，支持向量机针对两种感兴趣区域的最大边缘，并在它们之间设置了一个线性分离超平面，以此拓展到高维空间线性分离超平面发展成为最优分离...

支持向量机(SVM)基本原理

答：通过 Kernel 推广到非线性的情况就变成了一件非常容易的事情了(通过求解对偶问题得到最优解,这就是线性可分条件下支持向量机的对偶算法,这样做的优点在于:一者对偶问题往往更容易求解;二者可以自然的引入核函数,进而推广到非线性分类问题...

支持向量机请通俗介绍高中文化

答：超级通俗的解释：支持向量机是用来解决分类问题的。先考虑最简单的情况，豌豆和米粒，用晒子很快可以分开，小颗粒漏下去，大颗粒保留。用一个函数来表示就是当直径d大于某个值D，就判定为豌豆，小于某个值就是米粒。d>D,...

支持向量机

答：支持向量机属于一般化线性分类器,这类分类器的特点是能够同时最小化经验误差与最大化几何边缘区,因此支持向量机机也被称为最大边缘区分类器。蓝色和红色的线圈出来的点就是所谓的支持向量,离分界线最近的点,如果去掉这些点,直线多半...

支持向量机分类为什么会出现分3类比分2类准确度高很多 分类精度评价

相关主题

支持向量机分类为什么会出现分3类比分2类准确度高很多分类精度评价