支持向量机学习算法 机器学习算法中的SVM和聚类算法
有现成的库啊。你看看sk learn这个,里面有自带数据集和算法,使用很方便。里面支持向量机分为支持向量机回归SVR和支持向量机分类SVC
相信大家都知道,机器学习中有很多的算法,我们在进行机器学习知识学习的时候一定会遇到过很多的算法,而机器学习中的SVM算法和聚类算法都是比较重要的,我们在这篇文章中就重点给大家介绍一下这两种算法,希望这篇文章能够帮助大家理解这两种算法。
机器学习算法——SVM
提道机器学习算法就不得不说一说SVM,这种算法就是支持向量机,而支持向量机算法是诞生于统计学习界,这也是机器学习中的经典算法,而支持向量机算法从某种意义上来说是逻辑回归算法的强化,这就是通过给予逻辑回归算法更严格的优化条件,支持向量机算法可以获得比逻辑回归更好的分类界线。不过如果通过跟高斯核的结合,支持向量机可以表达出非常复杂的分类界线,从而达成很好的的分类效果。核事实上就是一种特殊的函数,最典型的特征就是可以将低维的空间映射到高维的空间。
于是问题来了,如何在二维平面划分出一个圆形的分类界线?其实我们在二维平面可能会很困难,但是通过核可以将二维空间映射到三维空间,然后使用一个线性平面就可以达成类似效果。也就是说,二维平面划分出的非线性分类界线可以等价于三维平面的线性分类界线。接着,我们可以通过在三维空间中进行简单的线性划分就可以达到在二维平面中的非线性划分效果。而支持向量机是一种数学成分很浓的机器学习算法。在算法的核心步骤中,有一步证明,即将数据从低维映射到高维不会带来最后计算复杂性的提升。于是,通过支持向量机算法,既可以维持计算效率,又可以获得非常好的分类效果。因此支持向量机在90年代后期一直占据着机器学习中最核心的地位,基本取代了神经网络算法。
机器学习算法——聚类算法
说完了SVM,下面我们给大家介绍一下聚类算法,前面的算法中的一个显著特征就是我的训练数据中包含了标签,训练出的模型可以对其他未知数据预测标签。在下面的算法中,训练数据都是不含标签的,而算法的目的则是通过训练,推测出这些数据的标签。这类算法有一个统称,即无监督算法。无监督算法中最典型的代表就是聚类算法。而聚类算法中最典型的代表就是K-Means算法。这一算法被广大朋友所应用。
现在,我们可以清楚认识到机器学习是一个综合性很强的学科。在这篇文章中我们给大家介绍了很多关于机器学习中的支持向量机和聚类算法的相关知识,通过这些知识我们不难发现机器学习中有很多有用的算法,熟练掌握这些算法是我们真正学会机器学习的必经之路。
支持向量机学习算法主要有以下五种:
(1)获取学习样本(xi,yi),i=1,2…,其中xi∈Rn,y∈任 {1,-1}l,对样本进行预处理;
(2)选择进行非线性变换的核函数及对错分(误差)进行惩罚的惩罚因子c;
(3)形成二次优化问题用优化方法(如:Chuknlng算法、内点算法、SMO算法);
(4)获得a,a*及b0的值,代入方程中,获得分类或函数拟合的支持向量机;
(5)将需预测或分类的数据代入支持向量机方程中获得结果。
基坑降水环境影响评价参数选取降水方式、岩土性质、水文地质边界、基坑侧壁状态、边载分布、后续使用年限、基础型式、差异沉降8级,目标输出模式对应4个级别:优等级(Ⅰ)、良好级(Ⅱ)、中等级(Ⅲ)、差级(Ⅳ)。
用一对多多类支持向量机水质分类法:有四类等级要划分,于是在抽取训练集的时候,分别抽取I所对应的向量作为正集,其余所对应的向量作为负集;Ⅱ所对应的向量作为正集,其余所对应的向量作为负集……,这四个训练集分别进行训练得到四个分类器。然后,利用这四个训练结果文件对测试集分别进行测试,最后每个测试都有一个结果,最终的结果便是这四个值中最大的一个。
利用支持向量机进行基坑降水环境影响评价就是寻找影响基坑降水环境系统和孕灾环境系统的指标和基坑降水环境影响等级之间的关系,可建立以下四个分类函数:
基坑降水工程的环境效应与评价方法
相关主题
-
相关链接: