PCA,如何使用主成分分析
PCA,如何使用主成分分析?
主成分分析(Principal Component Analysis,PCA), 是一种统计方法。通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分。
PCA的思想是将n维特征映射到k维上(k<n),这k维是全新的正交特征。这k维特征称为主成分,是重新构造出来的k维特征,而不是简单地从n维特征中去除其余n-k维特征。
一、概念
协方差是衡量两个变量同时变化的变化程度。PCA的思想是将n维特征映射到k维上(k<n),这k维是全新的正交特征。这k维特征称为主成分,是重新构造出来的k维特征,而不是简单地从n维特征中去除其余n-k维特征。
协方差是衡量两个变量同时变化的变化程度。协方差大于0表示x和y若一个增,另一个也增;小于0表示一个增,一个减。如果x和y是统计独立的,那么二者之间的协方差就是0;但是协方差是0,并不能说明x和y是独立的。协方差绝对值越大,两者对彼此的影响越大,反之越小。协方差是没有单位的量,因此,如果同样的两个变量所采用的量纲发生变化,它们的协方差也会产生树枝上的变化。
协方差矩阵:
二、过程和举例
1.特征中心化。即每一维的数据都减去该维的均值。这里的“维”指的就是一个特征(或属性),变换之后每一维的均值都变成了0。
现在假设有一组数据如下:
2.每一列减去该列均值后,得到矩阵B,
3.求特征协方差矩阵,如果数据是3维,那么协方差矩阵是
这里只有x和y,求解得
4.计算协方差矩阵C的特征值和特征向量,得到
上面是两个特征值,下面是对应的特征向量,特征值0.0490833989对应特征向量为,这里的特征向量都归一化为单位向量。
5.将特征值按照从大到小的顺序排序,选择其中最大的k个,然后将其对应的k个特征向量分别作为列向量组成特征向量矩阵。
这里特征值只有两个,我们选择其中最大的那个,这里是1.28402771,对应的特征向量是(-0.677873399, -0.735178656)T。
6.将样本点投影到选取的特征向量上。假设样例数为m,特征数为n,减去均值后的样本矩阵为DataAdjust(m*n),协方差矩阵是n*n,选取的k个特征向量组成的矩阵为EigenVectors(n*k)。那么投影后的数据FinalData为
FinalData(10*1) = DataAdjust(10*2矩阵) x 特征向量(-0.677873399, -0.735178656)T
得到的结果是
这样,就将原始样例的n维特征变成了k维,这k维就是原始特征在k维上的投影。
上面的数据可以认为是learn和study特征融合为一个新的特征叫做LS特征,该特征基本上代表了这两个特征。原本数据是10行2列*2行1列(取最大的特征值对应的特征向量)=10行1列的数据。
可以参考:http://www.cnblogs.com/zhangchaoyang/articles/2222048.html
三、总结
降维的目的:
1.减少预测变量的个数
2.确保这些变量是相互独立的
3.提供一个框架来解释结果
降维的方法有:主成分分析、因子分析、用户自定义复合等。
PCA(Principal Component Analysis)不仅仅是对高维数据进行降维,更重要的是经过降维去除了噪声,发现了数据中的模式。
PCA把原先的n个特征用数目更少的m个特征取代,新特征是旧特征的线性组合,这些线性组合最大化样本方差,尽量使新的m个特征互不相关。从旧特征到新特征的映射捕获数据中的固有变异性。
pca是什么化学物质?
pca是吡咯烷酮羧酸钠,吡咯烷酮羧酸钠(即PCA-Na)
pcm1702芯片怎么样?
PCm1702音频功放芯片,可以支持互联网高质量音频实时传送。PCm1702芯片是一款经典的音频功放芯片。
兰蔻男士洗面奶成分?
水、月桂醇聚醚硫酸酯钠、聚乙二醇-8、椰油基甜菜碱、鲸蜡硬脂醇聚醚-60 肉豆蔻基甘醇、己二醇、PEG-150 二硬脂酸酯、氯化钠、氢氧化钠、柠檬酸、苯氧乙醇、香精、苯甲酸、羟丙基瓜儿胶羟丙基三甲基氯化铵、二苯酮-4、EDTA 二钠
使用方法
每日早/晚,用温水润湿面部后,取适量产品加水揉搓产生泡沫,均匀涂抹于面部肌肤,随后以温水冲洗干净。
注意事项:
香精中含有芳樟醇。
【贮存条件】
常温
试设计一滚筒带式输送机的普通v带传动装置?
(1)确定计算功率,得工况系数KA=1.2,故有Pca=KAP=1.2×7kw=8.4kW (2)选择V带型号,根据Pca=8.4kW,n1=960r/min,选用B型。
(3)确定带轮直径并验算带速,初选小带轮基准直径dd1180mm。验算带速:v=m/s=9.05m/s,在5m/s~30m/s之间,故带速合适。取滑动率ε=0.02,可得大带轮的直径:dd2=mm=513.2mm故圆整dd2=500mm。减速器实际转速:n2=r/min=338.7r/min误差:δ=×100%=2.6%<5%故dd1=180mm,dd2=500mm合适。(4)确定中心距和基准长度根据0.7(dd1+dd2)≤a0≤2(dd1+dd2),初定中心距a0=550mm。计算带的基准长度:Ld0=2a0+mm=2214.2mm取基准长度Ld=2240mm。实际中心距为:a=a0+mm=562.9mm圆整中心距为:a=560mm。(5)验算小带轮包角α1=180°-×57.3°=147.3°>120°,合适。(6)计算V带根数由dd1=180mm,则单根V带的额定功率:Pr=(P0+△P0)?Kα?KL=(3.25+0.30)×0.914×1.00kW=3.245kW故根数z==2.6,取3根。(7)计算单根V带上的初拉力最小值:B型带的单位长度质量q=0.18ks/m,则有: (8)计算压轴力:(Fp)min=2z(F0)minsin=2×3×283×sinN=1628N。