C++之点点滴滴
记录C++语法的点点滴滴
主成分分析(Principle Component Analysis, PCA)和独立成分分析(Independent Components Analysis, ICA),是目前应用最为广泛的机器学习数据预处理的手段之一。
PCA,顾名思义,取信号中的最为主要的成分,对非重要部分进行去除,从而达到数据降维的目的,避免维度灾难。PCA只对符合高斯分布的样本较为有效。
ICA,是盲源分离(Blind source separation, BSS)的一个特例,来源于“鸡尾酒会问题”,如果被观测信号由若干个统计独立的分量的线性组合(混合信号),ICA的目的是将被观测信号解混为若干独立信号源,从而对感兴趣的信号进行处理。
Google时,发现了这一篇文章的译文,然而完全看不懂译文的意思,遂找到原文对照阅读,最后有了重新翻译一遍的想法。
本文结合直观的图形解释,说明了协方差矩阵实质上是一个线性变换,主要思想有如下几点:
一直没明白,方差、协方差以及相关系数这几个概念的含义及其在统计学中作用和计算方法,这里简单做一个记录和梳理。
方差(Variance) ,表征统计量(随机变量)对均值的误差(偏离度或离散度),方差越小离散度越小,统计量越接近统计平均值。
协方差(Covariance) 表征统计量(随机变量)不同维度之间的误差,衡量该量不同维度之间的相关性。
相关系数(Coefficient) ,统计学上常用是皮尔森相关系数(Pearson correlation coefficient),定义为两个维度(特征)之间的协方差和标准差之比,用于度量两个维度之间的(线性)相关程度,其值介于\([-1,1]\)之间。
rsync是常用的数据镜像备份工具,它可以:
本文记录使用rsync进行系统备份的基本方法。
从最初的Ubuntu 12.04到现在的18.04,随着Ubuntu的更新很多以前的配置无法继续使用,重新开一个帖子,记录新版本的命令和配置。 以下命令,在Ubuntu Server 18.04上测试通过。
日常使用Git,越来越觉得GUI不方便,以下记录下Git命令行配置