EEG信号预处理过程中最重要的一环就是力争能够还原每个电极单独的信号,而不是类似鸡尾酒问题而记录到的混合信号

PCA 主要成分分析  利用正交变换把信号转移到另外一组坐标系里面,从而降低信号维度,你可以简单的认为 现在50个特征,我用PCA后 只要20个特征就可以近似的把这组数据表示出来,一般要求不低于85%

当然降低纬度后 测试数据时候也要讲数据进行坐标变换

pca并不是直接对原来的数据进行删减,而是把原来的数据映射到新的一个特征空间中继续表示,所有新的特征空间如果有29维,那么这29维足以能够表示非常非常多的数据,并没有对原来的数据进行删减,只是把原来的数据映射到新的空间中进行表示,所以你的测试样本也要同样的映射到这个空间中进行表示,这样就要求你保存住这个空间坐标转换矩阵,把测试样本同样的转换到相同的坐标空间中。

 

我给大家补充一个对于一般鸡尾酒会(即盲源分离)问题的处理procedure,直观理解下它们的区别。

对于一组3个模拟信号,如正弦、余弦、随机信号
经过随机混合,由6个麦克风录制下来,则观测信号为
我们希望将他们分解开,这时就该ICA出场了。但在ICA之前,往往会对数据有一个预处理过程,那就是PCA与白化。
白化在这里先不提,PCA本质上来说就是一个降维过程,大大降低ICA的计算量。
PCA,白化后的结果如下图所示。可以看到,原先的6路信号减少为3路,ICA仅需要这3路混合信号即可还原源信号。
下面,ICA经过多步迭代寻优,就会按照信号之间独立最大的假设,将信号解混输出。
总的来说,ICA认为观测信号是若干个统计独立的分量的线性组合,ICA要做的是一个解混过程。
而PCA是一个信息提取的过程,将原始数据降维,现已成为ICA将数据标准化的预处理步骤。