本题考查无监督学习。来源于第二十三章。(1)降维是指在不损失过多信息的前提下将 N 个相关的特征降为 k 个不相关的特征(其中 k<N),使其具有更好的解释性,因此降维也称为特征提取。例如,根据客户的能力、品格、担保、资本、环境等特征评价客户的信用等级。常用的降维方法包括主成分分析法、因子分析法等。(2)聚类是指把一组数据按照差异性和相似性分为几个类别,使得同类的数据相似性尽可能大,不同类的数据相似性尽可能小,跨类的数据关联性尽可能低。聚类分析常用于客户细分、文本归类、结构分组、行为跟踪等。与分类不同,聚类要划分的类是未知的,聚类是根据观察学习来确定数据之间的关系,因此是一种无监督学习。常用的聚类方法包括基于划分的方法(例如 k 均值聚类算法)、基于分层的方法、基于密度的方法、基于网格的方法和基于模型的方法。