我正在做一个识别问题(面孔),并试图缩小问题的规模。我最初从120维的特征坐标系中训练数据开始,但通过PCA,我发现一个更好的PC坐标系只需要20个维度,同时仍能传输95%的数据。
我开始认为,根据定义识别是一个分类问题。n空间中属于同一对象/面/任何将聚集的点。举个例子,如果训练数据中有5个同一个体的实例,则它们将进行聚类,并且该聚类的中点可以用k均值进行数值定义。
我的具体识别问题不使用神经网络,而是使用简单的欧几里德距离算法。