哪位大佬有机器学习李宏毅课程学习视频百度云资源
链哗察接橡歼:
提梁芦冲取码: 8e38
【点滴】学习t-SNE
学习t-SNE总结自李宏毅老师的教学视频,主要用于处理具有多属性、维度高的数据,以便进行数据可视化。t-SNE,即T-distributed Stochastic Neighbor Embedding,是一种非线性降维无监督机器学习方法,能将高维空间的点映射到低维空间,同时保持映射后的点之间的关系与原始数据一致。
在t-SNE中,原始样本的相似度用指数损失函数表示,映射后的样本相似度则使用t函数家族的一种形式。选择t函数作为映射后相似度度量指标的原因在于,它能有效放大距离较大的样本之间的差异,使得在低维空间中能更明显地展示数据的分布。
通过最小化映射前后的分布差异,即通过优化问题求解KL散度,以保留原始数据结构特征并实现降维。这一优化问题可通过梯度下降方法求解。实际应用中,往往先使用PCA降维,再进行可视化。
个人理解,t-SNE似乎专注于数据可视化而非揭示降维后的数据维度含义。尽管其目标是使降维前后数据分布或距离尽可能接近,但降维后每个维度的解释变得困难。因此,簇与簇之间的距离在可视化后是否依然保持物理意义?可视化后的簇间距离如何解释簇分隔的属性差异?这些都是值得探讨的问题。