这两天机器学习讲到了嵌套/嵌入这个概念,一开始不太好理解。
老师讲了经典的one-hot例子,自己又想到了颜色RGB值的例子,记录一下,如有不准确请大家评论区指出~
嵌套(embeddings)通常是指将高维度向量映射到低维度的空间。
一种分类特征,以连续值特征表示。
举个栗子——
原数据:(高维空间:6维)
[红色,0,0,0,0,0]→[1,0,0,0,0,0]
[0,绿色,0,0,0,0]→[0,1,0,0,0,0]
[0,0,蓝色,0,0,0]→[0,0,1,0,0,0]
[0,0,0,黄色,0,0]→[0,0,0,1,0,0]
[0,0,0,0,黑色,0]→[0,0,0,0,1,0]
[0,0,0,0,0,白色]→[0,0,0,0,0,1]
嵌套后:(低维空间:3维)
[255,0,0] →红色RGB值
[0,255,0] →绿色RGB值
[0,0,255] →蓝色RGB值
[255,255,0] →黄色RGB值
[0,0,0] →黑色RGB值
[255,255,255] →白色RGB值
所以从6维空间映射到了3维空间,同时更多的体现了原数据的特征,便于进行相似度计算。
依次类推,可以将无数的颜色(n维空间的数据)映射到3维空间中,也就是颜色的RGB值。