Embedding

词嵌套(Word Embedding)

词嵌入其实就是将数据的原始表示表示成模型可处理的或者是更dense的低维表示(lz)。

one-hot编码

对于离散特征的处理, 我们一般使用one-hot编码来对离散型变量进行处理,

id类特征embedding

用户行为序列

也可以叫做“基于时间序列的用户行为”,是某一时间段内,按照时间先后顺序记录的人从事某种活动的每一步行为。

在网站,一段时间内,一个用户从进入网站到离开网站过程中的每一步行为的记录,被我们记做一条用户行为序列。

参考文献

数据预处理:独热编码(One-Hot Encoding)

简析阿里 BST: 用户行为序列 邂逅 Transformer

DNN在搜索场景中的应用

ID类特征使用小结

用户行为数据可视化——行为序列图

深度学习:词嵌入Embedding