详解TF中的Embedding操作！-CSDN博客

本文链接：https://blog.csdn.net/abcdefg90876/article/details/90585723

本文详细介绍了TensorFlow（TF1.x和TF2.0）中的Embedding操作，包括什么是embedding、tf1.x中的embedding实现、类似操作如gather和gather_nd、多值离散特征的处理以及如何在神经网络中使用embedding层。通过实例代码展示了embedding_lookup、embedding_lookup_sparse等函数的使用方法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

embedding大家都不陌生，在我们的模型中，只要存在离散变量，那么一般都会用到embedding操作。今天这篇，我们将按以下的章节来介绍TF中的embedding操作。

什么是embedding？
tf1.x中的embedding实现，对比embedding_lookup和matmul
tf1.x中与embedding类似操作，包括gather，gather_nd
tf1.x中多值离散特征处理tf.nn.embedding_lookup_sparse
tf2.0中embedding实现

1、什么是embedding？

先来看看什么是embedding，我们可以简单的理解为，将一个特征转换为一个向量。在推荐系统当中，我们经常会遇到离散特征，如userid、itemid。对于离散特征，我们一般的做法是将其转换为one-hot，但对于itemid这种离散特征，转换成one-hot之后维度非常高，但里面只有一个是1，其余都为0。这种情况下，我们的通常做法就是将其转换为embedding。

embedding的过程是什么样子的呢？它其实就是一层全连接的神经网络，如下图所示：

假设一个特征共有5个取值，也就是说one-hot之后会变成5维，我们想将其转换为embedding表示，其实就是接入了一层全连接神经网络。由于只有一个位置是1，其余位置是0，因此得到的embedding就是与其相连的图中红线上的权重。

接下来，我们来看一下tf1.x中embedding的实现。

2、tf1.x中的embedding实现

在tf1.x中，我们使用embedding_lookup函数来实现emedding，代码如下：

# embedding
embedding = tf.constant(
        [[0.21,0.41,0.51,0.11]],
        [0.22,0.42,0.52,0.12],
        [0.23,0.43,0.53,0.13],
        [0.24,0.44,0.54,0.14]],dtype=tf.float32)

feature_batch = tf.constant([2,3,1,0])

get_embedding1 = tf.nn.embedding_lookup(embedding,feature_batch)

上面的过程为：