DIEN: 阿里点击率预估之深度兴趣进化网络

   日期:2024-12-26    作者:o93v3 浏览:93    移动:http://w.yusign.com/mobile/quote/6797.html

广告推荐算法系列文章

  • 莫比乌斯: 百度的下一代query-ad匹配算法
  • 百度凤巢分布式层次GPU参数服务器架构
  • DIN: 阿里点击率预估之深度兴趣网络
  • 基于Delaunay图的快速最大内积搜索算法
  • DIEN: 阿里点击率预估之深度兴趣进化网络
  • EBR: Facebook基于向量的检索
  • 阿里巴巴电商推荐之十亿级商品embedding

这篇文章所介绍的模型,用于在用户没有输入搜索词来表达意图的时候,给用户推荐商品的场景。这里的收费方式一般是CPC,即Cost per Click,每次点击收费,提高CTR能直接提高收入,同时改进用户体验。

在DIN: 阿里点击率预估之深度兴趣网络中,我们介绍了Attention在阿里点击率预估中应用,重点则是针对某个候选广告,用attention对用户行为序列进行权重计算,得到用户针对这个候选广告的兴趣向量,然后去做点击率预估。

上面的做法能够捕捉到用户多样的兴趣,但是缺点就是用户行为序列中的条目是被等价对待的,并没有考虑到用户兴趣的漂移。

比如,随着风潮的变化,用户喜欢的衣服风格可能发生变化;类似的,用户在某个时间段会关注一类书籍,但是过了这个时间段,可能会关注其他类型的书籍,或者其他商品比如衣服。

综上,用户的兴趣有如下特点

  • 多样性,用户感兴趣的商品会有很多种类。
  • 进化性,用户的兴趣会随着时间发生变化,包括在某种商品内的细粒度变化,或者不同种商品间的变化等。

所以,在论文[1]中,对用户的行为序列进行了建模,从而能捕捉到用户兴趣的漂移。

在介绍模型的改进之前,再来回顾一下基础模型。经典的CTR预估模型是Embedding + MLP。

对于阿里的广告点击率预估问题来说,有四大类特征

  • 用户信息: 例如性别,年龄等。
  • 用户行为序列: 用户看过的商品序列。
  • 广告: ad_id, shop_id等等
  • 上下文: 时间,地点等。

大部分是离散特征,可以用one-hot进行编码表达。而对于商品来说,因为商品数目太多,使用one-hot不现实,所以使用密集编码,即给每个商品一个向量编码,然后对于用户行为序列中的每一个商品,取得对应的编码,将所有的商品向量编码拼接起来,得到行为序列的编码。

  • Interest Extractor Layer: 从用户行为序列中提取信息
  • Interest Evolving Layer: 从用户行为序列中找到目标相关的兴趣,对其进行建模

但是如果只用上面BaseModel的损失函数的话,是无法将GRU训练好的。因为最后的target只是针对一种兴趣的,所以GRU建模的序列上得不到足够的监督信息。为了解决这个问题,提出了一种辅助损失函数用来帮助训练GRU。

有了这个辅助损失后,就可以较好的用GRU建模行为序列。

最后的损失函数则是 L = Ltarget + alpha * Laux

上面使用的GRU的隐含信息可以组成一个兴趣序列,而根据预测目标的不同,我们需要从兴趣序列中拿到不同的信息,这时候,attention机制就粉墨登场了。

  1. AIGRU: GRU + Attention Input

    将抽取层的GRU的隐含状态乘以attention权重作为下一个GRU的输入。这种方法表现不是特别好,因为即使权重为0,输入给GRU后依然会改变GRU的隐含状态,影响兴趣进化的学习。

  2. AGRU: Attention based GRU

  3. AUGRU: GRU with attention update gate

    有了上面的两层,就得到了整个架构:

    在公开数据集上的实验,可以看到,DIEN能够带来1.9%和5.6%的提升。

    线上实验,我看到了白花花的银子。

    在Online Serving上,采用了多种技术来进行优化

    • Element parallel GPU & kernel fusion
    • Batching: 相近的request在一起执行来提高效率
    • 基于Rocket的模型压缩,例如可以将GRU的隐含状态从128压缩到32。

    第一条和第三条不太懂,后续关注。

    论文[1]用户行为序列进行建模,捕捉了用户兴趣进化信息,从而能提高CTR。技术上,使用GRU对序列建模,使用辅助损失来对GRU更好的训练,类似DIN,使用attention来对序列进行筛选,只对目标相关的兴趣进行序列建模,总体上,提升CTR达到20.7%,相当大的impact了。


特别提示:本信息由相关用户自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。


举报收藏 0评论 0
0相关评论
相关行情
推荐行情
点击排行
{
网站首页  |  关于我们  |  联系方式  |  用户协议  |  隐私政策  |  版权声明  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  鄂ICP备2020018471号