分享好友 行情首页 行情分类 切换频道
DIEN: 阿里点击率预估之深度兴趣进化网络
2024-12-26 21:15  浏览:93

广告推荐算法系列文章

  • 莫比乌斯: 百度的下一代query-ad匹配算法
  • 百度凤巢分布式层次GPU参数服务器架构
  • DIN: 阿里点击率预估之深度兴趣网络
  • 基于Delaunay图的快速最大内积搜索算法
  • DIEN: 阿里点击率预估之深度兴趣进化网络
  • EBR: Facebook基于向量的检索
  • 阿里巴巴电商推荐之十亿级商品embedding

这篇文章所介绍的模型,用于在用户没有输入搜索词来表达意图的时候,给用户推荐商品的场景。这里的收费方式一般是CPC,即Cost per Click,每次点击收费,提高CTR能直接提高收入,同时改进用户体验。

在DIN: 阿里点击率预估之深度兴趣网络中,我们介绍了Attention在阿里点击率预估中应用,重点则是针对某个候选广告,用attention对用户行为序列进行权重计算,得到用户针对这个候选广告的兴趣向量,然后去做点击率预估。

上面的做法能够捕捉到用户多样的兴趣,但是缺点就是用户行为序列中的条目是被等价对待的,并没有考虑到用户兴趣的漂移。

比如,随着风潮的变化,用户喜欢的衣服风格可能发生变化;类似的,用户在某个时间段会关注一类书籍,但是过了这个时间段,可能会关注其他类型的书籍,或者其他商品比如衣服。

综上,用户的兴趣有如下特点

  • 多样性,用户感兴趣的商品会有很多种类。
  • 进化性,用户的兴趣会随着时间发生变化,包括在某种商品内的细粒度变化,或者不同种商品间的变化等。

所以,在论文[1]中,对用户的行为序列进行了建模,从而能捕捉到用户兴趣的漂移。

在介绍模型的改进之前,再来回顾一下基础模型。经典的CTR预估模型是Embedding + MLP。

对于阿里的广告点击率预估问题来说,有四大类特征

  • 用户信息: 例如性别,年龄等。
  • 用户行为序列: 用户看过的商品序列。
  • 广告: ad_id, shop_id等等
  • 上下文: 时间,地点等。

大部分是离散特征,可以用one-hot进行编码表达。而对于商品来说,因为商品数目太多,使用one-hot不现实,所以使用密集编码,即给每个商品一个向量编码,然后对于用户行为序列中的每一个商品,取得对应的编码,将所有的商品向量编码拼接起来,得到行为序列的编码。

  • Interest Extractor Layer: 从用户行为序列中提取信息
  • Interest Evolving Layer: 从用户行为序列中找到目标相关的兴趣,对其进行建模

但是如果只用上面BaseModel的损失函数的话,是无法将GRU训练好的。因为最后的target只是针对一种兴趣的,所以GRU建模的序列上得不到足够的监督信息。为了解决这个问题,提出了一种辅助损失函数用来帮助训练GRU。

有了这个辅助损失后,就可以较好的用GRU建模行为序列。

最后的损失函数则是 L = Ltarget + alpha * Laux

上面使用的GRU的隐含信息可以组成一个兴趣序列,而根据预测目标的不同,我们需要从兴趣序列中拿到不同的信息,这时候,attention机制就粉墨登场了。

  1. AIGRU: GRU + Attention Input

    将抽取层的GRU的隐含状态乘以attention权重作为下一个GRU的输入。这种方法表现不是特别好,因为即使权重为0,输入给GRU后依然会改变GRU的隐含状态,影响兴趣进化的学习。

  2. AGRU: Attention based GRU

  3. AUGRU: GRU with attention update gate

    有了上面的两层,就得到了整个架构:

    在公开数据集上的实验,可以看到,DIEN能够带来1.9%和5.6%的提升。

    线上实验,我看到了白花花的银子。

    在Online Serving上,采用了多种技术来进行优化

    • Element parallel GPU & kernel fusion
    • Batching: 相近的request在一起执行来提高效率
    • 基于Rocket的模型压缩,例如可以将GRU的隐含状态从128压缩到32。

    第一条和第三条不太懂,后续关注。

    论文[1]用户行为序列进行建模,捕捉了用户兴趣进化信息,从而能提高CTR。技术上,使用GRU对序列建模,使用辅助损失来对GRU更好的训练,类似DIN,使用attention来对序列进行筛选,只对目标相关的兴趣进行序列建模,总体上,提升CTR达到20.7%,相当大的impact了。

        以上就是本篇文章【DIEN: 阿里点击率预估之深度兴趣进化网络】的全部内容了,欢迎阅览 ! 文章地址:http://w.yusign.com/quote/6797.html 
         行业      资讯      企业新闻      行情      企业黄页      同类资讯      网站地图      返回首页 述古往 http://w.yusign.com/mobile/ , 查看更多   
最新新闻
权威外链平台指南:助力网站排名与流量飙升297
外链建设是网站优化不可或缺的重要环节。优质外链不仅能传递权重,还能为网站带来引流,提升品牌知名度。本文将为您提供一份全面
软媒魔方电脑版(Win10)
软媒魔方电脑版(Win10)是一款全新好用的电脑优化大师,用户们可以在软媒魔方电脑版(Win10)通过简易的操作来对你的电脑进行一个全
如何找到微信
在数字化高速发展的今天,微信作为一款集社交、支付、信息获取等多功能于一体的应用,已经成为人们日常生活中不可或缺的一部分。
绿云获得PCI PA-DSS支付安全认证
近日,绿云oHotel产品获得了PA-DSS(Payment Application Data Security Standard)支付应用数据安全标准3.2版本一级认证。支付
网站快照不更新的原因是什么?
在时,大家都会主要到网站的快照,那么网站快照对于优化有哪些作用呢?下面云无限小编为大家详细介绍:通俗的说只要被搜索引擎收
百度爱采购平台的特点及优势有哪些?
爱采购是一个电商平台,提供一站式的采购服务。它为企业提供了更方便、高效的采购渠道,帮助企业降低采购成本,提高采购效率。爱
最新文艺朋友圈说说文案
最新文艺朋友圈说说文案大全(精选80句)  像座孤独的海,内心隐隐呼唤著游云的望乡人。以下这篇是关于文艺朋友圈说说文案的句
通过 Docker 搭建 Typecho 详细教程
下面以 Centos 7 为例1.1 安装 Docker 安装依赖设置yum源查看所有仓库中所有docker版本安装docker设置开机启动启动 Docker查看版
【Apple TV 4K】软件篇:有钱有时间 方能享清闲
【新人求关注~】想要用好Apple TV 4K,不仅需要有硬件上的准备,软件方面也有很多门槛等你去跨、去折腾。如果让我用一句话来形
网络综合布线考试试题及答案.pdfVIP
================精选公文范文,管理类,工作总结类,工作计划类文档,欢迎阅读下载==============网络综合布线考试试题及答案专
本企业新闻
推荐企业新闻
发表评论
0评