基于多维隐藏特征的电商推荐系统排名设计与实现研究.pdf
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
2 0人已下载
| 下载 | 加入VIP,免费下载 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 多维 隐藏 特征 推荐 系统 排名 设计 实现 研究
- 资源描述:
-
1、基于多维隐藏特征的电商推荐系统排名设计与实现研究魏一丁摘 要利用 8 天左右的淘宝用户数据,基于 Keras 框架完成电商推荐系统排名部分构建。该系统采用了多层深度学习框架,使用用户 ID、商品 ID、类目 ID、用户行为类型与行为时间作为隐藏特征来源输入,映射成高密度低维向量,利用 ReLU 与 Softmax 等激活函数生成推荐模型,预测误差率 0.21。关键词隐藏特征;推荐系统;排名;深度学习;Kerasdoi:10.3969/j.issn.1673-0194.2020.12.073中图分类号TP391.3文献标识码A文章编号1673-0194(2020)12-0-041基于多维隐藏特征
2、电商推荐系统的相关研究对于在线电商平台来说,主要目的是最高效率地撮合交易,高性能的推荐系统不可或缺,可以让买卖双方在最短时间内找到对方,并实现交易。有关推荐系统的算法包括传统推荐算法和当前基于深度学习的算法。当前有 3 类基于内容、协同过滤和混合的推荐方法,其中协同过滤推荐方法由 GoldBerg 等人提出,基于项目或基于用户,通过矩阵的点乘积计算得分实现。目前,推荐算法引入了深度学习算法,大致说来:基于深度神经网络的 DNN 适用于隐藏多层的数据维度,卷积神经网络 CNN 训练参数较少,图卷积 GNN 适合推荐质量要求较高以及关注序列信息的循环神经网络 RNN 与 LSTM 等,每种方法都有
3、不同的侧重场景。推荐系统一般分为召回阶段和排序阶段。在召回时,快速使用简单维度的数据将百万级用户商品等数据过滤成百级。在排序期,充分利用多维度的数据来精细化筛选,输出个、十位数级。在上述两个阶段中,核心在于嵌入(Embedding)生成,旨在将高维数据映射到低维数据域,降低了计算复杂度。当前的嵌入方法包括:LLE、LaplacianEigenmaps、Graph、HOPE 的因式分解型,DeepWalk、node2Vec 的随机行走型,还有 GCN等深度学习型。其中,每个社交媒体根据自身数据分布情况和特点选取数据维度生成嵌入。目前,成熟的社交媒体平台采用的架构基本一致,只是在算法选择、网络层设
4、计有所不同。Youtube 采用前述,全部使用 DNN 方式,在召回时不再使用 LSH,而是使用 Spill-tree 这种改进版的邻域搜索方法。Instagram 采用的 PinSage 架构,一种基于 GNN 的方式。衡量推荐系统的指标包括 A/B 测试、精准率和响应时间等,而目前各类开源架构、开放 Python 功能包,在所考虑的各项指标中基本能够满足实际方面的需求。比较成熟的是Keras 框架,基本囊括了大多数算法和网络层。此外,一些新兴的算法,也可以通过引包方式实现。相对于评论文字、星级评价这些显性的特征,用户在线状态、在线时长、观看次数、点击数、购买频次、加购、收藏数则是隐性特征,
5、需要一种可量度的方式来构建用户与商品的关联。本研究侧重隐藏特征,从用户 ID、商品 ID、行为类型与行为时间构建嵌入Embedding,通过 Keras 的 DNN,实现生成推荐。2研究方法及过程本文选取基于淘宝平台 2017 年 11 月 25 日 01:21:10-2017 年 12 月 3 日 17:38:11的数据,合计 1 亿多条。将原始数据清洗,并按照 28 的比例随机分成训练集、测试集(图 1)。假设:研究侧重于精细化排序部分,简单地将亿条数据按用户 ID 大于 100 的条目进行删除,得到 1 万多条数据,近似于召回的结果。沿用 Keras 的 Embedding 方法,使用“
展开阅读全文
课堂库(九科星学科网)所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。


2019届人教A版数学必修二同步课后篇巩固探究:2-1-1 平面 WORD版含解析.docx
