从0开始做互联网推荐-以58转转为例

author author     2022-10-06     287

关键词:

从0开始做互联网推荐【产品+算法+实现】

 

一、58转转简介

58旗下真实个人闲置物品交易平台

 

二、从0开始设计推荐产品框架

(1)首页推荐:提取用户画像,根据线下提取出的用户年龄、性别、品类偏好等在首页综合推荐宝贝

(2)宝贝详情页推荐:买了还买,看了还看类的关联宝贝推荐

(3)附近推荐:和首页推荐的差异在于,提高了地理位置的权重,地理位置不仅要包含当前地理位置,还需要包含常见活跃区域,例如家里、公司等

(4)搜索推荐:除了关键词全匹配,要考虑同义词、近义词、易错词、拼音等推荐,产品层面,提示“你是不是想找xxoo宝贝”

(5)召回推荐:在用户退出系统后,通过RFM模型做优惠券推送或者消息推送做客户挽留与召回

 

TIPS:什么是RFM模型?

RFM模型:根据用户最近一次购买时间Recency,最近一段时间的购买频度Frequency,最近一段时间的购买金额Monetary,加权得到的一个代表用户成交意愿的一个分值。

 

三、从0开始进行推荐策略实现

【用户画像】

根据用户填写的资料、用户历史行为(购买、收藏、喜欢、分享、评论、浏览等行为)、微信背后的用户画像,得到用户的特性画像:

年龄段 -> 推荐母婴、3C用品?

性别 -> 推荐母婴、美容保健用品?

手机型号 -> 推荐手机

活跃时间 -> 在这个时间段推送消息

品类偏好 -> 相关品类推荐

地域 -> 附近推荐

 

【如何构建画像】

(1)读取用户安装的应用程序列表构建画像

装有滴滴用户端 -> 没有车

装有滴滴司机端 -> 有车

装有CSDN -> 男性

装有美柚、美颜APP -> 女性

(2)用户行为日志

启动日志 -> 获取活跃时段

经纬度 -> 获取活跃地域

购买、收藏、喜欢、分享、评论、浏览-> 获取品类偏好

第三方数据 -> 完善用户画像

 

【宝贝画像】

58转转的宝贝都是非结构化的数据,比较难做统一的宝贝画像,只能细分品类的做宝贝画像,例如手机画像等。

 

【如何构建宝贝画像】

对于58转转来说,要做宝贝画像必须细分类别,可以分词词频统计配合人工review的方式画像,以鞋为例,画像可能为

单鞋

纯牛皮

尺码

适合春秋穿

女鞋

价格及变动

包邮

 

【标签化与个性化推荐】

画像完成之后,如何对用户进行宝贝推荐呢?

(1)给用户和宝贝画像完毕之后,要将每一个用户和每一个宝贝打上标签TAG

(2)统计用户uid所有购买、收藏、喜欢、分享、评论、浏览的所有宝贝ID集合set<bb-id>

(3)统计这些宝贝ID所有对应的TAG,使用加权打分的方式,可以根据频次统计出对各TAG的喜好程度

(4)对于所有宝贝,根据uid对各TAG的喜好程度,使用加权打分的方式,可以统计出对各宝贝的喜好程度

(5)排除已经购买、收藏、喜欢、分享、评论、浏览过的宝贝,其他宝贝按照打分高低推荐即可

(6)搜索推荐需要加上“搜索条件”,附件推荐需要加强“附近权重”

需要注意的是,个性化推荐的准确性,一定程度上依赖于历史行为数据的收集,对于新用户,在缺乏历史行为积累时,可以推荐“热度最高”的宝贝,未来再根据其历史行为,不断增强推荐的准确率。

 

【分类预测推荐】

一个用户对一个宝贝是否进行购买,可以抽象成一个0和1的分类问题,也可以抽象成一个购买概率的数学问题,可以构造分类模型来计算用户对每个宝贝的购买概率,将概率最高的作为推荐的宝贝。

为了实现分类预测推荐,需要:

(1)准备训练数据集,包含用户、宝贝、用户是否购买了宝贝等历史数据,需要注意的是,数据集应当覆盖尽可能多的用户(要包含所有TAG)和宝贝(要包含所有分类及TAG)

(2)构造训练分类模型

(3)根据模型训练的结果,计算每一个用户对每一个宝贝某买的概率

(4)按照概率排序,对宝贝进行推荐

 

【协同过滤推荐】

协同过滤,用过的人都知道,不一定效果最好,但几乎适用于所有的业务场景:当向用户A做协同过滤推荐时,可以先找到和他兴趣相似的用户群体G,然后把G喜欢的、并且A没有点击过的宝贝推荐给A,这就是基于用户的协同过滤。

为了实现系统过滤推荐,需要:

(1)准备训练数据集,根据每个用户对每个宝贝的喜好,构建喜好矩阵(这是一个非常稀疏的矩阵),根据用户对宝贝购买、收藏、喜欢、分享、评论、浏览的行为量化这个喜好

(2)构造系统过滤训练模型

(3)针对每一个用户,根据模型给出其喜好宝贝列表

在做协调过滤推荐时需要注意,较新的宝贝,由于大部分人都没有相关喜好数据,所以使用协同过滤推荐时,新宝贝比较难被推荐上去,这是协同过滤的缺点,需要综合其他推荐策略来解决。

 以上内容均来自微信公众号“架构师之路”胡剑老师的文章,欢迎关注。

架构实践(转)

1. 从0开始做互联网推荐-以58转转为例  1)从0开始设计推荐产品框架    (1)首页推荐:提取用户画像,根据线下提取出的用户年龄、性别、品类偏好等在首页综合推荐宝贝    (2)宝贝... 查看详情

今日头条&58转转笔试

昨天参加今日头条和58转转的笔试,因为时间上有冲突,所以主要选择参加头条的笔试。 先说头条: 头条的题型:一道改错题三道编程题一道设计题 感受:做题目的的时候还是有点紧张的,因为突然遇到题目需要思... 查看详情

推荐算法简介

...系统实践》和《推荐系统与深度学习》。推荐系统是目前互联网世界最常见的智能产品形式。从电子商务、音乐视频网站,到作为互联网经济支柱的在线广告和新颖的在线应用推荐,到处都有推荐系统的身影。推荐算法是推荐系... 查看详情

stm32-hal库-timx学习

...器从 0 计数到自动重载值,然后重新从 0 开始计数并生成计数器上溢事件。  递减计数模式:计数器从自动重载值开始递减到 0,然后重新从自动重载值开始计数并生成计数器下溢事件。  中心对齐模式:... 查看详情

深入浅出推荐系统:推荐系统基本架构

...体介绍,不涉及过多技术细节问题。推荐系统简史在互联网信息爆炸的今天,推荐系统是我们身边一个无法躲避存在。在淘宝上浏览商品,在抖音上刷视频,以及无处不在的小广告…可以说,只要你开始上网... 查看详情

无私分享:从入门到精通asp.netmvc从0开始,一起搭框架做项目(11)文件管理

声明:本系列为原创,分享本人现用框架,未经本人同意,禁止转载!http://yuangang.cnblogs.com希望大家好好一步一步做,所有的技术和项目,都毫无保留的提供,希望大家能自己跟着做一套,还有,请大家放心,只要大家喜欢,有... 查看详情

Angular Cli 警告:不推荐使用选项“entryComponent”:从带有 Ivy 的 9.0.0 版开始,不再需要 entryComponents

】AngularCli警告:不推荐使用选项“entryComponent”:从带有Ivy的9.0.0版开始,不再需要entryComponents【英文标题】:AngularCliWarning:Option"entryComponent"isdeprecated:Sinceversion9.0.0withIvy,entryComponentsisnolongernecessary【发布时间】:2021-02-251 查看详情

从0开始设计一个物联网网关

什么是工业物联网网关工业物联网网关是连接工业场景本地设备(如PLC、扫码枪、机器人、数控机床等)与远端业务系统(如SCADA系统、MES系统等)之间的硬件设备或软件程序。终端设备和远端业务系统之间的所有数据通信都通过工业... 查看详情

从0开始搭建编程框架——插件(代码片段)

    我将插件设计为两种类型。一种是框架自身携带的插件,用于增强其基础能力。一种是用户自定义插件,用于完成业务。本文将分别介绍在peleus框架下,这两种插件该怎么写。(转载请指明出于breaksoftware的c... 查看详情

转转北京二手物品抓取

说实话在0基础的情况下自己学习python确实有点吃力,可能是我笨了吧,废话不说上代码1抓取各栏目的链接frombs4importBeautifulSoupimportrequestsstart_url=‘http://bj.58.com/sale.shtml‘url_host=‘http://bj.58.com‘defget_channel_urls(url):web_data=requests 查看详情

从0开始学大数据-java基础开篇

...年,这一年人才市场发生了巨大的变化,经历了O2O、P2P、互联网+、共享经济、大数据、AI和区块链等,互联网行业的各大公司也都走在风口浪尖,不断的寻求突破。传统企业更加不在话下, 查看详情

工程师如何从技术转型做管理

...0c;距离退休,只剩3年了!”这句话用来形容2019年互联网行业最适合不过了。从2018年开始,大大小小的互联网公司开始了不止一轮的裁员,2019年网上开始充斥一类文章,专门写互联网公司超过35岁的人,如... 查看详情

电商运营的剁手套路

...路一切,都要从运营的重要性开始聊……一、重运营,是互联网发展的必然互联网从起源到现在,经历了怎样的趋势变化?若仅看国内的互联网发展历史,从产品发展策略的角度,我们可以发现一些关键的节点存在。电商运营:... 查看详情

数字序列中某一位的数字(代码片段)

...按照0123456789101112131415161718192021…的顺序排列。第5位(从0开始计数)为5,第13位为1,第19位为4……求任意第n位对应的数字。思路:直观方法做枚举。每枚举一个数字的时候,求出该数字是几位数,并把数字的位数和前面的所有... 查看详情

短视频自媒体实操经验分享,原来赚钱就这么简单!

从去年开始,由一条、二更等短视频自媒体开始崛起,短视频的红利期到来了。大家想通过做短视频搬运工想赚钱,要懂得讨好平台和读者。了解平台的游戏规则和网民内心的真实需求,只有这样才能获得平台更多的推荐和网民... 查看详情

如何做好流量增长?

如今,移动互联网经过几年的厮杀,已经由原来的蓝海变成了一片红海。早先的流量红利早以不再,获取用户的成本变得越来越高。面对这样的情况企业应该如何做才能降低成本获客呢?这也催生了首席增长官(CGO:)、增长黑... 查看详情

建设tidb自动化平台:转转dba团队实践

...f0c;见证了TiDB的发展,自身也沉淀了不少经验。从1.0GA开始测试,到2.0GA正式投产,然后升级到了2.1,后来又升级到4.0.13,最后建设自动化平台。其实转转DBA团队初建以来就开始投入一定的资源进行平台建设ÿ... 查看详情

深度学习——推荐算法基础原理

摘要互联网和信息计算的快速发展,衍生了海量的数据,我们已经进入了一个信息爆炸的时代,每时每刻都有海量信息产生,然而这些信息并不全是个人所关心的,用户从大量的信息中寻找对自己有用的信息也变得越来越困难。... 查看详情