关键词:
常见的推荐系统的模型:协同过滤推荐模型、基于内容的推荐模型和混合推荐模型
推荐算法:
1) 基于流行度的算法
比如各种新闻,微博热榜,根据单页点阅率(PV),“访问次数”和“独立访客数(UV),或日均PV或收藏数等数据来按某种热度排序来推荐。这用于刚注册的用户,它无法针对用户进行个性化推荐.
2)协同过滤算法
分为基于用户和基于物品的算法,基于用户的原理:①.分析各个用户对item的评价(通过浏览记录、购买记录等)②依据用户对item的评价计算得出所有用户之间的相似度;③选出与当前用户最相似的N个用户;④将这N个用户评价最高并且当前用户又没有浏览过的item推荐给当前用户;基于物品的原理:①分析各个用户对item的浏览记录。②依据浏览记录分析得出所有item之间的相似度;③对于当前用户评价高的item,找出与之相似度最高的N个item;④将这N个item推荐给用户。
3)基于内容的算法
通过分析用户的行为以及新闻的文本内容,我们提取出数个关键字,将这些关键字作为属性,把用户和新闻分解成向量,之后再计算向量距离,便可以得出该用户和新闻的相似度了,
我们便可以引入词权的概念。在大量的语料库中通过计算(比如典型的TF-IDF算法),我们可以算出新闻中每一个关键词的权重,在计算相似度时引入这个权重的影响,就可以达到更精确的效果。
4)基于模型的算法
通过分析系统中用户的行为和购买记录等数据,通过对影响用户行为的各种特征属性,如用户年龄段、性别、地域、物品的价格、类别信息的记录,通过反复测试和经验,调整特征属性的组合,拟合出最准确的回归函数
5)混合算法
通过给不同算法的结果加权重来综合结果,或者是在不同的计算环节中运用不同的算法来混合,达到更贴合自己业务的目的。
注意:数次推荐后用户依然对某个标签毫无兴趣,我们就需要将这个标签降低权重,调整排序。
寒假学习进度十四
使用Pycharm进行Python爬虫实验:爬取北京市政百姓信件实战。 创建了这个项目,然后开始编写最后 查看详情
寒假学习进度7
今天主要进行scala学习,再b站上找好了一个比较不错的视频。 视频链接:https://www.bilibili.com/video/av39126512?from=search&seid=11655088589598890079 scala可以访问现存的数之不尽的java类库,迁移到scala更加容易 查看详情
2020年寒假第7次学习进度记录
当日学习内容:视频学习jQuery基础,熟悉使用AndroidStudio1.视频学习近况 继续学习jQuery基础2.AndroidStudio的使用情况 在上次安装之后,发现AndroidSDK版本没有下载完,所以今天又对其进行的完善。 查看详情
寒假学习进度二
...如基本语法、数据类型、字符串等等。开始准备老师留的寒假实验。 除此之外,自己也在B站上学习python,目前只了解到python一些基础知识和数据类型。 查看详情
寒假学习进度03
日期:2020.01.17博客期:126星期五 这几天要准备离开家,出一趟远门,嗯~先把任务安排妥了,我最近由于需要还学会了一些简单脚本的制作,虽然也不难就是了。嗯~扯远了,今天干了什么呢?首先是把昨天的博客修补了... 查看详情
寒假学习进度十
对于Scala这种东西,我还是弄不太清。毕竟大学那点java,c#什么的也还是懵懵懂懂,明明知道自己应该开始努力了却不知道该如何起跑,也不知道要往哪个方向跑。心里很是惆怅。今天也就看了个b站上的Scala教学视频:https://www.bil... 查看详情
2020寒假学习进度报告2
今日完成内容:学习了scala中的语法,主要知识点包括:变量的定义,数值类型,运算符,流程控制,for循环,while循环,do...while循环,(不建议使用while和do...while,因为函数引入了外部变量),函数尤其是递归,之前学习其... 查看详情
寒假学习进度01
常见的推荐系统的模型:协同过滤推荐模型、基于内容的推荐模型和混合推荐模型推荐算法: 1)基于流行度的算法 比如各种新闻,微博热榜,根据单页点阅率(PV),“访问次数”和“独立访客数(UV),或... 查看详情
寒假学习进度3
今天主要完成了pyqt库及相应工具的安装,以及简单的实现了界面功能。 开发工具IDE选择pycharm,因为之前就进行过python爬虫学习,所以IDE早就以及安装配置好了。 还有一点需要提的就是pyqt提供一个可视化工具叫QTDesign... 查看详情
寒假自学进度6
今天在B站上面看了python学习视频学习地址:https://www.bilibili.com/video/av14184325菜鸟教程上面有详细的资料目录,在上面进行了一些简单的练习 早上起来的时候看了一部分考研单词,感觉明天还是会忘记。明天还要继续 查看详情
2020年寒假学习进度第十天
今天主要学习了实验7Spark机器学习库MLlib编程实践,主要代码:importorg.apache.spark.ml.feature.PCAimportorg.apache.spark.sql.Rowimportorg.apache.spark.ml.linalg.Vector,Vectorsimportorg.apache.spark.ml.evaluation.MulticlassClassificationEvaluatorimportorg.apache.spark.ml.P... 查看详情
寒假学习进度
毕业设计: 今天想将原本是用pyqt做的界面换成网页版的,因为考虑到后期可能要部署到云服务器和微信小程序上,所以想要换成网站的。但是之前没有用python编写网站的经验,如果继续采用前端用Java展示,后端用python的话... 查看详情
寒假学习进度报告1
因为电脑装了太多软件,卡顿对操作十分不便,我决定利用假期自己装系统。 每次装系统都要花钱找电脑店,这让我一个学计算机的学生很羞耻,都不好意思说自己是软件工程的学生。 早就准备好了启动盘,用微pe... 查看详情
寒假学习进度-2(代码片段)
Spark的安装和使用安装的是spark-2.1.0-bin-without-hadoop.tgz修改了Spark的配置文件spark-env.sh添加了配置信息:exportSPARK_DIST_CLASSPATH=$(/usr/local/hadoop/bin/hadoopclasspath)Spark的使用在终端中首先要切换到Spark的目录cd/usr/local/spark之后通过输入bin/s... 查看详情
寒假学习进度-8(热词爬取)(代码片段)
packagehotword;importjava.io.IOException;importorg.jsoup.Connection;importorg.jsoup.Jsoup;importorg.jsoup.nodes.Document;importorg.jsoup.nodes.Element;importorg.jsoup.select.Elements;importdao.Dao;publicclassBaidu1publicstaticvoidmain(String[]args)lianjie("https://baike.baidu.com/item/%E6%89%8B%E6%9... 查看详情
寒假学习进度02
日期:2020.01.15博客期:124星期三 嗯,把这几天学习进度汇总一下: 1、CSV文件、XML文件、JSON文件的处理整合 这一部分详细的让我明天把博客整理出来,你们就能看到了,不过这一部分代码,借鉴了好多其他博主... 查看详情
寒假自学进度8
这两天主要学习了爬虫(在学习爬虫过程中涉及到了学习maven)(https://www.cnblogs.com/zzstdruan1707-4/p/12267141.html)以及scala集合文件模式匹配迭代器等操作(磕磕绊绊没掌握)(补充的第三个实验)(比源代码添加了更多便于理解的... 查看详情
寒假学习进度六
今天看了《梦断代码》的第二章——Agenda之魂,开始我不知道这个单词是什么意思,搜了一下是议程,工作事项的意思。但是理解不了这张名字额意思,看完之后才知道这里的Agenda指的是一个软件,它能接受灵活的输入格... 查看详情