寒假学习进度01

zhao-teng-ass zhao-teng-ass     2023-04-23     438

关键词:

常见的推荐系统的模型:协同过滤推荐模型、基于内容的推荐模型和混合推荐模型

推荐算法:

  1) 基于流行度的算法

    比如各种新闻,微博热榜,根据单页点阅率(PV),“访问次数”和“独立访客数(UV),或日均PV或收藏数等数据来按某种热度排序来推荐。这用于刚注册的用户,它无法针对用户进行个性化推荐.

  2)协同过滤算法

    分为基于用户和基于物品的算法,基于用户的原理:①.分析各个用户对item的评价(通过浏览记录、购买记录等)②依据用户对item的评价计算得出所有用户之间的相似度;③选出与当前用户最相似的N个用户;④将这N个用户评价最高并且当前用户又没有浏览过的item推荐给当前用户;基于物品的原理:①分析各个用户对item的浏览记录。②依据浏览记录分析得出所有item之间的相似度;③对于当前用户评价高的item,找出与之相似度最高的N个item;④将这N个item推荐给用户。

  3)基于内容的算法

    通过分析用户的行为以及新闻的文本内容,我们提取出数个关键字,将这些关键字作为属性,把用户和新闻分解成向量,之后再计算向量距离,便可以得出该用户和新闻的相似度了,

我们便可以引入词权的概念。在大量的语料库中通过计算(比如典型的TF-IDF算法),我们可以算出新闻中每一个关键词的权重,在计算相似度时引入这个权重的影响,就可以达到更精确的效果。

  4)基于模型的算法

    通过分析系统中用户的行为和购买记录等数据,通过对影响用户行为的各种特征属性,如用户年龄段、性别、地域、物品的价格、类别信息的记录,通过反复测试和经验,调整特征属性的组合,拟合出最准确的回归函数

  5)混合算法

    通过给不同算法的结果加权重来综合结果,或者是在不同的计算环节中运用不同的算法来混合,达到更贴合自己业务的目的。

     注意:数次推荐后用户依然对某个标签毫无兴趣,我们就需要将这个标签降低权重,调整排序。

  6)基于关联规则推荐
    基于关联规则的推荐(Association Rule-based Recommendation)是以关联规则为基础,把已购商品作为规则头,规则体为推荐对象。关联规则挖掘可以发现不同商品在销售过程中的相关性,在零售业中已经得到了成功的应用。管理规则就是在一个交易数据库中统计购买了商品集X的交易中有多大比例的交易同时购买了商品集Y,其直观的意义就是用户在购买某些商品的时候有多大倾向去购买另外一些商品。比如购买牛奶的同时很多人会同时购买面包。
    

 

寒假学习进度十四

使用Pycharm进行Python爬虫实验:爬取北京市政百姓信件实战。     创建了这个项目,然后开始编写最后   查看详情

寒假学习进度7

  今天主要进行scala学习,再b站上找好了一个比较不错的视频。  视频链接:https://www.bilibili.com/video/av39126512?from=search&seid=11655088589598890079  scala可以访问现存的数之不尽的java类库,迁移到scala更加容易  查看详情

2020年寒假第7次学习进度记录

当日学习内容:视频学习jQuery基础,熟悉使用AndroidStudio1.视频学习近况   继续学习jQuery基础2.AndroidStudio的使用情况   在上次安装之后,发现AndroidSDK版本没有下载完,所以今天又对其进行的完善。 查看详情

寒假学习进度二

...如基本语法、数据类型、字符串等等。开始准备老师留的寒假实验。 除此之外,自己也在B站上学习python,目前只了解到python一些基础知识和数据类型。  查看详情

寒假学习进度03

日期:2020.01.17博客期:126星期五    这几天要准备离开家,出一趟远门,嗯~先把任务安排妥了,我最近由于需要还学会了一些简单脚本的制作,虽然也不难就是了。嗯~扯远了,今天干了什么呢?首先是把昨天的博客修补了... 查看详情

寒假学习进度十

对于Scala这种东西,我还是弄不太清。毕竟大学那点java,c#什么的也还是懵懵懂懂,明明知道自己应该开始努力了却不知道该如何起跑,也不知道要往哪个方向跑。心里很是惆怅。今天也就看了个b站上的Scala教学视频:https://www.bil... 查看详情

2020寒假学习进度报告2

  今日完成内容:学习了scala中的语法,主要知识点包括:变量的定义,数值类型,运算符,流程控制,for循环,while循环,do...while循环,(不建议使用while和do...while,因为函数引入了外部变量),函数尤其是递归,之前学习其... 查看详情

寒假学习进度01

常见的推荐系统的模型:协同过滤推荐模型、基于内容的推荐模型和混合推荐模型推荐算法:  1)基于流行度的算法    比如各种新闻,微博热榜,根据单页点阅率(PV),“访问次数”和“独立访客数(UV),或... 查看详情

寒假学习进度3

  今天主要完成了pyqt库及相应工具的安装,以及简单的实现了界面功能。  开发工具IDE选择pycharm,因为之前就进行过python爬虫学习,所以IDE早就以及安装配置好了。  还有一点需要提的就是pyqt提供一个可视化工具叫QTDesign... 查看详情

寒假自学进度6

今天在B站上面看了python学习视频学习地址:https://www.bilibili.com/video/av14184325菜鸟教程上面有详细的资料目录,在上面进行了一些简单的练习  早上起来的时候看了一部分考研单词,感觉明天还是会忘记。明天还要继续 查看详情

2020年寒假学习进度第十天

 今天主要学习了实验7Spark机器学习库MLlib编程实践,主要代码:importorg.apache.spark.ml.feature.PCAimportorg.apache.spark.sql.Rowimportorg.apache.spark.ml.linalg.Vector,Vectorsimportorg.apache.spark.ml.evaluation.MulticlassClassificationEvaluatorimportorg.apache.spark.ml.P... 查看详情

寒假学习进度

毕业设计: 今天想将原本是用pyqt做的界面换成网页版的,因为考虑到后期可能要部署到云服务器和微信小程序上,所以想要换成网站的。但是之前没有用python编写网站的经验,如果继续采用前端用Java展示,后端用python的话... 查看详情

寒假学习进度报告1

  因为电脑装了太多软件,卡顿对操作十分不便,我决定利用假期自己装系统。  每次装系统都要花钱找电脑店,这让我一个学计算机的学生很羞耻,都不好意思说自己是软件工程的学生。  早就准备好了启动盘,用微pe... 查看详情

寒假学习进度-2(代码片段)

Spark的安装和使用安装的是spark-2.1.0-bin-without-hadoop.tgz修改了Spark的配置文件spark-env.sh添加了配置信息:exportSPARK_DIST_CLASSPATH=$(/usr/local/hadoop/bin/hadoopclasspath)Spark的使用在终端中首先要切换到Spark的目录cd/usr/local/spark之后通过输入bin/s... 查看详情

寒假学习进度-8(热词爬取)(代码片段)

packagehotword;importjava.io.IOException;importorg.jsoup.Connection;importorg.jsoup.Jsoup;importorg.jsoup.nodes.Document;importorg.jsoup.nodes.Element;importorg.jsoup.select.Elements;importdao.Dao;publicclassBaidu1publicstaticvoidmain(String[]args)lianjie("https://baike.baidu.com/item/%E6%89%8B%E6%9... 查看详情

寒假学习进度02

日期:2020.01.15博客期:124星期三  嗯,把这几天学习进度汇总一下:  1、CSV文件、XML文件、JSON文件的处理整合    这一部分详细的让我明天把博客整理出来,你们就能看到了,不过这一部分代码,借鉴了好多其他博主... 查看详情

寒假自学进度8

这两天主要学习了爬虫(在学习爬虫过程中涉及到了学习maven)(https://www.cnblogs.com/zzstdruan1707-4/p/12267141.html)以及scala集合文件模式匹配迭代器等操作(磕磕绊绊没掌握)(补充的第三个实验)(比源代码添加了更多便于理解的... 查看详情

寒假学习进度六

今天看了《梦断代码》的第二章——Agenda之魂,开始我不知道这个单词是什么意思,搜了一下是议程,工作事项的意思。但是理解不了这张名字额意思,看完之后才知道这里的Agenda指的是一个软件,它能接受灵活的输入格... 查看详情