反作弊基本概念与机器学习的应用

嘟嘟_猪 嘟嘟_猪     2022-08-09     665

关键词:

反作弊主要业务流程:

 

常见作弊方式:

机器作弊:机器刷量、任务分发、流量劫持

人为作弊:QQ群/水军、直接人工、诱导

 

常见作弊手段:

电商:刷单,刷信誉,刷好评,职业差评师

支付平台:洗钱,诈骗

广告:数据造假、刷流量 (引流—广告展示—广告点击—转化)

自媒体、社交软件:刷粉丝、刷点击、阅读量

搜索:seo使用作弊手段刷排名(案例:2015蜻蜓FM “普罗米修斯”、“宙斯”函数,修改转化量、流量在前端展现欺骗投资人,被对手反编译识破)

 

广告作弊涉及的点击类型分类:

1、  按照是否找商品找服务为目的

2、  是否按照是否恶意,有无真实转化为依据

(CPC基于点击计费的模式、CPA基于成交的点击进行收费)

 

点击四大分类:

无效点击(没有形成转化的意愿,仅仅浏览)

恶意点击(必须识别出来)

转化点击(真实意愿点击)

误点(不是以找商品为目的,例如内部人员点击,需要识别出来)

 

人群划分:

误点:员工、广告主自己、竞品销售中介、爬虫

恶意点击:同行、同行朋友、联盟站点、机器

 

反作弊策略应对框架:

数据层:鼠标轨迹行为、指纹数据、案例库、行为数据

特征层:离散指标、连续指标

行为识别层:点击识别模型、异常监测模型、流量识别模型、关系图模型、人群识别模型

策略应对层:规则

 

三层监控指标体系,提前预警:

运营指标监控:投诉率、转化率、撞线速率/频率、消耗速率、通过率

规则监控指标:拦截率、准确率、覆盖率

异常监控指标:IP维度、Cookie维度、计费名维度、广告维度、设备维度、鼠标轨迹维度

 

分类监控、分级响应:

1、  针对监控情况、采用四级响应机制;

2、  红色:非常严重,需要自动化采取短期策略应对,例如临时黑名单机制

3、  橙色:较为严重,短信举报,要求4h内完成分析和短平快策略压制,后续进一步处理

 

机器学习在反作弊应用几个案例:

如关联规则、决策树模型:策略挖掘—规则自动提取

确定建模问题:自动发现规则、辅助策略设计;

应用:挖出的规则,上线到离线反作弊系统

评估指标:支持度、置信度、覆盖率、拦截率

 

流量聚类分级模型,kmeans算法:异常行为识别—流量识别

作用:支持流量分级打折策略

例如分为以下类别,特征描述:

1、  主要为品牌浏览器入口,转化效果较好,用户粘性较高;

2、  电话转化很好,包括搜索行为、点击行为、转化行为都较好;

3、  电话转化良好,没有明显的特征异常;

4、  电话转化率略偏低,详情页其它点击行为略偏少;

5、  详情页停留时间短,转化效果特别差;

6、  电话转化很好,无其它任何转化行为,专门点击商业广告,行为非常异常;

7、  点击率高,无转化,行为非常异常.

 

如半监督或图算法:异常行为识别—基于关系发现:

作弊用户标签比较少,如何召回更多的数量?

借助半监督或图算法发现更多的异常用户·

 

SVM算法:异常行为识别—销售识别

作用:识别用户是否销售

数据来源:行为日志,聊天记录

惩罚系数C,选择RBF函数作为kernel的参数gamma的选择.

粗粒度搜索:

  对大数据集,先选择一个较小的子集做粗粒度搜索;

  选择较大的步长,找到一个最优的(c,g)局部区域.

细粒度搜索:

       在局部区域,以较小的步长,找到全局最优的(c,g)

 

如图论与余弦距离:搜索引擎防作弊

图论:作弊的网站一般需要相互链接,以提高自己的排名,这样在互联网大图中形成一些Clique.图论中有专门发现Clique的方法.

余弦距离:那些卖链接的网站,都有大量的出链(这些出链的特点和不作弊的网站出链特点大不相同).每一个网站到其他网站的出链数目可以作为一个向量,计算余弦距离.发现,有些网站的出链向量之间的余弦距离几乎为1.一般来讲这些网站通常是一个人建的,目的只有一个:卖链接.

 

 

 

 

机器学习的基本概念[更新]

1.传统算法与机器学习的区别机器学习:让机器去学习  传统算法:让机器去执行2.人类学习的过程人类的学习过程是一个典型的经验学习的过程。3.机器学习的过程机器学习的过程和人类学习的过程是极为相似的。 &nb... 查看详情

机器学习的基本概念

目录机器学习定义基本概念机器学习之常见应用框架机器学习、数据分析、数据挖掘区别与联系机器学习分类【重要】机器学习开发流程【重要】机器学习之商业场景  一、机器学习定义MachineLearning(ML)isascientificdisciplinetha... 查看详情

机器学习的基本概念

目录机器学习定义基本概念机器学习之常见应用框架机器学习、数据分析、数据挖掘区别与联系机器学习分类【重要】机器学习开发流程【重要】机器学习之商业场景??一、机器学习定义MachineLearning(ML)isascientificdisciplinethatdealswith... 查看详情

机器学习基本概念

内容来源:https://jakevdp.github.io/PythonDataScienceHandbook/00.00-preface.html1、什么是机器学习  机器学习是用数据科学的计算能力和算法能力去弥补统计方法的不足,其最终结果是为那些目前既没有高效的理论支持、又没有高效的计... 查看详情

机器学习:基本概念五大流派与九种常见算法

...了多份解读机器学习基础的图表,其中介绍了机器学习的基本概念、原理、历史、未来趋势和一些常见的算法。一、机器学习概览1.什么是机器学习? 机器通过分析大量数据来进行学习。比如说,不需要通过编程来识别猫或... 查看详情

机器学习与tensorflow——机器学习基本概念tensorflow实现简单线性回归(代码片段)

一、机器学习基本概念1.训练集和测试集训练集(trainingset/data)/训练样例(trainingexamples):用来进行训练,也就是产生模型或者算法的数据集测试集(testingset/data)/测试样例(testingexamples):用来专门进行测试已经学习好的模型或者算法... 查看详情

斯坦福2014机器学习笔记一----基本概念

  一、纲要    机器学习的定义    监督学习(supervisedlearning)和无监督学习(unsupervisedlearning)    回归问题(regressionproblem)与分类问题(classificationproblem)    鸡尾酒宴问题    单变量线性回归问题   二... 查看详情

day-6机器学习概念及应用

...始进行机器学习,首先了解下机器学习和深度学习的一些基本概念和术语:    1、 机器学习概念及应用    2、 深度学习概念及应用    3、 机器学习基本术语及举例    4、 机器学习步骤框架... 查看详情

浅谈活动场景下的图算法在反作弊应用

作者|ANTI导读随着反作弊与作弊黑产对抗愈发激烈,作弊手段日新月异,我们也不断尝试新的方法解决新的作弊问题。本文主要介绍在活动场景下,应用图算法解决社团类型作弊问题。图模型不仅能够同时融入图的拓扑结构和节... 查看详情

分享《机器学习与应用》pdf+雷明+资料学习

...共分为三大部分。第1~3章为第一部分,介绍机器学习的基本原理、所需的数学知识(包括微积分、线性代数、概率论和最优化方法),以及机器学习中的核心概念。第4~20章为第二部分,是主体部分,介绍各种常用的有监督学... 查看详情

从零入门机器学习之基础概念讲解:深入浅出讲解计算机基本概念

...从零入门机器学习的第二篇文章,主要内容是讲解计算机基本概念,之所以要讲解上述内容,主要是由于在后续学习和工作中都会用到以上概念,所以必须提前进行学习。希望能对大家有所帮助。文章目录1.硬件1.1PC->服务器-&g... 查看详情

从零入门机器学习之基础概念讲解:深入浅出讲解计算机基本概念

...从零入门机器学习的第二篇文章,主要内容是讲解计算机基本概念,之所以要讲解上述内容,主要是由于在后续学习和工作中都会用到以上概念,所以必须提前进行学习。希望能对大家有所帮助。文章目录1.硬件1.1PC->服务器-&g... 查看详情

机器学习基本概念和模型训练基本问题

分类与回归的区别二叉树二叉树很容易理解,在这里我们一般用满二叉树:就是非叶子节点都有2个分支的树形数据结构决策树分类决策树最初是用来做决策用的,就好像下面的见不见相亲对象的决策过程一样;如果把最后的决... 查看详情

机器学习基本概念总结(代码片段)

1,余弦相似度与欧氏距离1.1,余弦相似度通过对两个文本分词,TF-IDF算法向量化,利用空间中两个向量的夹角,来判断这两个向量的相似程度:(计算夹角的余弦,取值0-1)当两个向量夹角越大,距离越远,最大距离就是两个向量... 查看详情

机器学习初探——机器学习的基本概念

...容:使计算机从数据中产生“模型”的算法。机器学习的基本术语我们认为将一组数据可以抽象画表示为一个向量Xi,D={X1,X2,X3..Xm}表示包含m个示例的数据集,每一个Xi是由一系列属性描述所构成的,Xij则表示第i个示例的第j个特... 查看详情

基本概念深度神经网络压缩与优化研究_王征韬

深度神经网络压缩与优化研究文献来源:王征韬.深度神经网络压缩与优化研究[D].电子科技大学,2017.摘要:深度学习是近年来机器学习领域最有影响力的研究方向,在计算机视觉、自然语言处理的许多问题上都取得了突出的效果。... 查看详情

什么是ai机器学习与深度学习?(代码片段)

...多资料,很遗憾的是,99%的从业者语文都不怎么过关,连基本的定义都不会下。一个简单的“限定词+更大的集合”的定义模式都没有掌握,深表遗憾。于是还是决定自己来梳理一下吧。有高人说过(花钱买的):你对一个领域... 查看详情

深度学习,机器学习所涵盖的100多个基本概念总结

目录一、基础算法二、经典算法三、机器学习四、优化算法五、特殊技巧 查看详情