算法竞赛五冠五亚得主,手把手带你了解算法竞赛

turingbooks turingbooks     2023-01-24     661

关键词:

大家好,我是王贺(鱼遇雨欲语与余),一个工作两年的推荐广告算法工程师,热爱算法竞赛。今天跟大家聊聊我的新书《机器学习算法竞赛实战》,以及我的竞赛经历。明天晚上的直播我会以天池平台开放的二手车交易价格预测为例从实战入手讲解机器学习竞赛的流程和几个核心的算法竞赛方向。

写书的缘起

说起本书,便要追溯到2019年4月19日人民邮电出版社策划编辑陈兴璐在知乎上发给我的一则信息,其中讲到她看过我很多有关算法竞赛的文章,而且多次在算法竞赛中获奖,因此期待我能出版一本关于算法竞赛的图书。大概在2018年初,我就已经创建了专栏开始分享竞赛相关的文章,一路走来持续输出,目前的文章总浏览量达到百万。这次收到来信以及希望出版算法竞赛图书的邀请,是对我分享竞赛知识和已取得成绩的莫大认可,我欣然答应了写作邀请,并确定以「机器学习算法竞赛实战」作为书名。

为了完成本书,我邀请了我的竞赛老队员刘鹏(国内多次竞赛的冠亚军),陈兴璐编辑向我推荐了钱乾(Kaggle竞赛平台的grand master,国内最早一批竞赛选手)。另外,考虑到每个人擅长的点不同,我们进行了明确的章节分工,以保证每个章节的质量。

在确定目录章节的时候也得到了@李凯东@DOTA@大野人007@inf.turing的建议,虽然这些人没有成为作者之一,但也对本书做出了很大的贡献,在此一并表示感谢。

关于这本书

本书以算法竞赛为引导,给出了采用机器学习解决实际问题的主要过程,从问题建模、数据探索、特征工程、到模型训练和模型融合,并分别列举了这个过程中的主要难点要点、通用思路和解决方法。在后续章节中,以实际的竞赛题目为落脚点,阐述和佐证如何通过问题剖析、数据治理、融合探索等方法论,使得算法逐步发挥其重要作用。

对于本书的章节架构,我们除了进行仔细的讨论外,还采纳了国内多名顶尖竞赛选手的建议。算法竞赛本身涵盖的范围是很大的,我们的理念是剖析其最本质的内容,然后结合多个领域模块进行实战讲解,这也是本书的一大特色。

本书分为以下四个部分:

Part1

磨刀事半,砍柴功倍

这部分以算法竞赛的通用化流程为主,介绍竞赛中各个部分的核心内容和具体工作,且每章都配有具体的实战部分,以便加深理解。

Part2

物以类聚,人以群分

这部分主要介绍用户画像相关的问题,构建完善的标签体系是用户画像的核心,也是解决用户画像类赛题的关键,比如个性化推荐和金融风控等问题都需要用户画像作为支撑。为了帮助读者加快对此类竞赛问题的学习、理解,会讲解具体的竞赛案例,即Kaggle平台的Elo Merchant Category Recommendation。

Part3

以史为鉴,未来可期

这部分以时间序列预测问题为主,先讲述这类问题的常见解题思路和技巧,然后分析两个具体的实战案例,分别是天池平台的全球城市计算AI挑战赛和Kaggle平台的Corporación Favorita Grocery Sales Forecasting。

Part4

精准投放,优化体验

与计算广告相关的业务都是很好的竞赛题目,这部分主要介绍了计算广告的核心技术和业务,包括广告召回、广告排序和广告竞价。实战案例部分则包括两道赛题,分别是2018腾讯广告算法大赛——相似人群拓展和Kaggle平台的TalkingData AdTracking Fraud Detection Challenge。

Part5

听你所说,懂你所写

这部分基于自然语言处理相关的内容进行讲解,包括常见任务和常见技术,实战案例部分是Kaggle平台上的经典竞赛Quora Question Pairs。

本书是算法竞赛领域第一本系统性介绍竞赛的书籍,不仅包含竞赛的基本理论知识,还结合多个方向和案例详细阐述了竞赛中的上分思路和技巧。

我的算法竞赛之路

19年写过一篇关于我的竞赛历程的文章「这两年:我的数据竞赛之路」,这篇可以看成我的竞赛之路的上半程,如今我想应该是介于上半程和下半程之间,毕竟我还是会将竞赛持续到底。

取得更多成绩

不同之前,参加比赛的次数少了很多,更多的是找些自己感兴趣的比赛参加。

着手赛题设计

最近一年参与了多个比赛的赛题设计,单个赛题报名人数超1万,累计报名人数超3万。并提供赛题baseline和学习文档,帮助更多人快速入门竞赛。不同于参加比赛,竞赛的设计需要考虑的赛题难易程度、赛题可玩性、知识点多样性以及数据的稳定性。

竞赛经验分享

在过去,我还多次进行有关竞赛相关的分享,不仅将我的个人竞赛经验分享给更多人,同时也让更多人了解到算法竞赛。

写在最后

本书的写作过程并不轻松,利用的基本是晚上下班之后的时间,定期还要和刘鹏、钱乾进行线上会议,讨论近期的写作进度,以及相互审阅内容。最后再次感谢刘鹏和钱乾两位作者所做的巨大贡献,两位所具备的丰富的竞赛经验也是促使本书能够更加高质量完成的一个重要因素。

希望本书能够成为连接机器学习理论和应用实战之间的桥梁,希望能够帮助你在竞赛道路上走的更加顺畅。

最后,对算法竞赛感兴趣的小伙伴可以来观看我的直播分享,天晚上19点,我在图灵社区和天池读书会手把手带你了解竞赛,以天池平台开放的二手车交易价格预测为例从实战入手讲解机器学习竞赛的流程和几个核心的算法竞赛方向。

☟ 一键五折购买

算法实践|手把手带你实现快速排序算法

...分析,接着写了关于经典的冒泡排序算法《​​利用Python手把手带上实现冒泡排序​​》,算法虽然枯燥,但是当你深入了解就会感受到其中的趣味。在算法的学习中不但可以学会如何思考问题,提高自己的逻辑能力,还能在这... 查看详情

普通学生如何面对acm,算法金奖得主带你领略

首先要给大家介绍一下ACM-ICPC的相关背景和信息:国际大学生程序设计竞赛ACM-ICPC实际上叫ICPC,它的举办方是美国计算机协会ACM,近几年变成了某Jb协会(不是我开荒枪,它的简称缩写就是这个哦),国... 查看详情

算法竞赛入门经典第2版第1章(代码片段)

...步了解变量的含义  掌握变量交换的三变量法  理解算法竞赛中的程序三部曲:输入、计算、输出  记住算法竞赛的目标及其对程序的要求        &n 查看详情

算法竞赛入门经典(第2版)+算法艺术与信息学竞赛pdf-高清版免费下载

下载地址:网盘下载备用地址:网盘下载  查看详情

算法竞赛从入门到进阶(代码片段)

算法竞赛从入门到进阶1.算法竞赛概述1.1C语言中输入输出函数putchar()getcharprintf()scanf()puts()gets()sscanf()1.2输入结束方式 while(scanf("%d%d",&a,&b)!=EOF)     //等价于 while(~scanf("%d%d",&a,&b)) 查看详情

《算法竞赛入门经典(第二版)》pdf

...下载内容简介  · · · · · ·《算法竞赛入门经典(第2版)》是一本算法竞赛的入门与提高教材,把C/C++语言、算法和解题有机地结合在一起,淡化理论,注重学习方法和实践技巧。全书内容分为12章,... 查看详情

深度学习攻防对抗(jcai-19阿里巴巴人工智能对抗算法竞赛)

最近在参加IJCAI-19阿里巴巴人工智能对抗算法竞赛(点击了解),初赛刚刚结束,防御第23名,目标攻击和无目标攻击出了点小问题,成绩不太好都是50多名,由于找不到队友,只好一个人跟一群大佬PK,双拳难敌四手,差点自闭... 查看详情

算法笔记竞赛图(有向完全图)(相关题型总结)(代码片段)

整理的算法模板合集:ACM模板目录竞赛图(有向完全图)一、兰道定理例题HDU5873FootballGames二、求竞赛图的任意三元环三、求竞赛图的哈密顿回路数量的期望竞赛图(有向完全图)竞赛图也叫有向完全图。每对... 查看详情

算法竞赛之排序算法初入门

                            关于排序的一些知识点   &nbs 查看详情

算法竞赛入门经典刘汝佳

        点击图片或此处下载  查看详情

《算法竞赛入门经典》之“算法设计与优化策略”

一。构造法UVA120 StacksofFlapjacksTimeLimit: 3000MS  64bitIOFormat: %lld&%lluSubmit Status uDebugDescriptionBackgroundStacksandQueuesareoftenconsideredthebreadandbutt 查看详情

12月学习进度13/31——算法竞赛打卡飞行员兄弟(代码片段)

飞行员兄弟“飞行员兄弟”这个游戏,需要玩家顺利的打开一个拥有161616个把手的冰箱。已知每个把手可以处于以下两种状态之一:打开或关闭。只有当所有把手都打开时,冰箱才会打开。把手可以表示为一个4×44×44... 查看详情

算法艺术与信息学竞赛书摘

《算法艺术与信息学竞赛》这本书我详细看了1.1、1.2、1.3,之后就看得不是很懂了,所以还是把摘要写出来,方便让我知道到底能学到什么。 第一章算法与数据结构“数据结构+算法=程序设计”从理论分析和实际应用... 查看详情

如何在原数组的基础上生成树状数组

...典TSP问题中等,状态压缩DP中等中等,树形DP。可参考《算法艺术与信息学竞赛》动态规划一节的树状模型中等,《算法艺术与信息学竞赛》中的习题中等,《算法艺术与信息学竞赛》中的习题中等,《算法艺术与信息学竞赛》... 查看详情

1150:零起点学算法57——程序设计竞赛

1150:零起点学算法57——程序设计竞赛TimeLimit:1Sec  MemoryLimit:64MB  64bitIOFormat:%lldSubmitted:1303  Accepted:742[Submit][Status][WebBoard]Description 每年5月份,省里都要举行程序设计竞赛。为了让最优秀的 查看详情

笔记算法竞赛入门经典

contents基础题目选解WERTYU、数据结构基础暴力求解法高效算法设计动态规划初步数学概念与方法图论模型与算法 1、WERTYU刚开始的思路是output[‘S‘]=‘A‘。。。书上的常量表应该会比较通用一点。。而不仅仅适于有序常量。i... 查看详情

算法竞赛入门暑期速成计划(代码片段)

算法竞赛入门【暑期速成计划】(二)(文章目录)前言习题训练(码题集)1.赌石【AC代码】#include<iostream>#include<cstdio>#include<cmath>#include<algorithm>usingnamespacestd;typedeflongdoubleLD;LDC_div(intk,intn)LDres=1; 查看详情

1123:零起点学算法30——参加程序设计竞赛

1123:零起点学算法30——参加程序设计竞赛TimeLimit:1Sec  MemoryLimit:64MB  64bitIOFormat:%lldSubmitted:3045  Accepted:1353[Submit][Status][WebBoard]Description 每年我们都有不少同学去参加程序设计竞赛。考虑到 查看详情