直播预告:淘宝因果表征学习与模型泛化实践

阿里巴巴淘系技术团队官网博客 阿里巴巴淘系技术团队官网博客     2023-03-19     332

关键词:

直播预约

10月19日,19:00-20:30,大淘宝技术与DataFun联合策划了本次活动,邀请大淘宝技术两位算法工程师就因果表征学习和模型泛化相关主题进行深度分享与交流,欢迎大家按时收看直播~

视辰 大淘宝技术 高级算法专家

个人介绍:大淘宝技术,视觉基础算法,主要负责直播、点淘、首猜、逛逛和中台的内容分类标签与内容负向治理。

演讲主题:无偏数据增强:因果表征学习与因子可控生成的协同

内容简介:

小样本细粒度的图像分类问题是各个业务场景中的常见问题,比如商品的多级类目识别、妆容的不同风格划分等。此类业务场景中,通常只能获得粗粒度的大类分类标注数据,而细粒度的样本和标注则由于收集和标注难度难以获得。数据增强方法是解决小样本细粒度识别问题的有效途径之一,但传统数据增强方法大多是在图像或特征空间进行的,无法做到因子级别的数据增强和样本对比,也难以保证扩展样本的安全性和有效性。因此,本文通过巧妙地融合前沿的图像生成与表征方法,基于因果学习的机器学习新范式,从少量细粒度标注样本中进行生成因子无偏分布的样本自动扩展,在与10个SOTA的数据增强方法、3个SOTA的细粒度分类方法相比,能够在多个小样本细粒度分类任务上提升10%以上的识别精度。

演讲提纲:

1. 研发动机:细粒度识别问题的业务痛点与技术趋势;

2. 观察发现:从因果学习的角度来看细粒度识别问题与数据增强技术;

3. 解法创新:因子级无偏数据增强;

4. 未来工作:融合多模态预训练的属性可控数据增强。

听众收益:

1. 深入浅出介绍因果表征学习的机器学习新范式;

2. 从因果表征学习的视角,rethinking 分类算法与数据增强;

3. 从因果表征学习的视角,展望图文预训练表征学习与因子可控生成两大前沿技术的融合未来。

杨璨乾 阿里巴巴 大淘宝技术 实习算法工程师

个人介绍:上海交通大学本硕,阿里巴巴集团-大淘宝技术研究型实习生。研究方向是基于传统算法和深度学习的图像增强技术,包括色彩增强、超分辨率重建、去噪等方向。担任过 IEEE-TCSVT 等会议期刊审稿人。在 CVPR,ECCV,AAAI 等计算机视觉和深度学习顶会上发表论文7篇;其中第一作者论文2篇,为淘宝实习期间产出。

演讲主题:基于级联查找表的实时色彩增强方法

演讲提纲:

1. 背景介绍:色彩增强的定义与意义

2. 相关方法:传统查找表方法与动态神经网络方法的结合

3. 工作动机:单一类型查找表的优势与局限

4. 核心思路:动态、自适应地为不同输入图像生成级联的一维和三维查找表,用于进行色彩变换

5. 方法实现:模块设计和高效计算实现

6. 结果展望:公开数据集结果和应用场景展望

听众收益:

1. 如何看待追求单一模型泛化能力的大趋势?

2. 分治设计的好处是什么?

3. 怎么进一步压榨查找表的性能?

直播预告cikm2022论文分享:多场景个性化推荐的场景自适应自监督模型

直播预约12月29日,19:00-20:00,大淘宝技术与DataFun联合策划了本次活动,邀请了大淘宝技术的算法工程师就淘宝个性化推荐模型相关主题进行深度分享与交流,欢迎大家按时收看直播~张远亮阿里巴巴大淘宝技术高... 查看详情

直播预告从校园学习到职场实践3:测试开发

To 互联网技术专业的同学们,9月开学正值高校求职季,同学们可能关心这些问题:互联网相关专业的学生如何寻找适合自己的职业发展道路?如何规划校园学习以便适应职场工作?校招生进入大型互联网公司后如... 查看详情

基于机器学习的带宽估计在淘宝直播中的探索与实践

...基础技术团队,基于机器学习的带宽预测算法在淘宝直播的业务背景下的探索与大规模实践的成果。背景常见的媒体传输中带宽估计的算法有GCC/BBR/PCC/QUBIC等,主要基于传统的基于策略的算法白盒地根据历史网络数据以及... 查看详情

直播预告|端云协同的淘宝机器学习系统

2022年7月,被誉为「系统界的奥斯卡」国际顶会OSDI首次收录淘宝系统论文,自研端云协同机器学习系统Walle(瓦力)获得大会主旨发言者推荐。8月25日,19:00-20:30,DataFun与大淘宝技术联合策划了本次活动... 查看详情

直播预告从校园学习到职场实践(第一讲)

第一讲主题:后端技术:刚毕业的我能在服务10亿用户的系统工程中做什么?To互联网技术专业的同学们, 9月开学正值高校求职季。互联网相关专业的学生如何寻找适合自己的职业发展道路?如何规划校园学... 查看详情

python机器学习及实践——进阶篇3(模型正则化之欠拟合与过拟合)(代码片段)

一个需要记住的重要事项:任何机器学习模型在训练集上的性能表现,都不能作为其对未知测试数据预测能力的评估。这里讲详细及时什么是模型的泛化力以及如何保证模型的泛化力,一次会阐述模型复杂度与泛化力... 查看详情

直播预告阿里云服务网格asm产品易用性改善实践与思考

...格不仅技术门槛高,而且很容易出错。为此开设本次直播,将分享过去几个月ASM在产品易用性上的工作进展和 查看详情

机器学习研究的12个宝贵经验

...不意味着准确可表征并不意味着可学习相关性并不意味着因果关系二、主要内容< 查看详情

直播预告|敲黑板,划重点,智能模型平台知识点讲解

...家详解智能模型平台——「业务安全大讲堂第十期」-CSDN直播http://t.csdn.cn/EGgQj11月24日,顶象第十期业务安全大讲堂系列课程即将开讲!本期直播将由顶象研发总监&人工智能专家无常围绕智能模型平台的开发与部署展... 查看详情

python机器学习及实践——进阶篇3(模型正则化之欠拟合与过拟合)(代码片段)

一个需要记住的重要事项:任何机器学习模型在训练集上的性能表现,都不能作为其对未知测试数据预测能力的评估。这里讲详细及时什么是模型的泛化力以及如何保证模型的泛化力,一次会阐述模型复杂度与泛化力... 查看详情

网易云课堂直播预告:直播中视频编码实践经验总结

一、直播预告主题:直播中视频编码实践经验总结时间:2016年11月23日20点地址:http://study.163.com/course/introduction.htm?courseId=1003413003#/courseDetail二、演讲者:朱玲:网易视频云高级研发工程师,音视频专家... 查看详情

网易云课堂直播预告:直播中视频编码实践经验总结

一、直播预告主题:直播中视频编码实践经验总结时间:2016年11月23日20点地址:http://study.163.com/course/introduction.htm?courseId=1003413003#/courseDetail二、演讲者:朱玲:网易视频云高级研发工程师,音视频专家... 查看详情

直播预告丨开源sdn互通实战演示与经验分享

...互通及服务链的演示。7月9日本周四19点,TF中文社区线上直播活动,将由华胜天成网络架构师王峻,和您一起聊聊TungstenFabric在企业统一管理平台中的作用和表现。本期活动,由TF中文社区与SDNLAB合作举办。作为开源SDN的代表,Tu... 查看详情

机器学习多项式回归与模型泛化(下)

...合overfitting偏差和方差有一些算法天生高方差,KNN非参数学习通常都是高方差算法。因 查看详情

淘宝直播全屏页重排算法实践

本文旨在分享正负反馈序列建模与多目标优化在淘宝直播排序上的实践经验。背景介绍直播带货是“内容+电商”这种新商业模式最火热的应用之一,传统互联网电商如PDD、JD等均已上线直播带货平台,众多内容赛道玩... 查看详情

机器学习多项式回归与模型泛化(上)

一、什么是多项式回归直线回归研究的是一个依变量与一个自变量之间的回归问题,但是,在畜禽、水产科学领域的许多实际问题中,影响依变量的自变量往往不止一个,而是多个,比如绵羊的产毛量这一变量同时受到绵羊体重... 查看详情

ylearn因果推断入门实践——kaggle银行客户流失(代码片段)

YLearn的因果学习开源项目,它提供了一站式处理因果学习完整流程的开源算法工具包,解决了因果学习中的因果发现、因果量识别、因果效应估计、反事实推断和策略学习等五大关键问题,可以有效帮助客户进一步提... 查看详情

周志华机器学习--模型评估与选择

周志华机器学习–模型评估与选择第一章绪论第二章模型评估与选择第三章线性模型第四章决策树第五章支持向量机第六章神经网络第七章贝叶斯分类器第八章集成学习和聚类文章目录周志华机器学习--模型评估与选择一、泛化... 查看详情