为啥预训练的深度学习模型的性能会下降?

     2023-03-13     28

关键词:

【中文标题】为啥预训练的深度学习模型的性能会下降?【英文标题】:Why is there a decrease in the performance of pre-trained Deep Learning models?为什么预训练的深度学习模型的性能会下降? 【发布时间】:2017-10-02 23:13:28 【问题描述】:

使用来自 Keras 的模型和权重对受感染/未受感染的 RBC(这是预训练的 DL 模型以前从未见过的)进行二元分类。我发现模型(vgg16,19,xception)的性能随着训练和验证实例数量的增加而下降。为什么?

【问题讨论】:

您是否要在最终预测中添加一个新类?输出维度增加了? 【参考方案1】:

也许它与您正在进行推理的资源管理有关,并且模型在内存中扩展,它会降低性能。这种情况会创建大量的主内存访问来执行前向传递计算,并且会发生页面错误,并且会降低性能。

希望这会有所帮助。

【讨论】:

谢谢。问题是我在微调网络以学习新功能时没有使用足够数量的 epoch。随着我增加 epoch 的数量并使用 SGD 学习率进行排列,我可以发现性能正在提高。

针对新数据点更新预训练的深度学习模型

】针对新数据点更新预训练的深度学习模型【英文标题】:Updatingpre-trainedDeepLearningmodelwithrespecttonewdatapoints【发布时间】:2019-05-0613:51:54【问题描述】:以ImageNet上的图像分类为例,如何使用新数据点更新预训练模型。我已经加... 查看详情

减少用于特征生成的预训练深度学习模型的大小

】减少用于特征生成的预训练深度学习模型的大小【英文标题】:reducesizeofpretraineddeeplearningmodelforfeaturegeneration【发布时间】:2017-07-2306:35:36【问题描述】:我在Keras中使用预训练模型为一组图像生成特征:model=InceptionV3(weights=\'i... 查看详情

深度学习正则化---提前终止

提前终止??在对模型进行训练时,我们可以将我们的数据集分为三个部分,训练集、验证集、测试集。我们在训练的过程中,可以每隔一定量的step,使用验证集对训练的模型进行预测,一般来说,模型在训练集和验证集的损失变... 查看详情

《自然语言处理实战入门》深度学习----预训练模型的使用(albert)

...务。albert的使用参考文献简介bert回顾bert两阶段模式:预训练+微调BERT的总体预训练和微调程序。除了输出层,在预训练和微调中都使用相同的体系结构。相同的预训练模型参数用于初始化不同下游任务的模型。 查看详情

为啥缩放训练和测试数据后我的 SVM 的性能会下降?

】为啥缩放训练和测试数据后我的SVM的性能会下降?【英文标题】:WhydoesmySVM\'sperformancedropafterscalingthetrainingandtestdata?为什么缩放训练和测试数据后我的SVM的性能会下降?【发布时间】:2014-11-2801:30:16【问题描述】:我正在使用s... 查看详情

为啥我需要在迁移学习中预训练权重

】为啥我需要在迁移学习中预训练权重【英文标题】:WhyIneedpre-trainedweightintransferlearning为什么我需要在迁移学习中预训练权重【发布时间】:2019-06-1518:39:02【问题描述】:我正在学习使用一些预训练模型(vgg16、vgg19、...)的迁... 查看详情

手把手写深度学习(14):如何利用官方预训练模型做微调/迁移学习?(以resnet50提取图像特征为例)

前言:对于transformer、resnet等网络较深、很难训练的模型,使用官方提供的预训练模型,然后在自己的数据集/应用场景下微调,同样能取得非常棒的效果,也是最省时省力的方法。本文以训练一个resnet50网络来提取图像特征为例... 查看详情

深度解析预训练权重的本质和作用:你真的了解它们吗?(代码片段)

文章目录🌟写在前面🌟预训练权重的本质是什么?🌟为什么要使用预训练权重?🌟预训练权重会影响模型的性能吗?🌟改进自定义模型是否需要使用预训练权重?改变了网络结构后,预... 查看详情

深度学习前沿应用图像分类fine-tuning(代码片段)

...习前沿应用】图像分类Fine-Tuning(文章目录)前言1.什么是预训练-微调模式?在计算机视觉领域,预训练-微调模式已经沿用了多年,即在大规模图片数据集预训练模型参数,然后将训练好的参数在新的小数据集任务上进行微调,从而... 查看详情

深度学习前沿应用图像分类fine-tuning(代码片段)

...习前沿应用】图像分类Fine-Tuning(文章目录)前言1.什么是预训练-微调模式?在计算机视觉领域,预训练-微调模式已经沿用了多年,即在大规模图片数据集预训练模型参数,然后将训练好的参数在新的小数据集任务上进行微调,从而... 查看详情

带有污染训练数据的深度时间序列异常检测模型的鲁棒学习

...传统方法。然而,这些深度TSAD方法通常依赖于干净的训练数据集,不受异常污染,以学习潜在动态的“正常剖面”。这个要求很重要,因为在实践中很难提供干净的数据集。此外,在没有意识到它们的鲁棒性... 查看详情

你都有哪些炼丹神器深度学习(rnn、cnn)调参的经验?

...神器可能包括:调节学习率:学习率较小可以保证模型在训练时稳定,但是训练速度较慢;学习率较大可能会使模型在训练时快速收敛,但是有可能导致过拟合。调节隐藏单元数量:隐藏单元较多可以增加模型的表示能力,但是... 查看详情

「深度学习一遍过」必修28:基于c3d预训练模型训练自己的视频分类数据集的设计与实现(代码片段)

...修篇 目录1DownLoadorClone 2数据集准备3代码调试3.1下载预训练模型3.2 配置数据集和预训练模型路径3.3修改label.txt文件3.4运行 查看详情

「深度学习一遍过」必修28:基于c3d预训练模型训练自己的视频分类数据集的设计与实现(代码片段)

...修篇 目录1DownLoadorClone 2数据集准备3代码调试3.1下载预训练模型3.2 配置数据集和预训练模型路径3.3修改label.txt文件3.4运行 查看详情

预训练模型代码深度剖析之开宗明义:新学常见误区和正确的学习姿势

  最近在给新徒弟讲授预训练模型的过程中,发现了初学者的几个误区,分别是:在整个学习过程中,重理论轻代码,忽略了将论文和代码进行对齐,而由于代码中往往包括了一些论文中不曾讲到的细节,所以也未曾达到全面... 查看详情

keras深度学习实战——基于vgg19模型实现性别分类(代码片段)

...基于VGG19模型实现性别分类0.前言1.VGG19架构简介2.使用预训练VGG19模型进行性别分类2.1构建输入与输出数据2.2模型构建与训练2.3模型错误分类示例相关链接0.前言在《迁移学习》中,我们了解了利用迁移学习,只需要少量样... 查看详情

为啥我的学习率会下降,即使损失正在改善?

】为啥我的学习率会下降,即使损失正在改善?【英文标题】:Whydoesmylearningratedecrease,evenwhenlossisimproving?为什么我的学习率会下降,即使损失正在改善?【发布时间】:2020-10-0809:31:59【问题描述】:我正在GoogleColabTPU上训练我的K... 查看详情

bert:深度双向预训练语言模型

...04805BERT(BidirectionalEncoderRepresentationsfromTransformers)通过预训练来学习无标注数据中的深度双向表示,预训练结束后通过添加一个额外的输出层进行微调,最终在多个NLP任务上实现了SOTA。预训练语言模型在实践中证明对提高很多... 查看详情