正文

吴恩达-医学图像人工智能专项课程-第一课第一周13-15节-迁移学习+数据增强

Tina姐  Tina姐  2022-12-07  367

关键词：

回顾一下医学图像深度学习面临的三个挑战

三个挑战

我们将讨论医学图像训练算法的三个关键挑战：类不平衡挑战、多任务挑战和数据集大小挑战。对于每一个挑战，我们将介绍一到两种应对方法。

类别不平衡：可以使用加权的 loss weighted loss, 或者是均衡采样（resampling）
多任务：多标签loss
数据集大小：迁移学习 + 数据增强

类别不平衡和多任务挑战已经详细描述过了。让我们看看第三个挑战，即数据集大小挑战。

对于许多医学成像问题，选择的结构是卷积神经网络，也称为ConvNet或CNN。

它们被设计用来处理像x射线一样的二维图像。但这些变体也非常适合于医学信号处理或像CT扫描这样的3D医学图像。

我们将在未来一周进行研究。一些卷积神经网络结构，如Inception、ResNet、DenseNet、ResNeXt和EfficientNets已经被提出，在图像分类中得到了广泛的应用。

在这里插入图片描述

这些体系结构由各种构建块组成。在医疗问题中，标准是在期望的任务上尝试多个模型，看看哪一个最有效。

挑战在于，所有这些体系结构都需要大量的数据，并从图像分类数据集中找到的数百万个示例中获益。

在医学问题上，如果没有上百万的例子，我们怎么还能应用这些技术呢？

主要有两种办法:

1 预先训练网络 pretraining

一种解决方案是预先训练网络。

这里的想法是先通过自然图像建立网络，然后学习识别对象，如企鹅、猫或狗，然后将这个网络作为学习的起点，通过复制学习到的特征。然后，该网络可以进一步训练，以查看胸部X光片，并确定是否存在疾病。

这个过程的想法是：当我们学习识别猫或狗的第一个任务时，网络将学习一般特征，这将有助于它学习医学任务。

这方面的一个例子可能是，有助于识别企鹅边缘的特征，也有助于识别肺部的边缘，从而有助于识别某些疾病。

当我们把这些特征转移到我们的新网络中时，这个网络就可以有一个更好的起点来学习新的胸部X线解释任务。

第一步称为预训练（pretraining），第二步称为微调(fine-tuning)。

一般来说，网络的早期层捕获的是可概括的低级图像特征，而后一层则捕获更高级或更具体的任务细节。

例如，早期的层可能会了解到物体的边缘，这可能对以后的胸部X光检查有帮助。但后面的几层，可能会学习如何识别企鹅的头部，对胸部X光片的判读可能没有用处。

所以当我们在胸部X光片上对网络进行微调时，我们可以冻结浅层所学的特征，而只需微调深层。

在实践中，两个最常见的设计选择是一个，微调所有图层；二，只微调后面或最后一个图层，而不微调前面的图层。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-BskwTHqj-1626014561421)(https://files.mdnice.com/user/15745/535fc0d2-842c-49d4-b736-c984e2bb58d3.png)]

这种预训练和微调的方法也称为迁移学习，是解决小数据集挑战的有效方法。

2 数据增强生成更多样本

让我们谈谈数据集大小挑战的第二个解决方案。这样做的目的是欺骗网络，让他们认为我们有比实际情况更多的训练例子。

在我们将一张X射线图像传送到网络之前，我们可以对其进行转换（transform）。我们有几种选择。

我们可以对它进行旋转、平移、放大，或者更改亮度或对比度，或者应用这些变换的组合。这种方法称为数据扩充（data augmentation）。

在实践中，有两个问题驱动着我们选择的数据增强方法。

第一个问题是，我们是否认为数据增强方法反映了将有助于模型概括测试集以及真实世界场景的变化。

例如，我们可能认为在自然X射线中我们可能会看到对比度的变化，所以我们可能会有一个改变图像对比度的变换。

第二个设计选择是验证我们的数据增强是否保持标签不变。

例如，如果我们在横向翻转患者的X光片，这意味着将左侧翻转到右侧，右侧翻转到左侧，那么他们的心脏将出现在图像的左侧。这是身体的右边。然而，正常的标签将不再适用，因为这实际上是一种罕见的心脏病，称为右心，你的心脏指向你的胸部右侧，而不是左侧。所以这不是一个保留标签的转换。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-1zhGLN3r-1626014561424)(https://files.mdnice.com/user/15745/fc0b7491-ddf8-4381-bbec-c6dcad989694.png)]

这里的关键是我们想让网络学会通过这些变换来识别仍然具有相同标签而不是不同标签的图像。

除了X光之外，还有其他有用的数据扩充程序用于其他任务。例如，旋转和翻转对于训练检测皮肤癌的算法很有用。

在组织病理学中，真实世界变化的一个主要来源是在这些显微图像中看到的不同色调的粉红色和紫色。颜色噪音经常被加入，所有这些只是有轻微的不同色调的粉红色和紫色，以帮助网络泛化。

此外，旋转和裁剪也是组织病理学图像中有用的数据增强程序。

总结

我们已经研究了加权损失和重采样方法，以解决类不平衡问题。我们已经研究了多标签损失，以便网络能够在胸部X光片中识别多种疾病。我们还介绍了迁移学习和数据扩充过程，作为解决拥有小训练数据集挑战的方法。

文章持续更新，可以关注微信公众号【医学图像人工智能实战营】获取最新动态，一个关注于医学图像处理领域前沿科技的公众号。坚持已实践为主，手把手带你做项目，打比赛，写论文。凡原创文章皆提供理论讲解，实验代码，实验数据。只有实践才能成长的更快，关注我们，一起学习进步~

我是Tina, 我们下篇博客见~

白天工作晚上写文，呕心沥血

觉得写的不错的话最后，求点赞，评论，收藏。或者一键三连
在这里插入图片描述

吴恩达-医学图像人工智能专项课程-第一课第一周11节总结(代码片段)

回顾一下医学图像深度学习面临的三个挑战三个挑战我们将讨论医学图像训练算法的三个关键挑战：类不平衡挑战、多任务挑战和数据集大小挑战。对于每一个挑战，我们将介绍一到两种应对方法。类别不平衡：可以... 查看详情

吴恩达-医学图像人工智能专项课程-第一课第一周12-13节多任挑战总结(代码片段)

前面我们已经学习了如何处理类别不平衡。这节课我们来探讨第二个挑战-多任务挑战目前为止，我们已经研究了二分类，我们关心的是一个例子是否是有mass疾病。然而，在现实世界中，我们关心的是对许多此类... 查看详情

吴恩达-医学图像人工智能专项课程-第一课第一周19-20节(代码片段)

让我们回顾一下上一节提出的医学图像创建数据集的三个挑战第一个挑战涉及到我们如何使这些测试集独立第二个挑战涉及我们如何对它们进行采样第三个挑战涉及我们如何设置groundtruth让我们来讨论第二个挑战：集合抽样... 查看详情

吴恩达-医学图像人工智能专项课程-第一课第一周4-5节总结(代码片段)

...了令人难以置信的成绩。然后我们将进入为医学影像构建人工智能模型的训练过程。最后ÿ 查看详情

吴恩达-医学图像人工智能专项课程-第一课第一周1-3节(代码片段)

欢迎来到医学人工智能专业。如果你已经完成了深度学习专业化或机器学习课程，并且你正在寻找更深入掌握人工智能的应用领域，这是一个很好的专业化学习。要想成为真正优秀的机器学习，最重要的事情之一就是... 查看详情

吴恩达-医学图像人工智能专项课程-第一课第一周6-10节总结+作业解读(代码片段)

现在，您已经了解了深度学习在医学图像分类问题上的一些前沿应用。本文将介绍第一课第一周6-10节的内容。主要讲解构建一个分类模型去识别胸片的肿块。以及分类模型将面临的三个挑战：类不平衡挑战、多任务挑战... 查看详情

吴恩达-医学图像人工智能专项课程-第一课第一周16-18节-如何确保数据集病人不重叠+作业解说(代码片段)

模型测试既然你已经了解了如何训练医学诊断模型，那么让我们来谈谈如何测试这样的模型。接下来你会学习如何测试这样的一个模型。您将学习如何正确使用训练、验证和测试集。以及为了评估你的模型需要强大的groundtrut... 查看详情

吴恩达-第一课第二周1-7节总结-医学深度学习模型的评估汇总(代码片段)

医学深度学习模型的评估汇总本周我们将深入探讨医学深度学习模型的评估。在医学上，由于决策具有很高的影响力，我们关心的是准确地了解模型何时对患者起作用，什么时候不起作用。您将学习一下指标，包... 查看详情

第一课第三周大作业--mri脑肿瘤自动分割教程(代码片段)

...1骰子相似系数4.2softdiceloss5创建模型5.1训练6评估作业文件吴恩达-医学图像AI专项课程-作业/第一课/第一查看详情

吴恩达深度学习课程第一课—神经网络与深度学习—第一周练习

...网络和深度学习第一周-深度学习简介第1题“人工智能是新电力”这个比喻指的是什么？A.人工智能为我们的家庭和办公室的个人设备供电，类似于电力。B.通过“智能电网”，人工智能正在传递新一波的电... 查看详情

吴恩达-第一课第二周8-10节-什么是置信区间，有什么作用

在这节课中，我们将了解评估医学模型的另一个非常重要的方面，即报告我们的评估中的可变性。我们将研究如何使用置信区间来显示这种可变性。假设一家医院有5万名病人，我们想知道我们的胸部x光模型对每个人... 查看详情

第一课第一周大作业-胸部14种疾病分类-代码详解(代码片段)

...01;您将通过使用Keras构建最先进的胸部X射线分类器来探索医学图像诊断。你将学会一下内容：预处理真实世界的X射线数据集使用迁移学习重新训练DenseNet模型以进行X射线图像分类学习一种处理类别不平衡的技术查看详情

吴恩达实验（神经网络和深度学习）第一课第三周，代码和数据集，亲测可运行

代码和数据集已上传到文件中应该可以直接下载吧（第一次上传文件，感觉是），解压后把文件夹拷贝到jupyter工作空间即可注：我对下载的代码的格式稍作了修改，原来定义函数与调用函数在两个单元格里，我直接运行他总给... 查看详情

第二课第一周大作业--构建和评估一个线性风险模型(代码片段)

之前教程：第二课第一周第1节-AI用于医学预后简介第二课第一周第2节-做医学预后，你需要掌握什么？第二课第一周第3-4节-什么是预后?第二课第一周第4-7节医学预后案例欣赏+作业解析第二课第一周第8节风险得分... 查看详情

第二课第一周大作业--构建和评估一个线性风险模型(代码片段)

第二课第一周1节-ai用于医学预后简介

第二门课程集中于医学预后（medicalprognosis）。预后是医学的一个分支，专门预测病人未来的健康状况。例如，根据病人的实验室结果，你能估计出未来5年内心脏病发作的风险吗？或是未来10年内死亡的风... 查看详情

第一课第三周1-2节-了解医学图像分割以及探索mri数据格式以及作业解读(代码片段)

本周将学习图像分割，图像分割在许多医学影像应用中起着至关重要的作用，例如组织大小的量化、疾病的定位和治疗计划。我们将重温您在过去两周学到的一些相同的想法，看看它们是如何扩展到图像分割的。在本... 查看详情

第二课第一周2节-做医学预后，你需要掌握什么？

...设计重点在于为你提供概念和实用工具。你需要成功地为医学建立机器学习模型。对于这门课程，你不需要任何深入学习方法的背景知识，也不需要任何医学背景。不过，在你上这门课之前，我建议你先满足三个... 查看详情

正文

吴恩达-医学图像人工智能专项课程-第一课第一周13-15节-迁移学习+数据增强

三个挑战

1 预先训练网络 pretraining

2 数据增强 生成更多样本

总结

吴恩达-医学图像人工智能专项课程-第一课第一周11节总结(代码片段)

吴恩达-医学图像人工智能专项课程-第一课第一周12-13节多任挑战总结(代码片段)

吴恩达-医学图像人工智能专项课程-第一课第一周19-20节(代码片段)

吴恩达-医学图像人工智能专项课程-第一课第一周4-5节总结(代码片段)

吴恩达-医学图像人工智能专项课程-第一课第一周1-3节(代码片段)

吴恩达-医学图像人工智能专项课程-第一课第一周6-10节总结+作业解读(代码片段)

吴恩达-医学图像人工智能专项课程-第一课第一周16-18节-如何确保数据集病人不重叠+作业解说(代码片段)

吴恩达-第一课第二周1-7节总结-医学深度学习模型的评估汇总(代码片段)

第一课第三周大作业--mri脑肿瘤自动分割教程(代码片段)

吴恩达深度学习课程第一课—神经网络与深度学习—第一周练习

吴恩达-第一课第二周8-10节-什么是置信区间，有什么作用

第一课第一周大作业-胸部14种疾病分类-代码详解(代码片段)

吴恩达实验（神经网络和深度学习）第一课第三周，代码和数据集，亲测可运行

第二课第一周大作业--构建和评估一个线性风险模型(代码片段)

第二课第一周大作业--构建和评估一个线性风险模型(代码片段)

第二课第一周1节-ai用于医学预后简介

第一课第三周1-2节-了解医学图像分割以及探索mri数据格式以及作业解读(代码片段)

第二课第一周2节-做医学预后，你需要掌握什么？

2 数据增强生成更多样本