docker入门容器与镜像的理解

陈浩然MC 陈浩然MC     2022-09-21     708

关键词:

10张图带你深入理解Docker容器和镜像

申明:此篇文章是转载的(原文地址http://dockone.io/article/783),今天意外发现已经有人转载了(复制了),希望大家关注原创

原本打算将该文章修改为markdown格式,但图片问题有点困扰我,干脆先将文庄转载过来

【编者的话】本文用图文并茂的方式介绍了容器、镜像的区别和Docker每个命令后面的技术细节,能够很好的帮助读者深入理解Docker。

这篇文章希望能够帮助读者深入理解Docker的命令,还有容器(container)和镜像(image)之间的区别,并深入探讨容器和运行中的容器之间的区别。

技术分享


当我对Docker技术还是一知半解的时候,我发现理解Docker的命令非常困难。于是,我花了几周的时间来学习Docker的工作原理,更确切地说,是关于Docker统一文件系统(the union file system)的知识,然后回过头来再看Docker的命令,一切变得顺理成章,简单极了。

题外话:就我个人而言,掌握一门技术并合理使用它的最好办法就是深入理解这项技术背后的工作原理。通常情况下,一项新技术的诞生常常会伴随着媒体的大肆宣传和炒作,这使得用户很难看清技术的本质。更确切地说,新技术总是会发明一些新的术语或者隐喻词来帮助宣传,这在初期是非常有帮助的,但是这给技术的原理蒙上了一层砂纸,不利于用户在后期掌握技术的真谛。

Git就是一个很好的例子。我之前不能够很好的使用Git,于是我花了一段时间去学习Git的原理,直到这时,我才真正明白了Git的用法。我坚信只有真正理解Git内部原理的人才能够掌握这个工具。

Image Definition

镜像(Image)就是一堆只读层(read-only layer)的统一视角,也许这个定义有些难以理解,下面的这张图能够帮助读者理解镜像的定义。

技术分享


从左边我们看到了多个只读层,它们重叠在一起。除了最下面一层,其它层都会有一个指针指向下一层。这些层是Docker内部的实现细节,并且能够在主机(译者注:运行Docker的机器)的文件系统上访问到。统一文件系统(union file system)技术能够将不同的层整合成一个文件系统,为这些层提供了一个统一的视角,这样就隐藏了多层的存在,在用户的角度看来,只存在一个文件系统。我们可以在图片的右边看到这个视角的形式。

你可以在你的主机文件系统上找到有关这些层的文件。需要注意的是,在一个运行中的容器内部,这些层是不可见的。在我的主机上,我发现它们存在于/var/lib/docker/aufs目录下。

sudo tree -L 1 /var/lib/docker/

/var/lib/docker/
├── aufs
├── containers
├── graph
├── init
├── linkgraph.db
├── repositories-aufs
├── tmp
├── trust
└── volumes
7 directories, 2 files

Container Definition

容器(container)的定义和镜像(image)几乎一模一样,也是一堆层的统一视角,唯一区别在于容器的最上面那一层是可读可写的。

技术分享


细心的读者可能会发现,容器的定义并没有提及容器是否在运行,没错,这是故意的。正是这个发现帮助我理解了很多困惑。

要点:容器 = 镜像 + 读写层。并且容器的定义并没有提及是否要运行容器。

接下来,我们将会讨论运行态容器。

Running Container Definition

一个运行态容器(running container)被定义为一个可读写的统一文件系统加上隔离的进程空间和包含其中的进程。下面这张图片展示了一个运行中的容器。

技术分享


正是文件系统隔离技术使得Docker成为了一个前途无量的技术。一个容器中的进程可能会对文件进行修改、删除、创建,这些改变都将作用于可读写层(read-write layer)。下面这张图展示了这个行为。

技术分享


我们可以通过运行以下命令来验证我们上面所说的:
docker run ubuntu touch happiness.txt

即便是这个ubuntu容器不再运行,我们依旧能够在主机的文件系统上找到这个新文件。

find / -name happiness.txt

/var/lib/docker/aufs/diff/860a7b...889/happiness.txt

Image Layer Definition

为了将零星的数据整合起来,我们提出了镜像层(image layer)这个概念。下面的这张图描述了一个镜像层,通过图片我们能够发现一个层并不仅仅包含文件系统的改变,它还能包含了其他重要信息。

技术分享


元数据(metadata)就是关于这个层的额外信息,它不仅能够让Docker获取运行和构建时的信息,还包括父层的层次信息。需要注意,只读层和读写层都包含元数据。

技术分享


除此之外,每一层都包括了一个指向父层的指针。如果一个层没有这个指针,说明它处于最底层。

技术分享


Metadata Location:
我发现在我自己的主机上,镜像层(image layer)的元数据被保存在名为”json”的文件中,比如说:
/var/lib/docker/graph/e809f156dc985.../json

e809f156dc985...就是这层的id

一个容器的元数据好像是被分成了很多文件,但或多或少能够在/var/lib/docker/containers/<id>目录下找到,<id>就是一个可读层的id。这个目录下的文件大多是运行时的数据,比如说网络,日志等等。

全局理解(Tying It All Together)

现在,让我们结合上面提到的实现细节来理解Docker的命令。

docker create <image-id>

技术分享

docker create 命令为指定的镜像(image)添加了一个可读写层,构成了一个新的容器。注意,这个容器并没有运行。

技术分享


docker start <container-id>

技术分享

Docker start命令为容器文件系统创建了一个进程隔离空间。注意,每一个容器只能够有一个进程隔离空间。

docker run <image-id>

技术分享

看到这个命令,读者通常会有一个疑问:docker start 和 docker run命令有什么区别。

技术分享


从图片可以看出,docker run 命令先是利用镜像创建了一个容器,然后运行这个容器。这个命令非常的方便,并且隐藏了两个命令的细节,但从另一方面来看,这容易让用户产生误解。

题外话:继续我们之前有关于Git的话题,我认为docker run命令类似于git pull命令。git pull命令就是git fetch 和 git merge两个命令的组合,同样的,docker run就是docker create和docker start两个命令的组合。

docker ps

技术分享

docker ps 命令会列出所有运行中的容器。这隐藏了非运行态容器的存在,如果想要找出这些容器,我们需要使用下面这个命令。

docker ps –a

技术分享

docker ps –a命令会列出所有的容器,不管是运行的,还是停止的。

docker images

技术分享

docker images命令会列出了所有顶层(top-level)镜像。实际上,在这里我们没有办法区分一个镜像和一个只读层,所以我们提出了top-level镜像。只有创建容器时使用的镜像或者是直接pull下来的镜像能被称为顶层(top-level)镜像,并且每一个顶层镜像下面都隐藏了多个镜像层。

docker images –a

技术分享

docker images –a命令列出了所有的镜像,也可以说是列出了所有的可读层。如果你想要查看某一个image-id下的所有层,可以使用docker history来查看。

docker stop <container-id>

技术分享

docker stop命令会向运行中的容器发送一个SIGTERM的信号,然后停止所有的进程。

docker kill <container-id>

技术分享

docker kill 命令向所有运行在容器中的进程发送了一个不友好的SIGKILL信号。

docker pause <container-id>

技术分享

docker stop和docker kill命令会发送UNIX的信号给运行中的进程,docker pause命令则不一样,它利用了cgroups的特性将运行中的进程空间暂停。具体的内部原理你可以在这里找到:https://www.kernel.org/doc/Doc ... m.txt,但是这种方式的不足之处在于发送一个SIGTSTP信号对于进程来说不够简单易懂,以至于不能够让所有进程暂停。

docker rm <container-id>

技术分享

docker rm命令会移除构成容器的可读写层。注意,这个命令只能对非运行态容器执行。

docker rmi <image-id>

技术分享

docker rmi 命令会移除构成镜像的一个只读层。你只能够使用docker rmi来移除最顶层(top level layer)(也可以说是镜像),你也可以使用-f参数来强制删除中间的只读层。 

docker commit <container-id>

技术分享

docker commit命令将容器的可读写层转换为一个只读层,这样就把一个容器转换成了不可变的镜像。

技术分享


docker build

技术分享

docker build命令非常有趣,它会反复的执行多个命令。

技术分享


我们从上图可以看到,build命令根据Dockerfile文件中的FROM指令获取到镜像,然后重复地1)run(create和start)、2)修改、3)commit。在循环中的每一步都会生成一个新的层,因此许多新的层会被创建。

docker exec <running-container-id>

技术分享

docker exec 命令会在运行中的容器执行一个新进程。

docker inspect <container-id> or <image-id>

技术分享

docker inspect命令会提取出容器或者镜像最顶层的元数据。

docker save <image-id>

技术分享

docker save命令会创建一个镜像的压缩文件,这个文件能够在另外一个主机的Docker上使用。和export命令不同,这个命令为每一个层都保存了它们的元数据。这个命令只能对镜像生效。

docker export <container-id>

技术分享

docker export命令创建一个tar文件,并且移除了元数据和不必要的层,将多个层整合成了一个层,只保存了当前统一视角看到的内容(译者注:expoxt后的容器再import到Docker中,通过docker images –tree命令只能看到一个镜像;而save后的镜像则不同,它能够看到这个镜像的历史镜像)。

docker history <image-id>

技术分享

docker history命令递归地输出指定镜像的历史镜像。

结论

我希望你们能喜欢这篇文章。还有其他许多的命令(pull,search,restart,attach等)我没有提及,但是我相信通过阅读这篇文章,大部分的Docker命令都能够被很好理解。我仅仅学习了Docker两个星期,因此,如果我有什么地方说的不好,欢迎大家指出。

原文链接:Visualizing Docker Containers and Images(翻译:杨润青)

===========================

译者介绍
杨润青,90后博士僧,研究方向是网络和信息安全。










































































































































docker基础知识和命令使用入门(代码片段)

本文介绍了Docker相关的基础知识和命令的简单使用。基础知识部分包括Docker的用途和意义,Docker的镜像、容器、仓库、Dockerfile和DockerCompose的理解,以及Docker图形管理工具Portainer的基础功能。Docker命令的使用包括镜像使用、容器... 查看详情

docker容器和镜像理解

1、镜像是Docker容器的基石,容器是镜像的运行实例,有了镜像才能启动容器。容器和镜像是一对一的,一个容器里就运行一个镜像。 1、base镜像----提供了一个基本的操作系统环境,用户可以根据需要安装和配置软件。2、base... 查看详情

第一天docker入门

【01入门】  docker最核心为三部分组成镜像,仓库和容器  镜像:一个只读的模板  仓库:代码仓库,镜像的集合  容器:镜像的实例化进程我们可以这样理解容器就是一个沙箱,docker利用容器运行和隔离应用,每个容... 查看详情

docker:理解docker镜像与容器

...在另一个磁盘上存在完全相同的副本即为镜像。  2、Docker镜像概念:    在Docker中镜像同样是一种完全相同的副本,以广泛的镜像来理解就很简单了,Docker虽然在Linux系统中,但是内部又完全和Linux系统隔开。所以我们可... 查看详情

docker技术入门与实战-镜像容器仓库

1.如果出现CannotconnecttotheDockerdaemon.Isthedockerdaemonrunningonthishost?解决办法在控制台输入:>$servicedockerstart即可2.hub.docker.com创建了自己的账号,如何push和pullstep1——找到本地镜像的ID:dockerimagesstep2— 查看详情

docker学习入门(代码片段)

Docker简介:Docker包括三个基本概念镜像(Image)容器(Container)仓库(Repository)理解了这三个概念,就理解了Docker的整个生命周期。Docker镜像Docker镜像是一个特殊的文件系统,除了提供容器运行时所需的程序、库、资源、配置等... 查看详情

docker入门:容器与镜像常用指令(代码片段)

零.docker常用命令#镜像名版本标签镜像id创建时间镜像大小REPOSITORYTAGIMAGEIDCREATEDSIZEhello-worldlatestfce289e99eb96monthsago1.84kBdockerversion/info#查看版本/信息docker--help#查看说明文档dockerlogs-f-t--tail日志条数容器ID#查看容器日志dockerinspect#获取... 查看详情

docker入门笔记

Docker可以理解为一个轻量化的虚拟机, 启动速度快,本身占的资源小 [重要],容器里是不能保存数据的,容器只要一停止,所有的数据都会丢失,所以如果重要的数据,都需要通过配制,把数据保存在host机器上。根据Doc... 查看详情

docker入门与应用系列镜像管理

1.1什么是镜像  简单说,Docker镜像是一个不包含Linux内核而又精简的Linux操作系统。1.2镜像从哪里来  DockerHub是由Docker公司负责维护的公共注册中心,包含大量的容器镜像,Docker工具默认从这个公共镜像库下载镜像。https://hub... 查看详情

docker架构与原理(代码片段)

注个人理解:docker的镜像是位于最底层,但使用宿主主机的操作系统内核,我们可以看到docker的镜像十分的小,原因是docker镜像只是一些环境的配置,所以十分的小,他是只能读不能写的。docker的容器是依赖与... 查看详情

3.docker技术入门与实战---使用docker镜像(代码片段)

第3章 使用Docker镜像 镜像是docker三大核心概念中最重要的,docker运行容器前需要本地存在对应的镜像,如果镜像不存在,docker会尝试先从默认镜像仓库下载(默认使用DockerHub公共注册服务器中的仓库),用户也可以通过配置,使... 查看详情

docker入门-对镜像的操作

Docker系列参考自书籍<Docker技术入门与实战>,本博客以笔记为主.如果转载请注明出处.-博客园:玲珑骰子安红豆 本章目录: 1.获取镜像 2.查看镜像信息 3.搜寻镜像 4.删除镜像 5.创建镜像 6.导出和载入镜像 ... 查看详情

docker入门学习

初识dockerdocker在开发和运维中的优势:1)更快速的交付和部署2)更高效的资源利用3)更轻松的迁移和扩展4)更简单的更新管理 docker与虚拟机的比较 docker的核心概念和安装docker镜像:镜像(image)是创建docker容器的基础... 查看详情

10张图带你深入理解docker容器和镜像

图解Docker容器和镜像 这篇文章希望能够帮助读者深入理解Docker的命令,还有容器(container)和镜像(image)之间的区别,并深入探讨容器和运行中的容器之间的区别。当我对Docker技术还是一知半解的时候,我发现理解Docker的... 查看详情

docker入门

1Docker技术介绍DOCKER是一个基于LXC技术之上构建的container容器引擎,通过内核虚拟化技术(namespace及cgroups)来提供容器的资源隔离与安全保障,KVM是通过硬件实现的虚拟化技术,它是通过系统来实现资源隔离与安全保障,占用系... 查看详情

docker容器-入门级(代码片段)

1.1 容器简介1.1.1 什么是 Linux 容器Linux容器是与系统其他部分隔离开的一系列进程,从另一个镜像运行,并由该镜像提供支持进程所需的全部文件。容器提供的镜像包含了应用的所有依赖项,因而在从开发到测试再... 查看详情

docker快速入门(代码片段)

Docker是一个开源的容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的镜像中,然后发布到任何流行的Linux或Windows机器上,也可以实现虚拟化。简单来说,Docker是一种近来很流行的虚拟化技术。DockerVS传统虚拟化... 查看详情

docker新手入门(代码片段)

1、简介Docker是一个开源的应用容器引擎;是一个轻量级容器技术;Docker支持将软件编译成一个镜像;然后在镜像中各种软件做好配置,将镜像发布出去,其他使用者可以直接使用这个镜像;运行中的这个镜像称为容器,容器启... 查看详情