正文

万字详解linux系列进程控制(代码片段)

山舟  山舟  2022-12-01  558

关键词：

文章目录

一、环境变量
二、进程地址空间
三、进程创建
四、进程终止
五、进程等待
感谢阅读，如有错误请批评指正

一、环境变量

Windows下的环境变量

Linux下的环境变量（用env命令查看）

1.基本概念

环境变量(environment variables)一般是指在操作系统中用来指定操作系统运行环境的一些参数。

例如：我们在编写C/C++代码的时候，在链接的时候，从来不知道我们的所链接的动态静态库在哪里，但是仍然可以链接成功，生成可执行程序，这就是因为有相关环境变量帮助编译器进行查找。

环境变量通常具有特殊用途，在系统当中通常具有全局特性。

2.常见的环境变量

（1）PATH

查看环境变量只需要在命令行中echo $环境变量名即可（如果不带 $ 会被当做字符串打印）。

可以看到出现的是一组组用冒号分割的路径，Linux下执行命令时默认从左向右在各个PATH路径下查找要执行的命令并执行。

下图从左向右找到第二条路径时发现路径下有ls，然后执行之。

而为什么执行ls、pwd等等命令时前面不用带路径呢？因为直接执行命令时默认先到PATH下的路径找是否存在该命令，找到之后就执行，而PATH的路径是启动操作系统时默认生成的。

下面看一个例子：
【Linux小练习】进度条程序中的可执行程序需要加./才能运行，因为它不在PATH路径中，而在当前目录。

但通过将该可执行程序拷贝（需要sudo权限）到任意一条PATH下的路径后即可直接执行，而不需要./（./本质其实是告诉操作系统要执行的命令在当前目录下）。

这样myproc也可以像ls、pwd等命令一样直接执行，这波操作以后相当于我自己写了一款应用，功能是一个进度条。

但是，上面是十分不推荐的做法，因为这样大概率会污染命令池（自己写的命令很强除外）。

（2）HOME

指定用户的主工作目录(即用户登陆到Linux系统中时,默认的目录)。

（3）SHELL

显示当前Shell,它的值通常是/bin/bash。

shell跑起来之后就可以对命令行进行解释（执行命令行输入的指令）。

（4）HISTSIZE

用history可以查看之前在命令行输入的内容。

HISTSIZE就是保存历史命令数量的最大值。例如我的系统最多可以保存1000条历史命令。

（5）SSH_TTY

表示终端号。

3.与环境变量相关的指令

echo: 显示某个环境变量值（注意一定要加$）
export: 设置一个新的环境变量
env: 显示所有环境变量
unset: 清除环境变量
set: 显示本地定义的shell变量和环境变量

下面以先设置然后取消一个环境变量为例进行说明。

4.在代码中获取环境变量

首先要声明一点，main函数是可以带参数的。

C语言中main函数有三个参数，argc、argv和envp，envp环境变量，这里顺带提一下前两个参数，它们对理解Linux的命令行参数很有帮助（其实Linux的命令行参数就是通过它们实现的）。

（1）argc和argv

#include <stdio.h>
#include <unistd.h>

int main(int argc, char *argv[], char *envp[])

  int i = 0;
  for(; i < argc; i++)                                                                                                                                                 
  
    printf("argv[%d] : %s\\n", i, argv[i]);
  
  return 0;

下面是直接执行可执行程序、带命令行参数执行可执行程序、执行Linux的指令。应该可以看出一些相似之处。

下图是对上面代码和命令行指令的部分解释。

下面再通过实现命令行参数的功能来进一步解释main函数的三个参数。

#include <stdio.h>
#include <unistd.h>
#include <string.h>
 
int main(int argc, char *argv[], char *envp[])

  if(argc == 2)//有一个以上命令行参数
  
	  if(strcmp(argv[1], "-a") == 0)
	  
	    printf("a : hello world!\\n");
	  
	  else if(strcmp(argv[1], "-b") == 0)
	  
	    printf("b : hello Linux!\\n");
	  
	  else if(strcmp(argv[1], "-c") == 0)
	  
	    printf("c : I love BUAA!\\n");
	  
	  else                                                                                                                                                                 
	  
	    printf("d : hello default!\\n");
	  
  
  return 0;

然后就可以像执行ls等命令一样实现各命令行参数的功能（这份代码只允许带一个参数，因为代码中设置argc==2）。

有了这个例子，读者应该对上面的内容理解的差不多了。

注意：上面的内容是C语言规定的，与系统无关，所以在Windows下也可同样实现。

（2）envp

envp的存储结构与argv差不多，但是没有参数说明envp的数量，所以可以以末尾的NULL来判断结束。

通过下面一段代码来使用envp：

#include <stdio.h>
#include <string.h>
 
int main(int argc, char *argv[], char *envp[])

  int i = 0;
  while(envp[i] != NULL)
  
    printf("envp[%d] : %s\\n", i, envp[i]);
    i++;

运行可发现打印出来的就是所有的环境变量，与env执行的结果相同。

环境变量是一个系统级别的全局变量，bash之下的所有进程都可以获取。

通过envp可以获取到环境变量，下面再介绍一种获取环境变量的方式。

可以通过libc库中定义的全局变量environ来了获取环境变量，environ指向环境变量表，它不包含在任何头文件中，所以在使用时要用extern声明。

#include <stdio.h> 
#include <string.h>

int main()

    int i = 0;
    extern char** environ;
    for (i = 0; environ[i] != NULL; i++)
    
        printf("%s\\n", environ[i]);
    
	return 0;

同样获取到了环境变量：

如果要在代码中获取单个环境变量，可以使用getenv函数。

以获取PATH的路径为例：

#include <stdio.h> 
#include <stdlib.h>

int main()

    printf("%s\\n", getenv("PATH"));
	return 0;

可以看到，路径完全相同。

二、进程地址空间

1.不同数据的分布

下面自底向上打印个数据段变量的地址来验证：

#include <stdio.h>
#include <stdlib.h>
#include <string.h>

int g_val;
int g_init_val = 100;

int main(int argc, char *argv[], char *envp[])

    printf("code addr:%p\\n", main);//代码地址

    const char* str = "hello world";
    printf("read only:%p\\n", str);//只读常量地址

    printf("init addr:%p\\n", &g_init_val);//初始化全局变量地址
    printf("uninit addr:%p\\n", &g_val);//未初始化全局变量地址

    int* p = (int*)malloc(10);
    printf("heap addr:%p\\n", p);//堆的地址
    printf("stack addr:%p\\n", &p);//栈的地址

    int i = 0;
    for (i = 0; i < argc; i++)
    
        printf("args addr:%p\\n", argv[i]);//命令行参数的地址
    

    while (envp[i])
    
        printf("env addr:%p\\n", envp[i++]);//环境变量的地址
    
    return 0;

运行结果如下：

2.虚拟地址和物理地址

先看一段代码：

#include <stdio.h>
#include <unistd.h>
#include <sys/types.h>

int g_val = 100;

int main()

    pid_t id = fork();
    if (id == 0)
    
        //child
        g_val = 200;
        printf("child---pid:%d ppid:%d g_val:%d &g_val:%p\\n", getpid(), getppid(), g_val, &g_val);
    
    else if (id > 0)
    
        //parent
        //由于不确定是id==0先执行还是id>0先执行，在这里sleep 2秒保证id==0先执行
        sleep(2);
        printf("parent---pid:%d ppid:%d g_val:%d &g_val:%p\\n", getpid(), getppid(), g_val, &g_val);
    
    else
    
        ;
    

	sleep(1);

    return 0;

结果如下：

按理说id==0先执行，g_ val被改为200而且两个判断条件内显然g_ val地址相同，所以打印出来的值应该都是200，但parent里的g_ val是100，为什么呢?

通过页表可以更详细地解释上面的现象。请往下看。

3.页表

页表本质上就是将虚拟地址映射到物理内存中，通过页表可以更详细地解释上面的现象。

因为上面g_ val的地址0x60104c 不是物理地址，而是虚拟地址。 实际上，在语言层面上见到的地址都是虚拟地址，物理地址一概看不到，由操作系统统一管理。上面g_ val的两个虚拟地址虽然相同，但经过页表转化后的物理地址是不一样的，所以它们的值不一样也就很正常了。

上面进程地址的分布图其实都对应的是虚拟地址。

详见下图。

4.为什么需要进程地址空间

由于页表是将进程地址空间的地址映射到物理内存，所以它们是一起使用的。

有了进程地址空间，就不会再有任何系统级别的越界问题存在。

如果现在非法访问某地址，访问到页表时，由于从前没有这样的访问，也就不存在这样的映射，所以首先页表不会允许继续访问；其次，访问时能看到的只有该进程的页表映射到的物理内存，其他的物理内存对该进程是不可见的，也就没有机会再访问到。

三、进程创建

1.再识fork

在进程概念中初步介绍了fork的使用，这里再进一步介绍fork。

（1）返回值

为何要给子进程返回0，而给父进程返回子进程的pid？

因为一个父进程可能有多个子进程，为了找到各个子进程，就需要知道各个子进程的pid，所以给父进程返回子进程的pid；
而一个子进程永远只有一个父进程，所以子进程不需要返回pid。

进程调用fork，当控制转移到内核中的fork代码后，内核做的事情有：分配新的内存块和内核数据结构给子进程、将父进程部分数据结构内容拷贝至子进程、添加子进程到系统进程列表当中、fork返回并开始调度器调度。

（2）fork失败

在系统层面，当系统中有太多进程时，内存资源可能会不够用，这时就可能会fork失败。

2.写时拷贝

通常情况下父子进程的代码是共享的，父子进程在不写入时，数据也是共享的，当任意一方试图写入，便以写时拷贝的方式各自拷贝一份副本。

（下图中以子进程写入为例）

那么父子进程的数据为什么不在创建子进程时就全部分开呢？因为子进程不一定会修改父进程的所有数据，写时拷贝只在修改数据时发生，不会浪费任何内存。

之前谈论的都是数据，那么代码有没有写时拷贝呢？事实上是有的，但这里先不深入讨论。

四、进程终止

进程终止后，操作系统会释放曾经申请的数据结构（mm_struct、task_struct等等）、释放申请的内存、从各种数据结构中移除与子进程相关的内容。

1.进程退出码

只有main函数的返回值才是进程退出码，其它函数的返回值不是进程退出码。

在C/C++里，main函数最后总会return 0，为什么要有这个语句呢？
从语言角度来看，因为main函数的返回值要求是int类型，从操作系统角度来看，可以从进程退出码得到一定的信息。

那么return 1、2、3、-1、-2、100……可以吗？答案是可以。

这两个问题只是个引子，具体答案请往下看。

2.进程退出

（1）进程退出有三种情况

代码跑完且结果对、代码跑完但结果不对、代码没跑完时程序退出（进程崩溃后错误）。

（2）查看进程退出码

可以用echo $?来查看最近一次的进程退出码。

随便运行一个正常的代码，结束后查看到进程退出码为0。

#include <stdio.h>

int main()

	int a = 0;
	int b = 0;
	int c = a + b;
	return 0;

如果将main函数的返回值修改为10，则查看到的进程退出码也就变为10。

#include <stdio.h>

int main()

	int a = 0;
	int b = 0;
	int c = a + b;
	return 10;

再查看一次进程退出码，发现结果是0，因为对第二次echo $?来说，最近一次运行的进程是第一次echo $?，这显然是正常运行的，所以返回0.

下面是以系统的指令ls为例测试进程退出码。

（3）退出码描述

退出码的含义是人为定义的，但0一般都表示成功，非0表示失败，每种退出码都有对应的字符串含义，帮助用户确认任务成功或确认任务失败的原因。

下面以strerror（还有perror等等）为例查看（部分）退出码描述。

#include <stdio.h>
#include <string.h>

int main()

	int i = 0;
	for (i = 0; i <= 100; i++)//这里只是部分退出码描述，不是全部
	
		printf("%d : %s\\n", i, strerror(i));
	
	return 0;

可以看到退出码描述非常多。

（4）进程常见退出情况

①从main退出

从main函数退出是最常见的了，上面也举了许多例子，不再赘述。

②调用exit

void exit(int status);中status就是进程退出码，等价于main函数的返回值。

#include <stdio.h>  
#include <string.h>  
#include <stdlib.h>  
                                                                                                                                                                      
int main()                              
                                       
  printf("exit\\n");                     
  exit(12);

可以看到查看进程退出码时是12，也即调用exit时传入的值。

exit函数和main函数的返回值在进程退出码上没有区别，但是exit在任何位置调用都可以结束进程。

#include <stdio.h>
#include <string.h>
#include <stdlib.h>

int test()

	printf("test!\\n");
	exit(12);

	return 1;


int main()

	test();
	printf("process is not done!\\n");
	return 0;

运行结果如下。可以看到首先没有打印process is not done!，说明在程序运行到test就结束了，实际上连test内的return 1都没有执行，只要遇到exit立即退出，而进程退出码也是exit传入的12，而不是main函数的return 0。

③_exit

_exit与exit相似但也有些不同。

只把上面代码中的exit改为_exit。

#include <stdio.h>
#include <string.h>
#include <stdlib.h>
#include <unistd.h>

int test()

	printf("test!\\n");
	_exit(12);//修改

	return 1;


int main()

	test();
	printf("process is not done!\\n");
	return 0;

结果与上面exit相同。

exit与_exit区别在于exit在进程退出时会释放进程曾经占用的资源（比如缓冲区），而_exit直接终止进程，不会做任何首尾。

#include <stdio.h>
#include <string.h>
#include <stdlib.h>
#include <unistd.h>

int main()

	printf("hello world");
	sleep(3);
	exit(10);
	return 0;

结果如下，hello world被打印出来。

下面使用_exit。

#include <stdio.h>
#include <string.h>
#include <stdlib.h>
#include <unistd.h>

int main()

	printf("hello world");
	sleep(3);
	_exit(10);//修改
	return 0;

可以看到hello world没有打印出来。

（5）进程异常退出

比如一个死循环的进程，如果不手动退出它永远不会停下来，这时通过Ctrl+C使它停下来对进程来说就是异常退出。

问题是进程异常退出后得到的“进程退出码“”还有意义吗？

答案是没有意义，因为既然进程异常退出，它一定没有走到main函数的return值或是exit的位置，那么它返回的值就不是进程退出码，所以是没有意义的。

五、进程等待

1.进程等待的必要性

之前讲过，子进程退出，父进程如果不管不顾，就可能产生“僵尸进程”（进程变成Z状态），而这种进程又会造成内存泄漏。

另外，进程一旦变成僵尸状态，那就不会被杀死（即使是kill -9也无能为力，因为没有办法杀死一个已经死去的进程）。

这时就需要由父进程回收子进程的资源并获取子进程的退出信息。

2.代码实现进程等待

用到的是wait和waitpid函数，下面依次来说明。

（1）wait

wait成功则返回被等待进程的pid，失败则返回-1。传入的参数属于输出型参数，可以获取子进程退出的状态，不需要时可设为NULL，这个参数在waitpid那里说明。

一般需要保证子进程先于父进程结束，因为父进程需要处理子进程结束后的信息。

#include <stdio.h>
#include <sys/wait.h>
#include <sys/types.h>
#include <unistd.h>

int main()

    pid_t id = fork();
    if (id == 查看详情  
                
linux从青铜到王者第十三篇:linux多线程四万字详解(代码片段)
系列文章目录文章目录系列文章目录前言一、Linux线程概念1.什么是线程2.线程的优点3.线程的缺点4.线程的异常5.线程的用途二、进程和线程的对比1.进程和线程2.多进程的应用场景有哪些？三、线程控制1.POSIX线程库2.创建线程...  查看详情  
                
万字详解linux系列多线程（上）(代码片段)
...容过多，所以分为两篇来写，下篇传送门：【万字详解Linux系列】多线程（下）。一、线程1.概念在一个程序里的一个执行路线就叫做线程（thread）。更  查看详情  
                
linux进程详解——万字总结，复习利器(代码片段)
这里写目录标题一、图解计算机体系结构（1）底层硬件（2）驱动程序（3）操作系统（4）SystemCall（系统调用）（5）用户操作接口（6）用户层二、进程1、什么是进程2、创建...  查看详情  
                
万字详解linux系列基础io(代码片段)
文章目录前言（1）当前目录（2）stdin、stdout、stderr一、open（1）标志位（2）O_WRONLY（3）O_CREAT二、close，read，write三、文件描述符1.概念2.原理3.分配规则四、重定向1.输出  查看详情  
                
万字详解linux系列基础io(代码片段)
文章目录前言（1）当前目录（2）stdin、stdout、stderr一、open（1）标志位（2）O_WRONLY（3）O_CREAT二、close，read，write三、文件描述符1.概念2.原理3.分配规则四、重定向1.输出  查看详情  
                
万字详解linux系列文件系统动静态库(代码片段)
文章目录一、文件系统1.inode2.磁盘3.目录4.软硬链接（1）软链接（2）硬链接5.文件的三个时间信息二、动静态库1.基本原理2.认识库3.动静态加载的优缺点静态加载动态加载感谢阅读，如有错误请批评指正一、文...  查看详情  
                
万字详解linux系列多线程（下）(代码片段)
...指正前言由于多线程部分内容过多，所以本文接着【万字详解Linux系列】多线程（上）向后介绍多线程相关的内容。一、线程同步1.概念在保证数据安全的前提下，让线程按照某种特定的顺序访问临界资源，从...  查看详情  
                
linux进程信号万字详解（上）(代码片段)
🎇Linux：博客主页：一起去看日落吗分享博主的在Linux中学习到的知识和遇到的问题博主的能力有限，出现错误希望大家不吝赐教分享给大家一句我很喜欢的话：看似不起波澜的日复一日，一定会在某一天...  查看详情  
                
linux进程控制(万字）(代码片段)
🎇Linux：进程控制博客主页：一起去看日落吗分享博主的在Linux中学习到的知识和遇到的问题博主的能力有限，出现错误希望大家不吝赐教分享给大家一句我很喜欢的话：看似不起波澜的日复一日，一定会...  查看详情  
                
linux进程详解二：进程控制(代码片段)
【Linux】进程详解二：进程控制文章目录【Linux】进程详解二：进程控制前言一、进程创建1.fork()函数的认识1.1.利用系统调用fork()创建进程1.2.fork()在内核中都干了什么？1.3.父子进程的关系2.fork()函数的返回值1.`fork()...  查看详情  
                
linux之进程控制详解(代码片段)
进程控制文章目录进程控制进程创建fork函数初识fork函数返回值写时拷贝fork常规用法fork调用失败的原因进程终止进程退出场景进程常见退出方法main函数返回exit_exit进程等待进程等待的方法wait方法waitpid方法进程程序替换替换原...  查看详情  
                
ps详解(每周一个linux命令系列)(代码片段)
(5)ps详解(每周一个linux命令系列)linux命令ps详解引言：今天的命令是用来看进程状态的ps命令ps我们先看manpsps-reportasnapshotofthecurrentprocesses.翻译：显示当前进程的快照。ps是ProcessStatus的缩写具体的描述如下：DESCRIPTIONpsdisplaysinformatio...  查看详情  
                
linux进阶|万字详解docker镜像的制作，手把手学会！(代码片段)
  创作不易，来了的客官点点关注，收藏，订阅一键三连❤😜  前言运维之基础——Linux。我是一个即将毕业的大学生，超超。如果你也在学习Linux，不妨跟着萌新超超一起学习Linux，拿下Linux，一...  查看详情  
                
万字长文详解yolov1-v5系列模型(代码片段)
一，YOLOv1Abstract1.Introduction2.UnifiedDetectron2.1.NetworkDesign2.2Training2.4.Inferences4.1ComparisontoOtherReal-TimeSystems5，代码实现思考二，YOLOv2摘要YOLOv2的改进1，中心坐标位置预测的改进2，1个gird只能对应一个目标的改进3，backbone的改进4，  查看详情  
                
[os-linux]详解linux进程控制(代码片段)
本文基于CentOS，深入解释进程的创建，进程等待，进程程序替换，进程终止，shell运行原理，做简单的shell。目录一、进程创建1.fork函数2.fork函数返回值3.写时拷贝4.fork用法5.fork调用失败的原因二、进程终止...  查看详情  
                
linux操作命令分类详解-进程查找其他(代码片段)
...量目录里查找文件5、其他命令系列文章Linux操作命令分类详解-命令速查（一ÿ  查看详情  
                
linux进程控制(代码片段)
...it与exit进程等待进程等待的方法waitwaitpid进程程序替换exec系列函数命名理解exec系列函数使用execlexeclpexecleexecvexecvp进程创建我们在上一篇进程概念中已经讲过一些进程的创建  查看详情