bug诞生记——临时变量栈变量导致的双杀(代码片段)

breaksoftware breaksoftware     2022-10-21     614

关键词:

        这是《bug诞生记》的第一篇文章。本来想起个文艺点的名字,比如《Satan(撒旦)来了》,但是最后还是想让这系列的重心放在“bug的产生过程”和“缺失的知识点”上,于是就有了本系列这个稍微中性的名称。(转载请指明出于breaksoftware的csdn博客)

        本系列博文的案例将都秉承一个原则——“因知识缺失,而非粗心大意导致”。在实际工作中,粗心大意产生的bug太多了。但这是工作态度或者工作状态导致的,要去解决这个问题,可能会从机制、管理等角度来讲述。但是这不是本系列想讨论的。本系列更想讲述的是一种“无心之过”,即因为相应知识点的缺乏,程序员想当然的做法导致的bug。

        这篇我将讲述一个真实发生在工作中的例子。当然实际的代码和逻辑远比下文例子要复杂很多,我只是抽出比较核心的点来分析。至于为什么要这么做?为什么要这么设计?为什么要这种风格?为什么代码不严谨?……等与问题核心无关的疑问,我都将不做辩论。这个“免责声明”也将贯穿本系列所有例子。

       下面这段代码用于拼装出一个绝对路径

std::string get_name(const std::string& index) 
	char name[16] = "Movie";
	std::string full_name = std::string(name) + index;
	return full_name;


int main() 
	char full_path[32] = "/home/work/";
	std::string name = get_name("1");
	const char* ptr_name = name.c_str();
	strcat(full_path + strlen(full_path), ptr_name);
	printf(full_path);
	return 0;

        它将输出/home/work/Movie1。

        目前它还没什么问题,后来发生的逻辑变更:只要返回固定的/home/work/Movie路径就行了。于是程序员的改法是

std::string get_name(/*const std::string& index*/) 
	char name[16] = "Movie";
	std::string full_name = std::string(name);// + index;
	return full_name;


int main() 
	char full_path[32] = "/home/work/";
	std::string name = get_name(/*"1"*/);
	const char* ptr_name = name.c_str();
	strcat(full_path + strlen(full_path), ptr_name);
	printf(full_path);
	return 0;

        程序员将之前的代码注释掉了,当然这个行为是非常不好的。

        此时一个具有“良知”但是“缺乏知识点”的同事将走上“犯罪”的道路,因为他将抱着“优化代码”的目的去产生了第一个bug。他是这么改的

std::string get_name() 
	char name[16] = "Movie";
	return std::string(name);


int main() 
	char full_path[32] = "/home/work/";
	const char* ptr_name = get_name().c_str();
	strcat(full_path + strlen(full_path), ptr_name);
	printf(full_path);
	return 0;
  1. 把注释掉的废弃代码给删掉了。这是值得肯定的。
  2. 精简了get_name函数,不再以full_name作为返回值,减少了一次std::string类型的构造和释放。这个也是值得肯定的。
  3. 精简了main函数,删除了std::string name局部变量,试图直接从get_name()获取const char*指针。他的想法是好的,但是这步将导致bug。

        这段代码没有经过测试就上线了。因为他和QA都觉得这点小的改动不需要测试。很可惜,自以为是往往要付出代价。因为这段代码的最终执行结果是/home/work,而不是约定的/home/work/Movie。那Movie去哪里了?

        问题就出在第8行代码。一般情况下我们认为它可以翻译为下面两行

std::string temp = get_name();
const char* ptr_name = temp.c_str();

        如果的确是上面这么翻译的,那也没问题。但是实际上,temp是个行内的临时变量,它脱离了该行就被释放了。我们看下反汇编

	const char* ptr_name = get_name().c_str();
 lea         eax,[ebp-148h]  
 push        eax  
 call        get_name (0851672h)  
 add         esp,4  
 mov         dword ptr [ebp-15Ch],eax  
 mov         ecx,dword ptr [ebp-15Ch]  
 call        std::basic_string<char,std::char_traits<char>,std::allocator<char> >::c_str (085166Dh)  
 mov         dword ptr [ptr_name],eax  
 lea         ecx,[ebp-148h]  
 call        std::basic_string<char,std::char_traits<char>,std::allocator<char> >::~basic_string<char,std::char_traits<char>,std::allocator<char> > (08513D9h)  

        第4行调用了get_name方法,返回的std::string对象指针放在eax中。

        第6行将该对象指针放到当前函数栈帧内——即一个临时对象。

        第7行又将临时对象地址放到ecx中。ecx在C++编译中,一般用于传递this指针。

        第8行对ecx中保存的std::string临时对象的this指针调用了c_str成员方法,得到的const char*地址保存在eax中。

        第9行将上一指令返回的const char*地址保存到ptr_name局部变量中,此时ptr_name指向的是std::string临时对象的字符空间地址。它也就在这一刻是该程序员所期望的样子。

        第10行和第11行,又通过ecx调用std::string的析构函数。这样保存在[ebp-148h]中的std::string对象指针指向的临时对象被析构,也就意味着第9步得到的指针数据被删除了。

        所以const char* ptr_name = get_name().c_str();正确的翻译是

const char* ptr_name = NULL;

	std::string temp = get_name();
	ptr_name = temp.c_str();

        最终这个程序员老老实实的把main中那行“精简代码”变成了两行

std::string get_name() 
	char name[16] = "Movie";
	return std::string(name);


int main() 
	char full_path[32] = "/home/work/";	
	std::string name = get_name();
	const char* ptr_name = name.c_str();
	strcat(full_path + strlen(full_path), ptr_name);
	printf(full_path);
	return 0;

        我想经过这次惊魂实践,这个程序员应该再也不想碰这块代码了。

        但是肯定还有其他“有良知”的程序员,他会觉得这代码很不爽——搞什么std::string?转来转去,最终还是用了const char*。

        于是他修改如下

const char* get_name() 
	char name[16] = "Movie";
	return name;


int main() 
	char full_path[32] = "/home/work/";	
	const char* ptr_name = get_name();
	strcat(full_path + strlen(full_path), ptr_name);
	printf(full_path);
	return 0;
  1. 将get_name方法的返回类型改成了const char*,省去了中间std::string的转换。
  2. 将main中的std::string全干掉了。

        这段代码修改的足够简单了。有人可能会觉得get_name可能可以干掉,直接在main函数中写死路径就行了。我想当时这个程序员保留get_name的原因可能是他预测该函数可能还是存在被定制的可能性。

        抛开其他问题,这段程序的执行结果是正确的。相信这个版本的修改者此时内心是澎湃的,因为他觉得他不费吹灰之力,就干了一件好事。可是实际他却挖了一个坑。

        这段代码在线上稳定运行了很久,后来随着业务逻辑的增长。一个同学不小心在第8和第9行代码之间插入了一个函数调用,然后这个程序就崩掉了。相信这个同学一定很郁闷,因为他可能仅仅修改了一下函数调用顺序,或者写了一个足够简单到不太可能出错的代码。结果进程崩溃,他要背锅!

        为了把问题简单化,我让新插入的代码只干一件事——初始化一个栈上空间。

const char* get_name() 
	char name[16] = "Movie";
	return name;


void satan() 
	char name[16] = "I am Satan";


int main() 
	char full_path[32] = "/home/work/";	
	const char* ptr_name = get_name();
	satan();
	strcat(full_path + strlen(full_path), ptr_name);
	printf(full_path);
	return 0;

        这个程序的输出是/home/work/I am Satan。仅仅加了一个satan函数,就改变了结果?是的。这是由于之前那个做代码修改的同学对栈变量和栈帧不熟悉导致的。

        如果要介绍栈变量和栈帧,这个就需要从计算机基础知识讲起。本文当然不会讲的很细,大家可以通过其他渠道获取这些知识。

        下面的图只是表意,不是准确表达栈空间清空。但是核心的意思是一致的。

        进入main函数时,栈结构如下

        红色表示当前活动的栈空间;绿色表示“未知区域”,该区域的数据我们可以认为是“野”的,不可保障的。

        进入get_name函数后,栈结构变化如下

        get_name的name数组将保存“Movie”。

        get_name调用结束,发生退栈行为。于是程序又回到main函数中,其栈结构如下

        注意一下,第12行代码已经让ptr_name指向了“野”空间。此时“野”空间数据还没被污染,所以执行结果还是正确的。

        然后我们调用了satan函数。进入satan函数后栈结构如下

        注意一下,之前get_name的name空间已经被satan的name空间覆盖了。此时它的数据是“I am Satan”。

        satan函数结束后,又回到main函数空间,其栈结构如下

        我们看到,此时ptr_name还是指向“野”空间。只是此时空间不再是调用get_name时的情况,栈上数据已经被satan函数“污染”了。

        所以出现错误的结果是必然的。

        这段不到15行的代码经过多个程序员的修改后,仿佛成了一个江湖。其中发生了各种因为“知识点缺乏”而导致的bug。所以如果我们不知道代码最终精确的表达,可能就会写出各种“不经意”的问题。

bug诞生记——信号(signal)处理导致死锁(代码片段)

    这个bug源于项目中一个诡异的现象:代码层面没有明显的锁的问题,但是执行时发生了死锁一样的表现。我把业务逻辑简化为:父进程一直维持一个子进程。(转载请指明出于breaksoftware的csdn博客)   ... 查看详情

bug诞生记——隐蔽的指针偏移计算导致的数据错乱(代码片段)

    C++语言为了兼容C语言,做了很多设计方面的考量。但是有些兼容设计产生了不清晰的认识。本文就将讨论一个因为认知不清晰而导致的bug。(转载请指明出于breaksoftware的csdn博客)classBasepublic:Base()=defau... 查看详情

bug诞生记——不定长参数隐藏的类型问题(代码片段)

    这个bug的诞生源于项目中使用了一个开源C库。由于对该C库API不熟悉,一个不起眼的错误调用,导致一系列诡异的问题。最终经过调试,我们发现发生了内存覆盖问题。为了直达问题根节,我将问题代码简化... 查看详情

bug诞生记——不定长参数隐藏的类型问题(代码片段)

    这个bug的诞生源于项目中使用了一个开源C库。由于对该C库API不熟悉,一个不起眼的错误调用,导致一系列诡异的问题。最终经过调试,我们发现发生了内存覆盖问题。为了直达问题根节,我将问题代码简化... 查看详情

写了个全局变量的bug,被同事们打脸!!!(代码片段)

...不出什么问题,很诡异,再仔细看代码,原来是一个全局变量的问题,导致在并发情况下出现了线程不安全的问题,事后被同事们打脸!!!慎用全局变量,我在公司一直在强调,没想到这么低级的问题居然发生在自己身上,说... 查看详情

bug诞生记——const_cast引发只读数据区域写违例(代码片段)

    对于C++这种强类型的语言,明确的类型既带来了执行的高效,又让错误的发生提前到编译期。所以像const这类体现设计者意图的关键字,可以隐性的透露给我们它描述的对象的使用边界。它是我们的朋友&#x... 查看详情

二维数组赋值给一维数组,子函数返回获取临时变量的指针导致问题(代码片段)

1说明在C语言中,如果从子函数获取指针,然后将指针拷贝给其他数据,容易出现拷贝不成功。这是因为子函数的变量,分配在栈上,当子函数退出时,对应的变量也生命周期结束。如果此时在将指针指向... 查看详情

变量存储区:堆和栈(代码片段)

...下相关资料,总结一下。栈栈,存储函数中的局部变量(临时变量),存储函数地址,栈是后进先出的结构,由CPU管理和优化。使用栈存储变量的优势在于:你不用再管理内存了,不必手动分配内存或释放它,此外,由于CPU相关... 查看详情

临时变量的解说和验证(代码片段)

目录一、什么是临时变量?    1、生命周期    2、作用范围二、验证临时变量的特性    1、证明临时变量的开辟    2、证明临时变量有生命周期和作用范围三、总结一、什么是临时变量?临时变量指的是未在程... 查看详情

栈溢出学习(代码片段)

...到。加油加油。栈溢出原理栈溢出指的是程序向栈中某个变量中写入的字节数超过了这个变量本身所申请的字节数,因而导致与其相邻的栈中的变量的值被改变。看一个简单的程序:#include<stdio.h>#include<string.h>voi... 查看详情

栈溢出学习(代码片段)

...到。加油加油。栈溢出原理栈溢出指的是程序向栈中某个变量中写入的字节数超过了这个变量本身所申请的字节数,因而导致与其相邻的栈中的变量的值被改变。看一个简单的程序:#include<stdio.h>#include<string.h>voi... 查看详情

经典bug(代码片段)

1.变量使用错误,一般为笔误  本意是剔除自身的奇案8个字符,结果因为取长度是使用错了变量,导致异常2.异常捕获类异常  已建立业务类异常,将函数抽出来,加了子线程处理任务,会把原来的业务类异常统一变成了Exec... 查看详情

记一个c系语言中数值类型变量隐式转换的小坑(代码片段)

今日在刷LeetCode时偶遇一个小坑,也是由于很久以来经常写太高级的语言被惯坏了导致的,回头写C的时候就经常踩坑。这篇短文中只探讨混用数值类型导致的坑,借用标准里的话来说,就是当你只有一个数值类型T... 查看详情

使用表变量或临时表遍历数据(代码片段)

--方法1:使用表变量--声明表变量DECLARE@tempTABLE(empidINT,firstnameNVARCHAR(10),lastnameNVARCHAR(20));--将源表中的数据插入到表变量中INSERTINTO@temp(empid,firstname,lastname)SELECTempid,firstname,lastnameFROMHR.EmployeesORDERBYe 查看详情

for循环获取文件名,使用临时变量(代码片段)

...yedexpansion,否则变量赋值是空。同时如果需要使用for中的临时变量需要使用"!"。 查看详情

java临时变量的使用(代码片段)

importorg.apache.commons.lang3.tuple.ImmutablePair;importorg.apache.commons.lang3.tuple.ImmutableTriple;//返回两个字段ImmutablePair<Integer,String>pair=ImmutablePair.of(1,"yideng");System.out.println( 查看详情

csharp错误考虑将值存储在临时变量中(代码片段)

查看详情

函数返回值与引用(代码片段)

...5.0);//4主函数中各条语句的实际意义1.将temp赋值给float()的临时变量,再将临时变量赋值给a。2.将temp赋值给float()的临时变量,再将b作为临时变量的引用。3.将float()的临时变量的变量名作为temp的引用,再将临时变量的值赋给c(即... 查看详情