深入理解java多线程-java并发编程的艺术

author author     2023-02-02     403

关键词:

今天深度学习一下《Java并发编程的艺术》的第1章并发编程的挑战,深入理解Java多线程,看看多线程中的坑。

注意,哈肯的程序员读书笔记并不是抄书,而是将书中精华内容和哈肯的开发经验相结合,给你系统地讲述我对相关知识理解。如果你发现哈肯讲的内容跟书中内容差异很大也不足为奇。

1 多线程的使用场景

在实际的商业系统中,为了提升程序的性能,我们经常会使用到多线程。java多线程也是后台开发岗、Android开发岗招聘面试和笔试时的热门问题。至少,到目前为止我面试过的200多位开发同学时,以及我曾经的几次求职被面试时,多半都会问java多线程并发相关的问题。

2 多线程的缺点

多线程能充分利用多核CPU的特性,但并不意味着多线程就一定比单线程更快,并发编程也存在许多限制和挑战,例如多线程间的上下文切换会有开销、多线程中的数据一致性问题、线程死锁问题、系统资源限制。

2.1 上下文切换的开销

(1)上下文切换的开销

CPU使用时间片算法,将处理时间轮着分配给不同的线程,所以即使是单核CPU也支持多线程,这个时间片非常短,一般是几十毫秒(ms),CPU不停的切换线程执行,让我们感觉多个线程是同时执行的。CPU在切换线程前会保存上一个任务的状态,以便下次切换回这个线程时,可以正常继续执行。我们把线程的状态保存到再加载的过程称为一次上下文切换。

《Java并发编程的艺术》作者写了一段程序,让2个线程同时不断地做变量自增操作,结果证明用2个线程并行甚至比单线程串行更慢一些。通过使用Lmbench3测量上下文切换的时长,发现上述多线程代码中每秒高达1000多次的线程上下文切换。因此不是多线程就一定更快,还要看在线程中干了什么。

(2)如何减少上下文切换

减少上下文切换的方法有:无锁并发编程、CAS算法、减少不必要的线程、使用协程。

  • 无锁并发编程。多线程竞争锁时,会引起上下文切换,通过避免使用锁,可以减少线程的切换,例如将数据用ID分段,不同的线程处理不同段的数据。
  • CAS算法。Java的Atomic包使用CAS算法来更新数据,而不需要加锁。
  • 减少不必要的线程。当任务很少时,尽量减少不必要的线程,避免造成大量线程都处于等待状态。
  • 协程:在单线程里实现多任务的调度,并在单线程里维持多个任务间的切换。

2.2 多线程中的数据一致性问题

(1)线程中访问外部数据的过程

每个线程都有自己的栈,保存线程中创建的局部变量,如果线程中使用到外部的变量,则线程通常会把改外部变量复制一份到线程栈中,当修改完后,再将数据同步回外部。

(2)线程内操作的原子性问题

一个操作会由多个cpu指令构造。例如,创建对象操作大致分为几步:为对象分配内存、成员变量的值初始化、调用构造方法、返回对象的引用;又例如,线程中对一个外部变量的赋值(修改)操作大致分为几步:在当前线程栈创建变量副本,修改变量值,将变量值的修改同步回外部,由于CPU的时间片机制,每个线程获得时间片后,能执行的指令数量是有限的,可能一个操作还未完成,而时间片到了,需要保存上下文并切换到下一个线程。因此,无法保证操作的原子性。

(3)共享数据的可见性问题

观察上述的原子性问题中的例子,线程中对一个外部变量的赋值,可能线程A中刚创建了外部变量的副本,而线程B已经对该外部变量进行了修改,但线程A中是不知道的。即,一个线程对共享数据的修改,不能立刻被其他线程所看见,这就引起了数据一致性的问题。

(4)有序性问题

CPU单个核中,包含多个ALU单元(Arithmetic Logic Unit,即算术逻辑单元),用来执行算数运算和逻辑运算。目前Intel的Haswell架构的CPU(第四代酷睿处理器开始)有4个ALU单元。所以单核CPU在同一时刻是同时执行多个指令的。CPU会把多条指令进行重排序,把没有依赖关系的指令同时放到各ALU中执行。例如3个操作按如下顺序写代码 a=1; b=2; c=a+b; 由于a=1和b=2不存在依赖关系,2个指令可能会被重排序,而c=a+b存在依赖关系,这个指令一定会在前2个指令执行完后再执行,最终一定是c=3。请看如下代码:


public class VolatileTest 
private int a = 1;
private boolean status = false;

public void setStatus()
a = 2;
status = true;


public void test()
if (status)
int b = a + 1;
System.out.print(b);


如果有2个线程,线程A先执行setStatus(),然后线程B执行test(),那边打印出来的b的值,一定等于3吗?不一定!可能还是2。因为a=2和status=true没有依赖关系,所以会被重排序,并行派给不同ALU单元执行,导致可能status=true先执行完成,这是a=2还未执行完,此时a还是1,引起最终打印的b的值错误的问题。

(5)如何解决多线程的数据一致性问题

由于以上4点,引发了多线程中数据的一致性问题。解决办法主要有2个:

  • 使用volatile关键字。相对synchronized来说,volatile是一种轻量级的同步机制,有2个作用:一是保证共享变量对所有线程的可见性,即本地副本修改后会强制刷新回外部;二是禁止指令重排序优化。但要注意volatile只对单个变量读/写操作具有原子性,对i++这种复合操作(取值、加1、赋值)是无法保证其原子性的。要保证多线程中i++这种复合操作的原子性,可以改用CAS的实现类,例如用AtomicInteger代替int。
  • 加锁。通过锁来实现同一时间只有1个线程可以访问共享变量。

2.3 线程死锁问题

死锁产生需要同时满足4个条件:

  • 资源的互斥使用,即当资源被一个线程占有时,别的线程不能用。
  • 不可抢占,即资源请的求者不能从使用者手上强制夺取资源,只能等待对方释放。
  • 请求和保持,即在请求其他资源的同时还保持对现有资源的占有。
  • 循环等待,例如线程1持有资源A,请求资源B,而线程2持有资源B,请求资源A。

下面的代码演示对资源的请求和保持,持有res1不释放,同时对res2进行请求:


synchronized (res1) 
... // 执行一些操作
synchronized (res2)
...

如果此时有另外的线程持有了res2不释放,而请求res1,则会出现死锁。

解决死锁的方法

只要让产生死锁的4个条件中任何一个不成立,就可以避免死锁。具体做法通常有:

  • 使用Lock接口的tryLock()。
  • 避免一个线程中同时获得多个锁。例如上面代码所示,同时获得res1和res2的锁才能完成执行。
  • 避免一个锁中占用多个资源,即要缩小锁的范围。

Lock接口包含4个给对象加锁的方法,如下所示:


public interface Lock 
/**阻塞,直到另外一个线程释放锁*/
void lock();

/**以可被中断的方式获取锁。调用正在等待获得锁的线程的interrupt()方法可中断*/
void lockInterruptibly() throws InterruptedException;

/**非阻塞,尝试的获取锁,如果获取到则返回true,否则返回false*/
boolean tryLock();
/**阻塞,试图获取锁,最多阻塞等待指定时间,如果获取到则返回true,否则返回false*/
boolean tryLock(long time, TimeUnit unit) throws InterruptedException;

void unlock();
...

可见tryLock()可以尝试非阻塞地获取锁,或指定最长等待时间阻塞地获取锁,可以有效避免死锁。


Lock lock = new ReentrantLock();
if(lock.tryLock())
//成功获得锁
try
...
catch(Exception ex)

finally
lock.unlock(); //释放锁

else
//不能获取锁
...

我们再看看下面的代码,transfer()方法实现从当前Account转钱到目标Account,你发现问题了吗?


class Account 
private int money;
synchronized boolean transfer(Account target, int money)
if (this.money > money)
this.money -= money;
target.money += money;
return true;

return false;

在方法中使用synchronized关键字,其使用的是this对象进行加锁。所以上述代码只保证了this.money的原子性,却无法保证target.money的原子性。依然存在数据一致性问题。对应这种资源间存在关联关系的情况,我们需要用一个更大范围的锁来将相关资源都覆盖住,如下所示:

深入理解Java多线程(1)

class Account 
private int money;
boolean transfer(Account target, int money)
synchronized(Account.class)
if (this.money > money)
this.money -= money;
target.money += money;
return true;


return false;

然而锁的粒度(范围)越大,越容易造成其他线程的阻塞,实际使用时要尽量选择满足需求且锁的粒度更小的。

2.4 系统资源限制

系统的资源总是有限的,无节制地创建大量的线程,只会造成大量的线程上下文切换的开销,并不能实际提高程序的效率。按照大家的常规经验,如果是IO密集型,则线程池的核心线程数宜为2N+1;如果是
CPU密集型,则线程池核心线程数宜为N+1;其中N为CPU核数。


07深入理解java线程池

之前面试baba系时遇到一个相对简单的多线程编程题,即"3个线程循环输出ADC",自己答的并不是很好,深感内疚,决定更加仔细的学习《并发编程的艺术》一书,到达掌握的强度。(之前两月休息时间都花在了lol和吃鸡上... 查看详情

并发编程之美,带你深入理解java多线程原理

1.什么是多线程?多线程是为了使得多个线程并行的工作以完成多项任务,以提高系统的效率。线程是在同一时间需要完成多项任务的时候被实现的。2.了解多线程了解多线程之前我们先搞清楚几个重要的概念!如上图所示:对... 查看详情

《java并发编程的艺术》读后笔记-part4(代码片段)

...态1.5Daemon线程2.启动和终止线程2.1构造线程2.2启动线程2.3理解中断3.线程间的通信3.1volatile和synchronized关键字3.2等待/通知机制3.3等待/通知的经典范式3.4 查看详情

《java并发编程的艺术》学习小结

...章并发编程的挑战上下文切换:cpu通过时间片让不同线程轮流运行,从线程状态保存到下一次线程运行这个过程就是一次上下文切换多线程并不一定比单线程快,因为多线程会有线程创建和上下文切换的开销如何减少... 查看详情

《java并发编程的艺术》学习小结

...章并发编程的挑战上下文切换:cpu通过时间片让不同线程轮流运行,从线程状态保存到下一次线程运行这个过程就是一次上下文切换多线程并不一定比单线程快,因为多线程会有线程创建和上下文切换的开销如何减少... 查看详情

java并发编程系列34|深入理解线程池(下)

Java并发编程系列34|深入理解线程池(下)收录于话题#java976#程序员2286#并发编程238#进阶架构师|并发编程专题12★★★建议星标我们★★★公众号改版后文章乱序推荐,希望你可以点击上方“Java进阶架构师”,点击右上角,将我... 查看详情

原创java并发编程系列33|深入理解线程池(上)

【原创】Java并发编程系列33|深入理解线程池(上)收录于话题#并发编程238#程序员2286#java976#进阶架构师|并发编程专题12★★★建议星标我们★★★公众号改版后文章乱序推荐,希望你可以点击上方“Java进阶架构师”,点击右上... 查看详情

java多线程高并发学习笔记——深入理解线程池

线程池最核心的一个类:ThreadPoolExecutor.看一下该类的构造器:  publicThreadPoolExecutor(intparamInt1,intparamInt2,longparamLong,TimeUnitparamTimeUnit,BlockingQueue<Runnable>paramBlockingQueue){this(paramInt1,paramIn 查看详情

java多线程学习

...看Java并发包的的线程池(Java并发编程与技术内幕:线程池深入理解),或者看这个专栏:Java并发编程与技术内幕。你将会对Java里头的高并发场景下的线程有更加深刻的理解。目录(?)[-]一扩展javala 查看详情

java开发三年月薪才12k,深入浅出java多线程pdf

第1章并发编程线程基础1.1什么是线程1.2线程创建与运行1.3线程通知与等待1.4等待线程执行终止的join方法1.5让线程睡眠的sleep方法1.6让出CPU执行权的yield方法1.7线程中断1.8理解线程上下文切换1.9线程死锁1.10守护线程与用户线程1.11T... 查看详情

深入理解java内存模型——基础

并发编程模型的分类在并发编程中,我们需要处理两个关键问题:线程之间如何通信及线程之间如何同步(这里的线程是指并发执行的活动实体)。通信是指线程之间以何种机制来交换信息。在命令式编程中,线程之间的通信机... 查看详情

深入理解java内存模型——基础

并发编程模型的分类在并发编程中,我们需要处理两个关键问题:线程之间如何通信及线程之间如何同步(这里的线程是指并发执行的活动实体)。通信是指线程之间以何种机制来交换信息。在命令式编程中,线程之间的通信机... 查看详情

java并发编程——深入理解自旋锁

1.什么是自旋锁自旋锁(spinlock):是指当一个线程在获取锁的时候,如果锁已经被其它线程获取,那么该线程将循环等待,然后不断的判断锁是否能够被成功获取,直到获取到锁才会退出循环。获取锁的线程一直处于活跃状态... 查看详情

基于jvm原理jmm模型和cpu缓存模型深入理解java并发编程

...的讲解,作为讲授Java并发编程开发的主要内容,有的还深入到计算机系统的内存、CPU、缓存等予以说明。实际上,在实际的Java开发工作中,仅仅了解并发编程的创建、启动、管理和通信等基本知识还是不够的。一方面,如果要... 查看详情

2017年读书笔记

...《腾讯传》读过的书籍...《Java多线程编程核心技术》《深入理解Java虚拟机》《Java并发编程的艺术》《JAVA并发编程实践》 查看详情

java并发编程:深入剖析threadlocal

一、对ThreadLocal的理解  ThreadLocal,很多地方叫做线程本地变量,也有些地方叫做线程本地存储,其实意思差不多。可能很多朋友都知道ThreadLocal为变量在每个线程中都创建了一个副本,那么每个线程可以访问自己内部的副本... 查看详情

java多线程系列:一并发工具类的使用_2(countdownlatchcyclicbarriersemaphoreexchanger)(代码片段)

前言-本系列随笔会深入浅出,解析java多线程的各种技术及实现。随笔主要根据《java并发编程的艺术》一书作为参考。 本系列以使用为主要目的,本人理解有限,还望读者辩证采纳,没有过多涉及源码的讨论,重在初学者的... 查看详情

《java并发编程的艺术》epub下载在线阅读,求百度网盘云资源

...者是阿里和1号店的资深Java技术专家,对并发编程有非常深入的研究,《Java并发编程的艺术》是他们多年一线开发经验的结晶。本书的部分内容在出版早期发表在Java并发编程网和InfoQ等技术社区,得到了非常高的评价。它选取了... 查看详情