多线程一定就快吗?

多线程一定就快吗?

并发编程与多线程编程

要了解并发编程,首先要懂得与并行这个概念进行区分。并行是指两个事件同时进行,并发是CPU切换速度快,看起来像是每个任务同时进行一样。多线程是实现并发编程的一种方式,假设一个场景,在广州地铁高峰时段,一群人涌进地铁里,在不同的闸机口刷卡进去。在这个场景里,进地铁就是任务,每个人可以看出是并发的,而多个刷卡闸机口就是多线程。

  并发编程的本质目的是为了充分利用CPU,让程序运行得更快。然而,并不是启动更多的线程就能让程序最大限度地并发执行。在进行并发编程时,如果希望通过多线程执行任务让程序运行得更快,会面临非常多的挑战。比如上下文切换的问题、死锁的问题,以及受限于硬件和软件的资源限制问题,下面就来唠嗑唠嗑这些因素。

上下文切换

原理分析

正如上面所言,并发与并行最大的区别就是,并发只是看起来像是并行。实际上是,CPU通过给每个线程分配时间来执行这个线程的程序,只是这个时间非常短,通常是几十毫秒,我们根本无法观察到变化,感觉它们都是同时执行的一样。

  CPU通过时间片分配算法来循环执行任务,当前任务执行一个时间片后会切换到下一个任务。但是,在切换前会保存上一个任务的状态,以便下次切换回这个任务时,可以再加载这个任务的状态。所以任务从保存到再加载的过程就是一次上下文切换。因此,不难得知,上下文切换需要耗费不少时间。

  再来假设一个场景,一个人去火车站买票,买票的窗口有十来个那么多。买票的人并不知道哪个窗口可以买到票,只能挨个地问,最后终于在最后一个窗口买到了。这个场景,看似买票的过程很长,其实大部分时间都在切换窗口上,这也就是上下文切换的问题所在。因此,并非线程数多就一定执行得快,要选择与任务相适应的线程数才是最佳方案。

测试代码

package Concurrency;

/**
 * @author RuiMing Lin
 * @date 2020-03-28 12:19
 */
public class Demo1 {
    public static void main(String[] args) {
        System.out.println("万级循环:");
        concurrency(10000);
        serial(10000);
        System.out.println("--------------------------华丽分隔符--------------------------------");
        System.out.println("十万级循环:");
        concurrency(100000);
        serial(100000);
        System.out.println("--------------------------华丽分隔符--------------------------------");
        System.out.println("百万级循环:");
        concurrency(1000000);
        serial(1000000);
        System.out.println("--------------------------华丽分隔符--------------------------------");
        System.out.println("千万级循环:");
        concurrency(10000000);
        serial(10000000);
        System.out.println("--------------------------华丽分隔符--------------------------------");
        System.out.println("亿级循环:");
        concurrency(100000000);
        serial(100000000);
    }

    private static void concurrency(long count){
        // 开启三个线程执行三个循环
        long start = System.currentTimeMillis();
        new Thread(new Runnable() {
            @Override
            public void run() {
                int a = 0;
                for (long i = 0; i < count; i++) {
                    a++;
                }
            }
        }).start();
        new Thread(new Runnable() {
            @Override
            public void run() {
                int b = 0;
                for (long i = 0; i < count; i++) {
                    b++;
                }
            }
        }).start();
        new Thread(new Runnable() {
            @Override
            public void run() {
                int c = 0;
                for (long i = 0; i < count; i++) {
                    c++;
                }
            }
        }).start();
        long end = System.currentTimeMillis();
        long time = end - start;
        System.out.println("并行执行花费时间为:" + time + "ms");
    }

    private static void serial(long count){
        // 三个循环顺序执行
        long start = System.currentTimeMillis();
        int a = 0;
        int b = 0;
        int c = 0;
        for (int i = 0; i < count; i++) {
            a++;
        }
        for (int i = 0; i < count; i++) {
            b++;
        }
        for (int i = 0; i < count; i++) {
            c++;
        }
        long end = System.currentTimeMillis();
        long time = end - start;
        System.out.println("串行执行花费时间为:" + time + "ms");
    }
}


结果输出: 万级循环: 并行执行花费时间为:4ms 串行执行花费时间为:1ms --------------------------华丽分隔符-------------------------------- 十万级循环: 并行执行花费时间为:1ms 串行执行花费时间为:4ms --------------------------华丽分隔符-------------------------------- 百万级循环: 并行执行花费时间为:1ms 串行执行花费时间为:10ms --------------------------华丽分隔符-------------------------------- 千万级循环: 并行执行花费时间为:1ms 串行执行花费时间为:36ms --------------------------华丽分隔符-------------------------------- 亿级循环: 并行执行花费时间为:1ms 串行执行花费时间为:357ms 分析结果:当数量级在万级时,串行是比并发要快的,当数量级来到十万以后,串行便显得力不从心了。所以,可以认为当程序执行量不够大时,是没必要开启多线程的。

如何减少上下文切换

减少上下文切换的方法有无锁并发编程、CAS算法、使用最少线程和使用协程。

  1. 无锁并发编程。多线程竞争锁时,会引起上下文切换,所以多线程处理数据时,可以用一些办法来避免使用锁,如将数据的ID按照Hash算法取模分段,不同的线程处理不同段的数据。
  2. CAS算法。Java的Atomic包使用CAS算法来更新数据,而不需要加锁。
  3. 使用最少线程。避免创建不需要的线程,比如任务很少,但是创建了很多线程来处理,这样会造成大量线程都处于等待状态。
  4. 协程:在单线程里实现多任务的调度,并在单线程里维持多个任务间的切换。

死锁

原理分析

 死锁,是指多个线程在运行过程中因争夺相同资源而造成的一种僵局,当进程处于这种僵持状态时,它们都将无法再向前推进,此时程序就处于瘫痪状态,无法执行。 通常情况下,是多个线程共同竞争同一把锁对象,而其中一个线程获得锁之后发生异常等未来得及释放锁,导致其它线程一直在等待,无法运行。

测试代码

package Concurrency;

/**
 * @author RuiMing Lin
 * @date 2020-03-28 13:14
 */
public class Demo2 {
    private static String str1 = "A";
    private static String str2 = "B";

    public static void main(String[] args) {
        new Thread(new Runnable() {
            @Override
            public void run() {
                synchronized (str1){
                    System.out.println("第一个线程获得str1");
                    try {
                        Thread.currentThread().sleep(2000);
                    }catch (InterruptedException e){
                        e.printStackTrace();
                    }
                    synchronized (str2){
                        System.out.println("第一个线程获得str2");
                    }
                }
            }
        }).start();

        new Thread(new Runnable() {
            @Override
            public void run() {
                synchronized (str2){
                    System.out.println("第二个线程获得str2");
                    try {
                        Thread.currentThread().sleep(2000);
                    }catch (InterruptedException e){
                        e.printStackTrace();
                    }
                    synchronized (str1){
                        System.out.println("第二个线程获得str1");
                    }
                }
            }
        }).start();
    }
}


结果输出: 20200328132045885

如何解决死锁

  1. 避免一个线程同时获取多个锁。
  2. 避免一个线程在锁内同时占用多个资源,尽量保证每个锁只占用一个资源。
  3. 尝试使用定时锁,使用lock.tryLock(timeout)来替代使用内部锁机制。
  4. 对于数据库锁,加锁和解锁必须在一个数据库连接里,否则会出现解锁失败的情况。

总结

并发程序并不是简单的程序,编写的时候应该严谨一些。复杂的代码容易引起死锁,因此,建议多使用JDK并发包提供的并发容器和工具类来解决并发问题。同时,也要注重新能上的问题,既要考虑到程序执行任务量,也要考虑CPU性能等等,不要一昧地增加线程数。