在Java语言中,创建线程并不像创建对象一样简单。虽然只需要使用new Thread()即可创建线程,但实际上创建线程比创建对象复杂得多。创建对象只需在JVM的堆中分配内存,而创建线程需要调用操作系统内核的API,并为线程分配一系列资源,这个成本相对较高。因此,线程被视为重量级的对象,应尽量避免频繁创建和销毁。; x$ }0 V* ?8 ?
; M3 i: u: r( x2 E# s' Y* W
那么如何避免频繁创建线程呢?解决方案就是使用线程池。+ V3 Y4 B9 X {: |- @( \. \; r
由于线程池的需求非常普遍,所以Java SDK的并发包自然也包含了线程池。但是,很多人初次接触并发包中与线程池相关的工具类时,可能会感到有些困惑,不知从何入手。我认为,这主要是因为线程池与通常意义上的资源池是不同的。一般意义上的资源池在需要资源时调用acquire()方法申请资源,在使用完毕后调用release()释放资源。然而,如果你带着这种固有模型来看待并发包中的线程池相关工具类,会遗憾地发现它们与之不匹配,因为Java提供的线程池中根本不存在申请线程和释放线程的方法。3 d4 }4 B+ U$ b+ ~ g- j4 s
class XXXPool{
// 获取池化资源
XXX acquire() {
}
// 释放池化资源
void release(XXX x){
}
}
线程池是一种生产者-消费者模式 - z. `# G; @* g; f- c
线程池之所以没有采用一般意义上池化资源的设计方法,是因为线程池是基于生产者-消费者模式的设计。
+ v" X+ [) d L M! Q 在一般意义上的池化资源设计中,我们可以通过acquire()方法获取到一个空闲资源,然后通过使用资源来执行具体的任务,最后再通过release()方法释放资源。但是在线程池中,由于涉及到线程的管理和复用,采用了不同的设计思路。
& s9 K! }/ W+ ? 当我们从线程池中获取到一个空闲线程时,我们期望能够像使用Thread类创建线程那样,通过调用该线程的execute()方法,传入一个Runnable对象来执行具体的业务逻辑。然而,遗憾的是,Thread类并没有像execute(Runnable target)这样的公共方法。这是因为线程池在管理线程时,需要考虑到线程的状态、任务队列等方面的复杂情况,因此不能简单地将线程的使用方式与传统的池化资源相同。9 K' K3 R3 d0 Y5 i+ C7 M
//采用一般意义上池化资源的设计方法
class ThreadPool{
// 获取空闲线程
Thread acquire() {
}
// 释放线程
void release(Thread t){
}
}
//期望的使用
ThreadPool pool;
Thread T1=pool.acquire();
//传入Runnable对象
T1.execute(()->{
//具体业务逻辑
......
});
所以,线程池的设计,没有办法直接采用一般意义上池化资源的设计方法。那线程池该如何设计呢?目前业界线程池的设计,普遍采用的都是 生产者-消费者模式。线程池的使用方是生产者,线程池本身是消费者。在下面的示例代码中,我们创建了一个非常简单的线程池MyThreadPool,你可以通过它来理解线程池的工作原理。% Q/ I: ]) ~+ g' o5 \. N. S
//简化的线程池,仅用来说明工作原理
class MyThreadPool{
//利用阻塞队列实现生产者-消费者模式
BlockingQueue<Runnable> workQueue;
//保存内部工作线程
List<WorkerThread> threads
= new ArrayList<>();
// 构造方法
MyThreadPool(int poolSize,
BlockingQueue<Runnable> workQueue){
this.workQueue = workQueue;
// 创建工作线程
for(int idx=0; idx<poolSize; idx++){
WorkerThread work = new WorkerThread();
work.start();
threads.add(work);
}
}
// 提交任务
void execute(Runnable command){
workQueue.put(command);
}
// 工作线程负责消费任务,并执行任务
class WorkerThread extends Thread{
public void run() {
//循环取任务并执行
while(true){ ①
Runnable task = workQueue.take();
task.run();
}
}
}
}
/** 下面是使用示例 **/
// 创建有界阻塞队列
BlockingQueue<Runnable> workQueue =
new LinkedBlockingQueue<>(2);
// 创建线程池
MyThreadPool pool = new MyThreadPool(
10, workQueue);
// 提交任务
pool.execute(()->{
System.out.println("hello");
});
在MyThreadPool的内部,我们维护了一个阻塞队列workQueue和一组工作线程,工作线程的个数由构造函数中的poolSize来指定。用户通过调用execute()方法来提交Runnable任务,execute()方法的内部实现仅仅是将任务加入到workQueue中。MyThreadPool内部维护的工作线程会消费workQueue中的任务并执行任务,相关的代码就是代码①处的while循环。线程池主要的工作原理就这些,是不是还挺简单的?
+ J1 W0 A8 f1 y0 q) @ 如何使用Java中的线程池
+ g3 l0 b; w6 c. j* k4 k! ^ Java并发包里提供的线程池,远比我们上面的示例代码强大得多,当然也复杂得多。Java提供的线程池相关的工具类中,最核心的是 ThreadPoolExecutor,通过名字你也能看出来,它强调的是Executor,而不是一般意义上的池化资源。
3 V- Q3 F% ?2 e, Y, u+ Q: g0 M ThreadPoolExecutor的构造函数非常复杂,如下面代码所示,这个最完备的构造函数有7个参数。
e7 H8 H) a+ ?$ R7 ^" Y3 d ThreadPoolExecutor(
int corePoolSize,
int maximumPoolSize,
long keepAliveTime,
TimeUnit unit,
BlockingQueue<Runnable> workQueue,
ThreadFactory threadFactory,
RejectedExecutionHandler handler)
下面我们逐一介绍这些参数的含义,将线程池类比为一个项目组,而每个线程就是项目组的成员。8 v- l; X8 H3 H+ h1 N+ l
corePoolSize:表示线程池所持有的最小线程数。有些项目可能很闲,但也不能将所有项目组成员都撤离,至少要留下corePoolSize个人守在岗位上。 maximumPoolSize:表示线程池可创建的最大线程数。当项目繁忙时,需要增加成员,但也不能无限制地增加,最多增加到maximumPoolSize个人。当项目变得闲暇时,需要减少成员,最多将成员减至corePoolSize个人。 keepAliveTime & unit:前面提到,项目根据忙闲来增减成员。在编程世界中,如何定义忙和闲呢?很简单,如果一个线程在一段时间内都没有执行任务,说明它处于闲置状态。而keepAliveTime和unit就用来定义这段时间的参数。也就是说,如果一个线程空闲了keepAliveTime & unit这么长时间,并且线程池的线程数超过了corePoolSize,那么该空闲线程就会被回收。 workQueue:工作队列,与上面示例代码中的工作队列意义相同。 threadFactory:通过该参数,你可以自定义如何创建线程。例如,你可以为线程指定一个有意义的名称。 handler:通过该参数,你可以自定义任务的拒绝策略。如果线程池中所有的线程都在忙碌,且工作队列已满(前提是工作队列是有界队列),此时提交任务,线程池将会拒绝接收。至于拒绝策略,你可以通过handler参数来指定。ThreadPoolExecutor已经提供了以下四种策略: CallerRunsPolicy:提交任务的线程自行执行该任务。 AbortPolicy:默认的拒绝策略,会抛出RejectedExecutionException异常。 DiscardPolicy:直接丢弃任务,没有任何异常抛出。 DiscardOldestPolicy:丢弃最老的任务,实际上是丢弃最早进入工作队列的任务,并将新任务加入工作队列。- s& h6 J7 I- \! C2 u
Java 1.6版本还增加了allowCoreThreadTimeOut(boolean value)方法,它可以使所有线程都支持超时。这意味着如果项目很闲,项目组的成员都会被撤离。
0 e6 ^- C* ~/ i5 N4 x 使用线程池要注意些什么
7 w; o" q* g( _. P 考虑到ThreadPoolExecutor的构造函数相对复杂,Java并发包提供了一个线程池的静态工厂类Executors,通过Executors可以快速创建线程池。不过,目前大型公司的编码规范一般不建议使用Executors,所以我就不再详细介绍这方面内容了。' a7 e% ?$ d& B+ x2 m* k( b
不建议使用Executors最重要的原因是:Executors提供的许多方法默认使用**的LinkedBlockingQueue。在高负载情况下,**队列很容易导致OOM(内存溢出),而OOM会导致所有请求都无法处理,这是一个严重的问题。因此,强烈建议使用有界队列。5 I$ n' o3 ?, ~4 n' f' s
使用有界队列时,当任务过多时,线程池会触发执行拒绝策略。线程池的默认拒绝策略会抛出RejectedExecutionException异常,这是一个运行时异常,编译器不会强制要求捕获它,因此开发人员很容易忽略。因此,在使用默认拒绝策略时要谨慎。如果线程池处理的任务非常重要,建议自定义拒绝策略,并在实际工作中将自定义的拒绝策略与降级策略配合使用。
* d e" i* C& T, ~ 在使用线程池时,还需要注意异常处理的问题。例如,通过ThreadPoolExecutor对象的execute()方法提交任务时,如果任务在执行过程中出现运行时异常,会导致执行该任务的线程终止。然而,最致命的是尽管任务发生异常,你却无法获得任何通知,这可能让你误以为任务都正常执行了。尽管线程池提供了许多用于异常处理的方法,但最可靠和简单的方案是捕获所有异常并根据需要进行处理,你可以参考下面的示例代码。/ n1 Q( B- f" H; f$ j
try {
//业务逻辑
} catch (RuntimeException x) {
//按需处理
} catch (Throwable x) {
//按需处理
}
总结
$ D# `3 L* O0 h- @; { 线程池在Java并发编程领域中扮演着重要角色,许多大型公司的编码规范要求使用线程池来管理线程。线程池与普通的资源池有很大的区别,实际上它是生产者-消费者模式的一种实现。理解生产者-消费者模式是理解线程池的关键所在。