Python使用进程池管理进程

和选用线程池来关系多线程类似,当程序中设置到多进程编程时,Python 提供了更好的管理多个进程的方式,就是使用进程池。

进程池可以提供指定数量的进程给用户使用,即当有新的请求提交到进程池中时,如果池未满,则会创建一个新的进程用来执行该请求;反之,如果池中的进程数已经达到规定最大值,那么该请求就会等待,只要池中有进程空闲下来,该请求就能得到执行。

Python multiprocessing 模块提供了 Pool() 函数,专门用来创建一个进程池,该函数的语法格式如下:

multiprocessing.Pool( processes )

其中,processes 参数用于指定该进程池中包含的进程数。如果进程是 None,则默认使用 os.cpu_count() 返回的数字(根据本地的 cpu 个数决定,processes 小于等于本地的 cpu 个数)。

注意,Pool() 函数只是用来创建进程池,而 multiprocessing 模块中表示进程池的类是 multiprocessing.pool.Pool 类。该类中提供了一些和操作进程池相关的方法,如表 1 所示。

表 1 multiprocessing 模块 Pool 类常用方法
方法名 功能
apply( func[, args[, kwds]] ) 将 func 函数提交给进程池处理。其中 args 代表传给 func 的位置参数,kwds 代表传给 func 的关键字参数。该方法会被阻塞直到 func 函数执行完成。
apply_async( func[, args[, kwds[, callback[, error_callback]]]] ) 这是 apply() 方法的异步版本,该方法不会被阻塞。其中 callback 指定 func 函数完成后的回调函数,error_callback 指定 func 函数出错后的回调函数。
map( func, iterable[, chunksize] ) 类似于 Python 的 map() 全局函数,只不过此处使用新进程对 iterable 的每一个元素执行 func 函数。
map_async( func, iterable[, chunksize[, callback[, error_callback]]] ) 这是 map() 方法的异步版本,该方法不会被阻塞。其中 callback 指定 func 函数完成后的回调函数,error_callback 指定 func 函数出错后的回调函数。
imap( func, iterable[, chunksize] ) 这是 map() 方法的延迟版本。
imap_unordered( func, iterable[, chunksize] ) 功能类似于 imap() 方法,但该方法不能保证所生成的结果(包含多个元素)与原 iterable 中的元素顺序一致。
starmap( func, iterable[,chunksize] ) 功能类似于 map() 方法,但该方法要求 iterable 的元素也是 iterable 对象,程序会将每一个元素解包之后作为 func 函数的参数。
close() 关闭进程池。在调用该方法之后,该进程池不能再接收新任务,它会把当前进程池中的所有任务执行完成后再关闭自己。
terminate() 立即中止进程池。
join() 等待所有进程完成。

下面程序演示了进程池的创建和使用。
from multiprocessing import Pool
import time
import os

def action(name='https://www.xinbaoku.com'):
    print(name,' --当前进程:',os.getpid())
    time.sleep(3)
if __name__ == '__main__':
    #创建包含 4 条进程的进程池
    pool = Pool(processes=4)
    # 将action分3次提交给进程池
    pool.apply_async(action)
    pool.apply_async(action, args=('https://www.xinbaoku.com/python/', ))
    pool.apply_async(action, args=('https://www.xinbaoku.com/java/', ))
    pool.apply_async(action, kwds={'name': 'https://www.xinbaoku.com/shell/'})
    pool.close()
    pool.join()
程序执行结果为:

https://www.xinbaoku.com  --当前进程: 14396
https://www.xinbaoku.com/python/  --当前进程: 5432
https://www.xinbaoku.com/java/  --当前进程: 11080
https://www.xinbaoku.com/shell/  --当前进程: 10944


除此之外,我们可以使用 with 语句来管理进程池,这意味着我们无需手动调用 close() 方法关闭进程池。例如:
from multiprocessing import Pool
import time
import os

def action(name='https://www.xinbaoku.com'):
    time.sleep(3)
    return (name+' --当前进程:%d'%os.getpid())
if __name__ == '__main__':
    #创建包含 4 条进程的进程池

    with Pool(processes=4) as pool:
        adds = pool.map(action, ('https://www.xinbaoku.com/python/', 'https://www.xinbaoku.com/java/', 'https://www.xinbaoku.com/shell/'))
    for arc in adds:
        print(arc)
程序执行结果为:

https://www.xinbaoku.com/python/ --当前进程:24464
https://www.xinbaoku.com/java/ --当前进程:22900
https://www.xinbaoku.com/shell/ --当前进程:23324