当前位置：首页 > news >正文

python进程与线程

news 来源：原创 2024/11/27 21:41:06

1. 前言

最近总结了python中如何创建并使用多进程和多线程的主要方法，所有代码都自测成功，用于以后编写代码时复制修改。

2. 各种代码

2.1 使用multiprocessing模块创建进程

演示process类的方法和属性的使用，创建2个字进程，分别使用os模块和time模块输出父进程和子进程的ID以及子进程的时间，并调用process类的name和pid属性，代码如下：

# -*- coding:utf-8 -*-
from multiprocessing import Process
import time
import os


# 两个子进程将会调用的两个方法
def child_1(interval):
    print("子进程（%s）开始执行，父进程为（%s）" % (os.getpid(), os.getppid()))
    t_start = time.time()  # 计时开始
    time.sleep(interval)  # 程序将会被挂起interval秒
    t_end = time.time()  # 计时结束
    print("子进程（%s）执行时间为'%0.2f'秒" % (os.getpid(), t_end - t_start))


def child_2(interval):
    print("子进程（%s）开始执行，父进程为（%s）" % (os.getpid(), os.getppid()))
    t_start = time.time()  # 计时开始
    time.sleep(interval)  # 程序将会被挂起interval秒
    t_end = time.time()  # 计时结束
    print("子进程（%s）执行时间为'%0.2f'秒" % (os.getpid(), t_end - t_start))


if __name__ == '__main__':
    print("------父进程开始执行-------")
    print("父进程PID：%s" % os.getpid())  # 输出当前程序的ID
    p1 = Process(target=child_1, name="process1", args=(1,))  # 实例化进程p1
    p2 = Process(target=child_2, name="process2", args=(2,))  # 实例化进程p2
    p1.start()  # 启动进程p1
    p2.start()  # 启动进程p2
    # 同时父进程仍然往下执行，如果p2进程还在执行，将会返回True
    print("p1.is_alive=%s" % p1.is_alive())
    print("p2.is_alive=%s" % p2.is_alive())
    # 输出p1和p2进程的别名和PID
    print("p1.name=%s" % p1.name)
    print("p1.pid=%s" % p1.pid)
    print("p2.name=%s" % p2.name)
    print("p2.pid=%s" % p2.pid)
    print("------等待子进程-------")
    p1.join()  # 等待p1进程结束
    p2.join()  # 等待p2进程结束
    print("------父进程执行结束-------")

运行结果：

------父进程开始执行-------
父进程PID：616
p1.is_alive=True
p2.is_alive=True
p1.name=process1
p1.pid=12256
p2.name=process2
p2.pid=14976
------等待子进程-------
子进程（12256）开始执行，父进程为（616）
子进程（14976）开始执行，父进程为（616）
子进程（12256）执行时间为'1.00'秒
子进程（14976）执行时间为'2.00'秒
------父进程执行结束-------

Process finished with exit code 0

2.2 使用process子类创建进程

对于简单的任务，通常使用上一节方式实现多进程，但是如果要处理复杂任务，通常定义一个类，使其继承Process类，每次实例化这个类的时候，等同于实例化一个进程对象。代码如下：

# -*- coding:utf-8 -*-
from multiprocessing import Process
import time
import os


# 继承Process类
class SubProcess(Process):
    # 由于Process类本身也有__init__初识化方法，这个子类相当于重写了父类的这个方法
    def __init__(self, interval, name=''):
        Process.__init__(self)  # 调用Process父类的初始化方法
        self.interval = interval  # 接收参数interval
        if name:  # 判断传递的参数name是否存在
            self.name = name  # 如果传递参数name,则为子进程创建name属性，否则使用默认属性

    # 重写了Process类的run()方法
    def run(self):
        print("子进程(%s) 开始执行，父进程为（%s）" % (os.getpid(), os.getppid()))
        t_start = time.time()
        time.sleep(self.interval)
        t_stop = time.time()
        print("子进程(%s)执行结束，耗时%0.2f秒" % (os.getpid(), t_stop - t_start))


if __name__ == "__main__":
    print("------父进程开始执行-------")
    print("父进程PID：%s" % os.getpid())  # 输出当前程序的ID
    p1 = SubProcess(interval=1, name='subprocess1')
    p2 = SubProcess(interval=2, name='subprocess2')
    # 对一个不包含target属性的Process类执行start()方法，就会运行这个类中的run()方法，
    # 所以这里会执行p1.run()
    p1.start()  # 启动进程p1
    p2.start()  # 启动进程p2
    # 输出p1和p2进程的执行状态，如果真正进行，返回True,否则返回False
    print("p1.is_alive=%s" % p1.is_alive())
    print("p2.is_alive=%s" % p2.is_alive())
    # 输出p1和p2进程的别名和PID
    print("p1.name=%s" % p1.name)
    print("p1.pid=%s" % p1.pid)
    print("p2.name=%s" % p2.name)
    print("p2.pid=%s" % p2.pid)
    print("------等待子进程-------")
    p1.join()  # 等待p1进程结束
    p2.join()  # 等待p2进程结束
    print("------父进程执行结束-------")

运行结果：

------父进程开始执行-------
父进程PID：8292
p1.is_alive=True
p2.is_alive=True
p1.name=subprocess1
p1.pid=7376
p2.name=subprocess2
p2.pid=8904
------等待子进程-------
子进程(8904) 开始执行，父进程为（8292）子进程(7376) 开始执行，父进程为（8292）

子进程(7376)执行结束，耗时1.00秒
子进程(8904)执行结束，耗时2.02秒
------父进程执行结束-------

Process finished with exit code 0

2.3 使用进程池Pool创建进程

定义一个进程池，设置最大进程数为3，然后使用非阻塞方式执行10个任务，查看每个进程执行的任务，代码如下：

# -*- coding=utf-8 -*-
from multiprocessing import Pool
import os, time


def task(name):
    print('子进程（%s）执行task %s ...' % (os.getpid(), name))
    time.sleep(1)  # 休眠1秒


if __name__ == '__main__':
    print('父进程（%s）.' % os.getpid())
    p = Pool(3)  # 定义一个进程池，最大进程数3
    for i in range(10):  # 从0开始循环10次
        p.apply_async(task, args=(i,))  # 使用非阻塞方式调用task()函数
    print('等待所有子进程结束...')
    p.close()  # 关闭进程池，关闭后p不再接收新的请求
    p.join()  # 等待子进程结束
    print('所有子进程结束.')

执行结果：

父进程（2992）.
等待所有子进程结束...
子进程（3772）执行task 0 ...
子进程（11708）执行task 1 ...
子进程（5084）执行task 2 ...
子进程（11708）执行task 3 ...
子进程（5084）执行task 4 ...
子进程（3772）执行task 5 ...
子进程（3772）执行task 6 ...
子进程（5084）执行task 7 ...
子进程（11708）执行task 8 ...
子进程（3772）执行task 9 ...
所有子进程结束.

Process finished with exit code 0

2.4 队列的基本功能

代码如下：

# coding=utf-8
from multiprocessing import Queue

if __name__ == '__main__':
    q = Queue(3)  # 初始化一个Queue对象，最多可接收三条put消息
    q.put("消息1")
    q.put("消息2")
    print(q.full())  # 返回False
    q.put("消息3")
    print(q.full())  # 返回True

    # 因为消息列队已满，下面的try都会抛出异常，
    # 第一个try会等待2秒后再抛出异常，第二个try会立刻抛出异常
    try:
        q.put("消息4", True, 2)
    except:
        print("消息列队已满，现有消息数量:%s" % q.qsize())

    try:
        q.put_nowait("消息4")
    except:
        print("消息列队已满，现有消息数量:%s" % q.qsize())

    # 读取消息时，先判断消息列队是否为空，再读取
    if not q.empty():
        print('----从队列中获取消息---')
        for i in range(q.qsize()):
            print(q.get_nowait())
    # 先判断消息列队是否已满，再写入
    if not q.full():
        q.put_nowait("消息4")

执行结果：

False
True
消息列队已满，现有消息数量:3
消息列队已满，现有消息数量:3
----从队列中获取消息---
消息1
消息2
消息3

Process finished with exit code 0

2.5 使用队列再进程间通信

创建两个子进程，一个子进程负责向队列中写入数据，另外一个子进程负责从队列中读取数据。代码如下：

# -*- coding: utf-8 -*-
from multiprocessing import Process, Queue
import time


# 向队列中写入数据
def write_task(q):
    if not q.full():
        for i in range(5):
            message = "消息" + str(i)
            q.put(message)
            print("写入:%s" % message)


# 从队列读取数据
def read_task(q):
    time.sleep(1)  # 休眠1秒
    while not q.empty():
        print("读取:%s" % q.get(True, 2))  # 等待2秒，如果还没读取到任何消息，
    # 则抛出"Queue.Empty"异常


if __name__ == "__main__":
    print("-----父进程开始-----")
    q = Queue()  # 父进程创建Queue，并传给各个子进程
    pw = Process(target=write_task, args=(q,))  # 实例化写入队列的子进程，并且传递队列
    pr = Process(target=read_task, args=(q,))  # 实例化读取队列的子进程，并且传递队列
    pw.start()  # 启动子进程 pw，写入
    pr.start()  # 启动子进程 pr，读取
    pw.join()  # 等待 pw 结束
    pr.join()  # 等待 pr 结束
    print("-----父进程结束-----")

执行结果：

-----父进程开始-----
写入:消息0
写入:消息1
写入:消息2
写入:消息3
写入:消息4
读取:消息0
读取:消息1
读取:消息2
读取:消息3
读取:消息4
-----父进程结束-----

Process finished with exit code 0

2.6 使用theading模块创建线程

使用theading模块创建线程，代码如下：

# -*- coding:utf-8 -*-
import threading, time


def process():
    for i in range(3):
        time.sleep(1)
        print("thread name is %s" % threading.current_thread().name)


if __name__ == '__main__':
    print("-----主线程开始-----")
    threads = [threading.Thread(target=process) for i in range(4)]  # 创建4个线程，存入列表
    for t in threads:
        t.start()  # 开启线程
    for t in threads:
        t.join()  # 等待子线程结束
    print("-----主线程结束-----")

执行结果：

-----主线程开始-----
thread name is Thread-2
thread name is Thread-4
thread name is Thread-3
thread name is Thread-1
thread name is Thread-3
thread name is Thread-1
thread name is Thread-4
thread name is Thread-2
thread name is Thread-2thread name is Thread-3
thread name is Thread-1thread name is Thread-4


-----主线程结束-----

Process finished with exit code 0

2.7 使用Thead子类创建线程

创建一个子类SubThread，继承threading.Thread线程类,并定义一个run()方法。实例化SubThread类创建2个线程，并且调用start()方法开启线程，程序会自动调用run()方法。代码如下：

# -*- coding: utf-8 -*-
import threading
import time


class SubThread(threading.Thread):
    def run(self):
        for i in range(3):
            time.sleep(1)
            msg = "子线程" + self.name + '执行，i=' + str(i)  # name属性中保存的是当前线程的名字
            print(msg)


if __name__ == '__main__':
    print('-----主线程开始-----')
    t1 = SubThread()  # 创建子线程t1
    t2 = SubThread()  # 创建子线程t2
    t1.start()  # 启动子线程t1
    t2.start()  # 启动子线程t2
    t1.join()  # 等待子线程t1
    t2.join()  # 等待子线程t2
    print('-----主线程结束-----')

执行结果：

-----主线程开始-----
子线程Thread-2执行，i=0
子线程Thread-1执行，i=0
子线程Thread-1执行，i=1
子线程Thread-2执行，i=1
子线程Thread-2执行，i=2子线程Thread-1执行，i=2

-----主线程结束-----

Process finished with exit code 0

2.8 线程间通信

进程间不能共享信息，但是线程间可以通过全局变量共享信息。代码如下

# -*- coding:utf-8 -*-
from threading import Thread
import time


def plus():
    print('-------子线程1开始------')
    global g_num
    g_num += 50
    print('g_num is %d' % g_num)
    print('-------子线程1结束------')


def minus():
    time.sleep(1)
    print('-------子线程2开始------')
    global g_num
    g_num -= 50
    print('g_num is %d' % g_num)
    print('-------子线程2结束------')


g_num = 100  # 定义一个全局变量
if __name__ == '__main__':
    print('-------主线程开始------')
    print('g_num is %d' % g_num)
    t1 = Thread(target=plus)  # 实例化线程p1
    t2 = Thread(target=minus)  # 实例化线程p2
    t1.start()  # 开启线程p1
    t2.start()  # 开启线程p2
    t1.join()  # 等待p1线程结束
    t2.join()  # 等待p2线程结束
    print('-------主线程结束------')

执行结果：

-------主线程开始------
g_num is 100
-------子线程1开始------
g_num is 150
-------子线程1结束------
-------子线程2开始------
g_num is 100
-------子线程2结束------
-------主线程结束------

Process finished with exit code 0

2.9 使用互斥锁

互斥锁可以防止多个线程同事读写某一块内存区域。代码如下：

from threading import Thread, Lock
import time

n = 100  # 共100张票


def task():
    global n
    mutex.acquire()  # 上锁
    temp = n  # 赋值给临时变量
    time.sleep(0.1)  # 休眠0.1秒
    n = temp - 1  # 数量减1
    print('购买成功，剩余%d张电影票' % n)
    mutex.release()  # 释放锁


if __name__ == '__main__':
    mutex = Lock()  # 实例化Lock类
    t_l = []  # 初始化一个列表
    for i in range(10):
        t = Thread(target=task)  # 实例化线程类
        t_l.append(t)  # 将线程实例存入列表中
        t.start()  # 创建线程
    for t in t_l:
        t.join()  # 等待子线程结束

执行结果：

购买成功，剩余99张电影票
购买成功，剩余98张电影票
购买成功，剩余97张电影票
购买成功，剩余96张电影票
购买成功，剩余95张电影票
购买成功，剩余94张电影票
购买成功，剩余93张电影票
购买成功，剩余92张电影票
购买成功，剩余91张电影票
购买成功，剩余90张电影票

Process finished with exit code 0

2.10 使用队列在线程间通信

进程间通信可以用multiprocessing模块的Queue队列，线程间也可以使用Queue队列实现线程间通信。使用Queue在线程间通信通常应用于生产者消费者模式。代码如下：

from queue import Queue
import random, threading, time


# 生产者类
class Producer(threading.Thread):
    def __init__(self, name, queue):
        threading.Thread.__init__(self, name=name)
        self.data = queue

    def run(self):
        for i in range(5):
            print("生成者%s将产品%d加入队列!" % (self.getName(), i))
            self.data.put(i)
            time.sleep(random.random())
        print("生成者%s完成!" % self.getName())


# 消费者类
class Consumer(threading.Thread):
    def __init__(self, name, queue):
        threading.Thread.__init__(self, name=name)
        self.data = queue

    def run(self):
        for i in range(5):
            val = self.data.get()
            print("消费者%s将产品%d从队列中取出!" % (self.getName(), val))
            time.sleep(random.random())
        print("消费者%s完成!" % self.getName())


if __name__ == '__main__':
    print('-----主线程开始-----')
    queue = Queue()  # 实例化队列
    producer = Producer('Producer', queue)  # 实例化线程Producer，并传入队列作为参数
    consumer = Consumer('Consumer', queue)  # 实例化线程Consumer，并传入队列作为参数
    producer.start()  # 启动线程Producer
    consumer.start()  # 启动线程Consumer
    producer.join()  # 等待线程Producer结束
    consumer.join()  # 等待线程Consumer结束
    print('-----主线程结束-----')

执行结果：

-----主线程开始-----
生成者Producer将产品0加入队列!
消费者Consumer将产品0从队列中取出!
生成者Producer将产品1加入队列!
消费者Consumer将产品1从队列中取出!
生成者Producer将产品2加入队列!
消费者Consumer将产品2从队列中取出!
生成者Producer将产品3加入队列!
消费者Consumer将产品3从队列中取出!
生成者Producer将产品4加入队列!
生成者Producer完成!
消费者Consumer将产品4从队列中取出!
消费者Consumer完成!
-----主线程结束-----

Process finished with exit code 0