专栏名称: 编程派
Python程序员都在看的公众号,跟着编程派一起学习Python,看最新国外教程和资源!
目录
相关文章推荐
51好读  ›  专栏  ›  编程派

用Python多线程实现生产者消费者模式

编程派  · 公众号  · Python  · 2017-04-12 11:32

正文

原文: https://segmentfault.com/a/1190000008909344

作者:老鹰

全文约 4379 字,读完可能需要 6 分钟。

什么是生产者消费者模式

在软件开发的过程中,经常碰到这样的场景: 某些模块负责生产数据,这些数据由其他模块来负责处理(此处的模块可能是:函数、线程、进程等)。产生数据的模块称为生产者,而处理数据的模块称为消费者。在生产者与消费者之间的缓冲区称之为仓库。生产者负责往仓库运输商品,而消费者负责从仓库里取出商品,这就构成了生产者消费者模式。

结构图如下

为了大家容易理解,我们举一个寄信的例子。假设你要寄一封信,大致过程如下:

1、你把信写好----相当于生产者生产数据

2、你把信放入邮箱----相当于生产者把数据放入缓冲区

3、邮递员把信从邮箱取出,做相应处理----相当于消费者把数据取出缓冲区,处理数据

生产者消费者模式的优点

  • 解耦

假设生产者和消费者分别是两个线程。如果让生产者直接调用消费者的某个方法,那么生产者对于消费者就会产生依赖(也就是耦合)。如果未来消费者的代码发生变化,可能会影响到生产者的代码。而如果两者都依赖于某个缓冲区,两者之间不直接依赖,耦合也就相应降低了。

举个例子,我们去邮局投递信件,如果不使用邮箱(也就是缓冲区),你必须得把信直接交给邮递员。有同学会说,直接给邮递员不是挺简单的嘛?其实不简单,你必须得认识谁是邮递员,才能把信给他。这就产生了你和邮递员之间的依赖(相当于生产者和消费者的强耦合)。万一哪天邮递员换人了,你还要重新认识一下(相当于消费者变化导致修改生产者代码)。而邮箱相对来说比较固定,你依赖它的成本就比较低(相当于和缓冲区之间的弱耦合)。


  • 并发

由于生产者与消费者是两个独立的并发体,他们之间是用缓冲区通信的,生产者只需要往缓冲区里丢数据,就可以继续生产下一个数据,而消费者只需要从缓冲区拿数据即可,这样就不会因为彼此的处理速度而发生阻塞。

继续上面的例子,如果我们不使用邮箱,就得在邮局等邮递员,直到他回来,把信件交给他,这期间我们啥事儿都不能干(也就是生产者阻塞)。或者邮递员得挨家挨户问,谁要寄信(相当于消费者轮询)。


  • 支持忙闲不均



    当生产者制造数据快的时候,消费者来不及处理,未处理的数据可以暂时存在缓冲区中,慢慢处理掉。而不至于因为消费者的性能造成数据丢失或影响生产者生产。


我们再拿寄信的例子,假设邮递员一次只能带走1000封信,万一碰上情人节(或是圣诞节)送贺卡,需要寄出去的信超过了1000封,这时候邮箱这个缓冲区就派上用场了。邮递员把来不及带走的信暂存在邮箱中,等下次过来时再拿走。

通过上面的介绍大家应该已经明白了生产者消费者模式。

Python中的多线程编程

在实现生产者消费者模式之前,我们先学习下Python中的多线程编程。 线程是操作系统直接支持的执行单元,高级语言通常都内置多线程的支持,Python也不例外,并且Python的线程是真正的Posix Thread,而不是模拟出来的线程。 Python的标准库提供了两个模块: thread和threading, thread是低级模块,threading是高级模块,对_thread进行了封装。绝大多数情况下,我们只需要使用threading这个高级模块。

下面我们先看一段在Python中实现多线程的代码。

  1. import time,threading

  2. #线程代码

  3. class TaskThread(threading.Thread):

  4.    def __init__(self,name):

  5.        threading.Thread.__init__(self,name=name)

  6.    def run(self):

  7.        print('thread %s is running...' % self.getName())

  8.        for i in range(6):

  9.            print('thread %s >>> %s' % (self.getName(), i))

  10.            time .sleep(1)

  11.        print('thread %s finished.' % self.getName())

  12. taskthread = TaskThread('TaskThread')

  13. taskthread.start()

  14. taskthread.join()

下面是程序的执行结果:

  1. thread TaskThread is running...

  2. thread TaskThread >>> 0

  3. thread TaskThread >>> 1

  4. thread TaskThread >>> 2

  5. thread TaskThread >>> 3

  6. thread TaskThread >>> 4

  7. thread TaskThread >>> 5

  8. thread TaskThread finished.

TaskThread类继承自threading模块中的Thread线程类。构造函数的name参数指定线程的名字,通过重载基类run函数实现具体任务。

在简单熟悉了Python的线程后,下面我们实现一个生产者消费者模shi。

  1. from Queue import Queue

  2. import random,threading,time

  3. #生产者类

  4. class Producer(threading.Thread):

  5.    def __init__(self, name,queue):

  6.        threading.Thread.__init__(self, name=name)

  7.        self.data=queue

  8.    def run(self):

  9.        for i in range(5):

  10.            







请到「今天看啥」查看全文


推荐文章
乐趣微生活  ·  史上最搞笑女护士,笑岔气!【NO2】
8 年前
普象工业设计小站  ·  【时尚】2017春夏十大流行色来了!
8 年前