2022年 11月 3日

Python之——分布式进程

转载请注明出处:https://blog.csdn.net/l1028386804/article/details/83045503

分布式进程是指将Process进程分布到多台机器上,充分利用多台机器的性能完成复杂的任务。
分布式进程在Python中依然要用到的multiprocessing模块。multiprocessing模块不但支持多进程,其中managers子模块还支持把多进程分不到多台机器上。可以写一个服务进程作为调度者,将任务分布到其他子进程中,依靠网络通信进行管理。比如:在做爬虫程序的时候,常常会遇到这样的场景,我们想抓取某个网站的所有图片,如果使用多进程的话,一般是一个进程负责抓取图片的链接地址,将链接地址存放到Queue中,另外的进程负责从Queue中读取链接地址进行下载和存储到本地。现在把这个过程做成分布式,一台机器上的进程负责抓取链接,其他机器上的进程负责下载存储。那么,遇到的主要问题是将Queue暴露到网络中,让其他进程都可以访问,分布式进程就是将这一个过程进行了封装,我们可以将这个过程称为本地队列的网络化。

要实现上面的功能,创建分布式进程需要分为六个步骤:

  • 建立Queue队列,用来进行进行进程间的通信。服务进程创建任务队列task_queue,用来作为传递任务给任务进程的通道;服务进程创建结果队列result_queue,作为任务进程完成任务后回复服务进程的通道;在分布式多进程环境下,必须通过由Queuemanager获得的Queue接口来添加任务。
  • 把第一步中建立的队列在网络上注册,暴露给其他进程(主机),注册后获得网络队列,相当于本地队列的映像。
  • 建立一个对象(Queuemanager(BaseManager))实例manager,绑定端口和验证口令。
  • 启动第三步中建立的实例。即启动管理manager,监管信息通道。
  • 通过管理实例的方法获得通过网络访问的Queue对象,即再把网络队列实体化成可以使用的本地队列。
  • 创建任务到”本地”队列中,自动上传任务到网络队列中,分配给任务进程进行处理。

接下来通过程序实现上面的例子(Linux版本),首先编写的是服务进程。
代码如下:

  1. # -*- coding:UTF-8 -*-
  2. '''
  3. @author liuyazhuang
  4. @date 2018/10/14 10:18
  5. @description 分布式服务进程Linux版
  6. @version 1.0.0
  7. '''
  8. import random, time, Queue
  9. from multiprocessing.managers import BaseManager
  10. #第一步:建立task_queue和result_queue,用来存放任务和结果
  11. task_queue = Queue.Queue()
  12. result_queue = Queue.Queue()
  13. class Queuemanager(BaseManager):
  14. pass
  15. #第二步:把创建的两个队列注册在网络上,利用register方法,callable参数关联了Queue对象,将Queue对象在网络中暴露
  16. Queuemanager.register('get_task_queue', callable=lambda: task_queue)
  17. Queuemanager.register('get_result_queue', callable=lambda: result_queue)
  18. #第三步:绑定端口8001,设置验证口令'lyz',这个相当于对象的初始化
  19. manager = Queuemanager(address=('', 8001), authkey='lyz')
  20. #第四步:启动管理,监听信息通道
  21. manager.start()
  22. #第五步:通过管理实例的方法获得通过网络访问的Queue对象
  23. task = manager.get_task_queue()
  24. result = manager.get_result_queue()
  25. #第六步:添加任务
  26. for url in ["ImageUrl_" + i for i in range(10)]:
  27. print 'put task %s ...' % url
  28. task.put(url)
  29. #获取返回结果
  30. print 'try get result...'
  31. for i in range(10):
  32. print 'result is %s' % result.get(timeout=10)
  33. #关闭管理
  34. manager.shutdown()

服务进程已经编写完成,接下来编写任务进程,创建任务进程分为四个步骤:

  • 使用QueueManager注册用于获取Queue对象的方法名称,任务进程只能通过名称来在网络上获取Queue
  • 连接服务器,端口和验证口令注意保持与服务进程中完全一致
  • 从网络上获取Queue,进行本地化
  • 从task队列获取任务,并把结果写入result队列

代码(win/linux版本)如下:

  1. # -*- coding:UTF-8 -*-
  2. '''
  3. @author liuyazhuang
  4. @date 2018/10/14 10:44
  5. @description 分布式任务进程Win/Linux版本
  6. @version 1.0.0
  7. '''
  8. import time
  9. from multiprocessing.managers import BaseManager
  10. #创建QueueManager
  11. class QueueManager(BaseManager):
  12. pass
  13. #第一步:使用QueueManager注册用于获取Queue的方法名称
  14. QueueManager.register('get_task_queue')
  15. QueueManager.register('get_result_queue')
  16. #第二步:连接到服务器
  17. server_addr = '127.0.0.1'
  18. print 'Connect to server %s...' % server_addr
  19. #端口和验证口令注意保持与服务进程完全一致
  20. m = QueueManager(address=(server_addr, 8001), authkey='lyz')
  21. #从网络连接
  22. m.connect()
  23. #第三步:获取Queue的对象
  24. task = m.get_task_queue()
  25. result = m.get_result_queue()
  26. #第四步:从task队列获取任务,并把结果写入result队列
  27. while(not task.empty()):
  28. image_url = task.get(True, timeout = 5)
  29. print 'run task download %s...' % image_url
  30. time.sleep(1)
  31. result.put('%s------->success' % image_url)
  32. #处理结束
  33. print 'worker exit.'

由于平台的特性,创建服务进程的代码在Linux和Windows上有一些不同,创建任务进程的代码是一致的。
Windows上服务进程代码如下:

  1. # -*- coding:UTF-8 -*-
  2. '''
  3. @author liuyazhuang
  4. @date 2018/10/14 10:55
  5. @description 分布式服务进程Windows版
  6. @version 1.0.0
  7. '''
  8. import Queue
  9. from multiprocessing.managers import BaseManager
  10. from multiprocessing import freeze_support
  11. #任务个数
  12. task_num = 10
  13. #定义收发队列
  14. task_queue = Queue.Queue(task_num)
  15. result_queue = Queue.Queue(task_num)
  16. def get_task():
  17. return task_queue
  18. def get_result():
  19. return result_queue
  20. #创建QueueManager
  21. class QueueManager(BaseManager):
  22. pass
  23. def win_run():
  24. #Windows下绑定调用接口不能用lambda,所以只能先定义函数再绑定
  25. QueueManager.register('get_task_queue', callable=get_task)
  26. QueueManager.register('get_result_queue', callable=get_result)
  27. #绑定端口并设置验证口令,Windows下需要填写IP地址,Linux下不填默认为本地
  28. manager = QueueManager(address=('127.0.0.1', 8001), authkey='lyz')
  29. #启动
  30. manager.start()
  31. try:
  32. #通过网络获取任务队列和结果队列
  33. task = manager.get_task_queue()
  34. result = manager.get_result_queue()
  35. #添加任务
  36. for url in ["ImageUrl_" + str(i) for i in range(10)]:
  37. print 'put task %s ...' % url
  38. task.put(url)
  39. print 'try get result ...'
  40. for i in range(10):
  41. print 'result is %s' % result.get(timeout = 10)
  42. except:
  43. print 'Manager error'
  44. finally:
  45. #一定要关闭,否则会报管道未关闭的错误
  46. manager.shutdown
  47. if __name__ == '__main__':
  48. #Windows下多进程可能会有问题,添加这句可以缓解
  49. freeze_support()
  50. win_run()