การทำงานพร้อมกันใน Python - การประมวลผลหลายขั้นตอน

ในบทนี้เราจะเน้นไปที่การเปรียบเทียบระหว่างการประมวลผลหลายกระบวนการและมัลติเธรดมากขึ้น

การประมวลผลหลายขั้นตอน

เป็นการใช้ซีพียูตั้งแต่สองหน่วยขึ้นไปภายในระบบคอมพิวเตอร์เครื่องเดียว เป็นแนวทางที่ดีที่สุดในการใช้งานฮาร์ดแวร์ของเราอย่างเต็มศักยภาพโดยใช้คอร์ CPU เต็มจำนวนที่มีอยู่ในระบบคอมพิวเตอร์ของเรา

มัลติเธรด

เป็นความสามารถของ CPU ในการจัดการการใช้งานระบบปฏิบัติการโดยดำเนินการหลายเธรดพร้อมกัน แนวคิดหลักของมัลติเธรดคือการบรรลุความเท่าเทียมกันโดยแบ่งกระบวนการออกเป็นหลายเธรด

ตารางต่อไปนี้แสดงความแตกต่างที่สำคัญบางประการระหว่างกัน -

การประมวลผลหลายขั้นตอน การเขียนโปรแกรมหลายโปรแกรม
การประมวลผลหลายขั้นตอนหมายถึงการประมวลผลหลายกระบวนการในเวลาเดียวกันโดยซีพียูหลายตัว Multiprogramming เก็บโปรแกรมต่างๆไว้ในหน่วยความจำหลักพร้อมกันและดำเนินการพร้อมกันโดยใช้ CPU ตัวเดียว
ใช้ CPU หลายตัว ใช้ CPU ตัวเดียว
อนุญาตการประมวลผลแบบขนาน การสลับบริบทเกิดขึ้น
ใช้เวลาน้อยลงในการประมวลผลงาน ใช้เวลาในการประมวลผลงานมากขึ้น
อำนวยความสะดวกในการใช้อุปกรณ์ของระบบคอมพิวเตอร์อย่างมีประสิทธิภาพ มีประสิทธิภาพน้อยกว่าการประมวลผลหลายขั้นตอน
มักจะมีราคาแพงกว่า ระบบดังกล่าวมีราคาไม่แพง

การขจัดผลกระทบของการล็อคล่ามทั่วโลก (GIL)

ในขณะที่ทำงานกับแอปพลิเคชันพร้อมกันมีข้อ จำกัด ใน Python ที่เรียกว่า GIL (Global Interpreter Lock). GIL ไม่อนุญาตให้เราใช้ CPU หลายคอร์และด้วยเหตุนี้เราจึงสามารถพูดได้ว่าไม่มีเธรดที่แท้จริงใน Python GIL คือ mutex - การล็อกการแยกซึ่งทำให้เธรดปลอดภัย กล่าวอีกนัยหนึ่งเราสามารถพูดได้ว่า GIL ป้องกันไม่ให้หลายเธรดเรียกใช้โค้ด Python พร้อมกัน สามารถล็อคได้ทีละเธรดเท่านั้นและหากเราต้องการรันเธรดก็จะต้องได้รับการล็อกก่อน

ด้วยการใช้การประมวลผลหลายขั้นตอนเราสามารถข้ามข้อ จำกัด ที่เกิดจาก GIL ได้อย่างมีประสิทธิภาพ -

  • ด้วยการใช้การประมวลผลหลายขั้นตอนเรากำลังใช้ความสามารถของกระบวนการต่างๆและด้วยเหตุนี้เราจึงใช้หลายอินสแตนซ์ของ GIL

  • ด้วยเหตุนี้จึงไม่มีข้อ จำกัด ในการเรียกใช้ bytecode ของเธรดเดียวภายในโปรแกรมของเราในคราวเดียว

กระบวนการเริ่มต้นใน Python

สามวิธีต่อไปนี้สามารถใช้เพื่อเริ่มกระบวนการใน Python ภายในโมดูลการประมวลผลหลายตัว -

  • Fork
  • Spawn
  • Forkserver

การสร้างกระบวนการด้วย Fork

คำสั่ง Fork เป็นคำสั่งมาตรฐานที่พบใน UNIX ใช้เพื่อสร้างกระบวนการใหม่ที่เรียกว่ากระบวนการลูก กระบวนการลูกนี้ทำงานพร้อมกันกับกระบวนการที่เรียกว่ากระบวนการหลัก กระบวนการลูกเหล่านี้ยังเหมือนกับกระบวนการพาเรนต์และสืบทอดทรัพยากรทั้งหมดที่มีให้กับพาเรนต์ การเรียกระบบต่อไปนี้ถูกใช้ในขณะที่สร้างกระบวนการด้วย Fork -

  • fork()- เป็นการเรียกระบบโดยทั่วไปใช้ในเคอร์เนล ใช้เพื่อสร้างสำเนาของกระบวนการ p>

  • getpid() - การเรียกระบบนี้ส่งคืน ID กระบวนการ (PID) ของกระบวนการโทร

ตัวอย่าง

ตัวอย่างสคริปต์ Python ต่อไปนี้จะช่วยให้คุณเข้าใจวิธีการสร้างกระบวนการย่อยใหม่และรับ PID ของกระบวนการย่อยและพาเรนต์ -

import os

def child():
   n = os.fork()
   
   if n > 0:
      print("PID of Parent process is : ", os.getpid())

   else:
      print("PID of Child process is : ", os.getpid())
child()

เอาต์พุต

PID of Parent process is : 25989
PID of Child process is : 25990

การสร้างกระบวนการด้วย Spawn

Spawn หมายถึงการเริ่มต้นสิ่งใหม่ ดังนั้นการวางไข่กระบวนการหมายถึงการสร้างกระบวนการใหม่โดยกระบวนการหลัก กระบวนการพาเรนต์ดำเนินการต่อไปแบบอะซิงโครนัสหรือรอจนกว่ากระบวนการลูกจะสิ้นสุดการดำเนินการ ทำตามขั้นตอนเหล่านี้สำหรับกระบวนการวางไข่ -

  • การนำเข้าโมดูลหลายกระบวนการ

  • การสร้างกระบวนการวัตถุ

  • เริ่มต้นกิจกรรมกระบวนการโดยโทร start() วิธี.

  • รอจนกว่ากระบวนการจะเสร็จสิ้นและออกโดยการโทร join() วิธี.

ตัวอย่าง

ตัวอย่างต่อไปนี้ของสคริปต์ Python ช่วยในการวางไข่สามกระบวนการ

import multiprocessing

def spawn_process(i):
   print ('This is process: %s' %i)
   return

if __name__ == '__main__':
   Process_jobs = []
   for i in range(3):
   p = multiprocessing.Process(target = spawn_process, args = (i,))
      Process_jobs.append(p)
   p.start()
   p.join()

เอาต์พุต

This is process: 0
This is process: 1
This is process: 2

การสร้างกระบวนการด้วย Forkserver

กลไก Forkserver มีให้เฉพาะบนแพลตฟอร์ม UNIX ที่เลือกซึ่งรองรับการส่งไฟล์ตัวอธิบายผ่าน Unix Pipes พิจารณาประเด็นต่อไปนี้เพื่อทำความเข้าใจการทำงานของกลไก Forkserver -

  • เซิร์ฟเวอร์ถูกสร้างอินสแตนซ์โดยใช้กลไก Forkserver สำหรับการเริ่มกระบวนการใหม่

  • จากนั้นเซิร์ฟเวอร์รับคำสั่งและจัดการคำขอทั้งหมดสำหรับการสร้างกระบวนการใหม่

  • สำหรับการสร้างกระบวนการใหม่โปรแกรม python ของเราจะส่งคำขอไปยัง Forkserver และมันจะสร้างกระบวนการให้เรา

  • ในที่สุดเราสามารถใช้กระบวนการที่สร้างขึ้นใหม่นี้ในโปรแกรมของเรา

Daemon ประมวลผลใน Python

Python multiprocessingโมดูลช่วยให้เรามีกระบวนการ daemon ผ่านอ็อพชัน daemonic กระบวนการ Daemon หรือกระบวนการที่กำลังทำงานอยู่เบื้องหลังเป็นไปตามแนวคิดที่คล้ายกันกับเธรด daemon ในการดำเนินการกระบวนการในเบื้องหลังเราจำเป็นต้องตั้งค่าแฟล็ก daemonic เป็น true กระบวนการ daemon จะทำงานต่อไปตราบเท่าที่กระบวนการหลักกำลังดำเนินการอยู่และกระบวนการดังกล่าวจะสิ้นสุดลงหลังจากเสร็จสิ้นการดำเนินการหรือเมื่อโปรแกรมหลักถูกฆ่า

ตัวอย่าง

ที่นี่เรากำลังใช้ตัวอย่างเดียวกับที่ใช้ในเธรด daemon ข้อแตกต่างเพียงอย่างเดียวคือการเปลี่ยนโมดูลจากmultithreading ถึง multiprocessingและตั้งค่าแฟล็ก daemonic เป็น true อย่างไรก็ตามจะมีการเปลี่ยนแปลงผลลัพธ์ดังที่แสดงด้านล่าง -

import multiprocessing
import time

def nondaemonProcess():
   print("starting my Process")
   time.sleep(8)
   print("ending my Process")
def daemonProcess():
   while True:
   print("Hello")
   time.sleep(2)
if __name__ == '__main__':
   nondaemonProcess = multiprocessing.Process(target = nondaemonProcess)
   daemonProcess = multiprocessing.Process(target = daemonProcess)
   daemonProcess.daemon = True
   nondaemonProcess.daemon = False
   daemonProcess.start()
   nondaemonProcess.start()

เอาต์พุต

starting my Process
ending my Process

เอาต์พุตจะแตกต่างกันเมื่อเปรียบเทียบกับที่สร้างโดย daemon เธรดเนื่องจากกระบวนการในโหมดไม่มี daemon มีเอาต์พุต ดังนั้นกระบวนการ daemonic จะสิ้นสุดโดยอัตโนมัติหลังจากโปรแกรมหลักสิ้นสุดลงเพื่อหลีกเลี่ยงการคงอยู่ของกระบวนการที่กำลังทำงานอยู่

การยุติกระบวนการใน Python

เราสามารถฆ่าหรือยุติกระบวนการได้ทันทีโดยใช้ไฟล์ terminate()วิธี. เราจะใช้วิธีนี้เพื่อยุติกระบวนการลูกซึ่งสร้างขึ้นด้วยความช่วยเหลือของฟังก์ชันทันทีก่อนที่จะดำเนินการเสร็จสิ้น

ตัวอย่าง

import multiprocessing
import time
def Child_process():
   print ('Starting function')
   time.sleep(5)
   print ('Finished function')
P = multiprocessing.Process(target = Child_process)
P.start()
print("My Process has terminated, terminating main thread")
print("Terminating Child Process")
P.terminate()
print("Child Process successfully terminated")

เอาต์พุต

My Process has terminated, terminating main thread
Terminating Child Process
Child Process successfully terminated

ผลลัพธ์แสดงให้เห็นว่าโปรแกรมยุติก่อนการดำเนินการของกระบวนการลูกที่สร้างขึ้นด้วยความช่วยเหลือของฟังก์ชัน Child_process () นี่หมายความว่ากระบวนการย่อยสิ้นสุดลงเรียบร้อยแล้ว

การระบุกระบวนการปัจจุบันใน Python

ทุกกระบวนการในระบบปฏิบัติการมีเอกลักษณ์ของกระบวนการที่เรียกว่า PID ใน Python เราสามารถค้นหา PID ของกระบวนการปัจจุบันได้ด้วยความช่วยเหลือของคำสั่งต่อไปนี้ -

import multiprocessing
print(multiprocessing.current_process().pid)

ตัวอย่าง

ตัวอย่างต่อไปนี้ของสคริปต์ Python ช่วยค้นหา PID ของกระบวนการหลักรวมทั้ง PID ของกระบวนการลูก -

import multiprocessing
import time
def Child_process():
   print("PID of Child Process is: {}".format(multiprocessing.current_process().pid))
print("PID of Main process is: {}".format(multiprocessing.current_process().pid))
P = multiprocessing.Process(target=Child_process)
P.start()
P.join()

เอาต์พุต

PID of Main process is: 9401
PID of Child Process is: 9402

การใช้กระบวนการในคลาสย่อย

เราสามารถสร้างเธรดได้โดยการแบ่งประเภทย่อยของไฟล์ threading.Threadชั้นเรียน นอกจากนี้เรายังสามารถสร้างกระบวนการโดยการแบ่งประเภทย่อยของไฟล์multiprocessing.Processชั้นเรียน สำหรับการใช้กระบวนการในคลาสย่อยเราต้องพิจารณาประเด็นต่อไปนี้ -

  • เราจำเป็นต้องกำหนดคลาสย่อยใหม่ของ Process ชั้นเรียน

  • เราจำเป็นต้องลบล้างไฟล์ _init_(self [,args] ) ชั้นเรียน

  • เราจำเป็นต้องลบล้างไฟล์ run(self [,args] ) วิธีการดำเนินการอะไร Process

  • เราจำเป็นต้องเริ่มกระบวนการโดยเรียกใช้ไฟล์start() วิธี.

ตัวอย่าง

import multiprocessing
class MyProcess(multiprocessing.Process):
   def run(self):
   print ('called run method in process: %s' %self.name)
   return
if __name__ == '__main__':
   jobs = []
   for i in range(5):
   P = MyProcess()
   jobs.append(P)
   P.start()
   P.join()

เอาต์พุต

called run method in process: MyProcess-1
called run method in process: MyProcess-2
called run method in process: MyProcess-3
called run method in process: MyProcess-4
called run method in process: MyProcess-5

Python Multiprocessing Module - คลาสพูล

ถ้าเราพูดถึงเส้นขนานง่ายๆ processingงานในแอปพลิเคชัน Python ของเราจากนั้นโมดูลการประมวลผลหลายขั้นตอนจะมอบคลาส Pool ให้กับเรา วิธีการดังต่อไปนี้ของPool คลาสสามารถใช้เพื่อหมุนจำนวนโปรเซสลูกภายในโปรแกรมหลักของเรา

ใช้ () วิธีการ

วิธีนี้คล้ายกับไฟล์.submit()วิธีการของ .ThreadPoolExecutor.บล็อกจนกว่าผลลัพธ์จะพร้อม

apply_async () วิธีการ

เมื่อเราต้องการการดำเนินการแบบคู่ขนานกับงานของเราเราจำเป็นต้องใช้ไฟล์apply_async()วิธีการส่งงานไปยังพูล เป็นการดำเนินการแบบอะซิงโครนัสที่จะไม่ล็อกเธรดหลักจนกว่ากระบวนการย่อยทั้งหมดจะถูกดำเนินการ

map () วิธีการ

เช่นเดียวกับ apply()นอกจากนี้ยังบล็อกจนกว่าผลลัพธ์จะพร้อม เทียบเท่ากับในตัวmap() ฟังก์ชันที่แยกข้อมูลที่ทำซ้ำได้ในหลาย ๆ ส่วนและส่งไปยังกลุ่มกระบวนการเป็นงานแยกกัน

map_async () วิธีการ

มันเป็นตัวแปรของ map() วิธีการเป็น apply_async() คือไปที่ apply()วิธี. ส่งคืนวัตถุผลลัพธ์ เมื่อผลลัพธ์พร้อมแล้วจะมีการเรียกใช้กับผลลัพธ์นั้น โทรได้จะต้องเสร็จสิ้นทันที มิฉะนั้นเธรดที่จัดการผลลัพธ์จะถูกบล็อก

ตัวอย่าง

ตัวอย่างต่อไปนี้จะช่วยให้คุณใช้กลุ่มกระบวนการสำหรับการดำเนินการแบบขนาน การคำนวณกำลังสองอย่างง่ายได้ดำเนินการโดยใช้square() ฟังก์ชั่นผ่าน multiprocessing.Poolวิธี. แล้วpool.map() ถูกใช้เพื่อส่ง 5 เนื่องจากอินพุตเป็นรายการจำนวนเต็มตั้งแต่ 0 ถึง 4 ผลลัพธ์จะถูกเก็บไว้ใน p_outputs และจะพิมพ์

def square(n):
   result = n*n
   return result
if __name__ == '__main__':
   inputs = list(range(5))
   p = multiprocessing.Pool(processes = 4)
   p_outputs = pool.map(function_square, inputs)
   p.close()
   p.join()
   print ('Pool :', p_outputs)

เอาต์พุต

Pool : [0, 1, 4, 9, 16]