การทำงานพร้อมกันใน Python - การประมวลผลหลายขั้นตอน
ในบทนี้เราจะเน้นไปที่การเปรียบเทียบระหว่างการประมวลผลหลายกระบวนการและมัลติเธรดมากขึ้น
การประมวลผลหลายขั้นตอน
เป็นการใช้ซีพียูตั้งแต่สองหน่วยขึ้นไปภายในระบบคอมพิวเตอร์เครื่องเดียว เป็นแนวทางที่ดีที่สุดในการใช้งานฮาร์ดแวร์ของเราอย่างเต็มศักยภาพโดยใช้คอร์ CPU เต็มจำนวนที่มีอยู่ในระบบคอมพิวเตอร์ของเรา
มัลติเธรด
เป็นความสามารถของ CPU ในการจัดการการใช้งานระบบปฏิบัติการโดยดำเนินการหลายเธรดพร้อมกัน แนวคิดหลักของมัลติเธรดคือการบรรลุความเท่าเทียมกันโดยแบ่งกระบวนการออกเป็นหลายเธรด
ตารางต่อไปนี้แสดงความแตกต่างที่สำคัญบางประการระหว่างกัน -
การประมวลผลหลายขั้นตอน | การเขียนโปรแกรมหลายโปรแกรม |
---|---|
การประมวลผลหลายขั้นตอนหมายถึงการประมวลผลหลายกระบวนการในเวลาเดียวกันโดยซีพียูหลายตัว | Multiprogramming เก็บโปรแกรมต่างๆไว้ในหน่วยความจำหลักพร้อมกันและดำเนินการพร้อมกันโดยใช้ CPU ตัวเดียว |
ใช้ CPU หลายตัว | ใช้ CPU ตัวเดียว |
อนุญาตการประมวลผลแบบขนาน | การสลับบริบทเกิดขึ้น |
ใช้เวลาน้อยลงในการประมวลผลงาน | ใช้เวลาในการประมวลผลงานมากขึ้น |
อำนวยความสะดวกในการใช้อุปกรณ์ของระบบคอมพิวเตอร์อย่างมีประสิทธิภาพ | มีประสิทธิภาพน้อยกว่าการประมวลผลหลายขั้นตอน |
มักจะมีราคาแพงกว่า | ระบบดังกล่าวมีราคาไม่แพง |
การขจัดผลกระทบของการล็อคล่ามทั่วโลก (GIL)
ในขณะที่ทำงานกับแอปพลิเคชันพร้อมกันมีข้อ จำกัด ใน Python ที่เรียกว่า GIL (Global Interpreter Lock). GIL ไม่อนุญาตให้เราใช้ CPU หลายคอร์และด้วยเหตุนี้เราจึงสามารถพูดได้ว่าไม่มีเธรดที่แท้จริงใน Python GIL คือ mutex - การล็อกการแยกซึ่งทำให้เธรดปลอดภัย กล่าวอีกนัยหนึ่งเราสามารถพูดได้ว่า GIL ป้องกันไม่ให้หลายเธรดเรียกใช้โค้ด Python พร้อมกัน สามารถล็อคได้ทีละเธรดเท่านั้นและหากเราต้องการรันเธรดก็จะต้องได้รับการล็อกก่อน
ด้วยการใช้การประมวลผลหลายขั้นตอนเราสามารถข้ามข้อ จำกัด ที่เกิดจาก GIL ได้อย่างมีประสิทธิภาพ -
ด้วยการใช้การประมวลผลหลายขั้นตอนเรากำลังใช้ความสามารถของกระบวนการต่างๆและด้วยเหตุนี้เราจึงใช้หลายอินสแตนซ์ของ GIL
ด้วยเหตุนี้จึงไม่มีข้อ จำกัด ในการเรียกใช้ bytecode ของเธรดเดียวภายในโปรแกรมของเราในคราวเดียว
กระบวนการเริ่มต้นใน Python
สามวิธีต่อไปนี้สามารถใช้เพื่อเริ่มกระบวนการใน Python ภายในโมดูลการประมวลผลหลายตัว -
- Fork
- Spawn
- Forkserver
การสร้างกระบวนการด้วย Fork
คำสั่ง Fork เป็นคำสั่งมาตรฐานที่พบใน UNIX ใช้เพื่อสร้างกระบวนการใหม่ที่เรียกว่ากระบวนการลูก กระบวนการลูกนี้ทำงานพร้อมกันกับกระบวนการที่เรียกว่ากระบวนการหลัก กระบวนการลูกเหล่านี้ยังเหมือนกับกระบวนการพาเรนต์และสืบทอดทรัพยากรทั้งหมดที่มีให้กับพาเรนต์ การเรียกระบบต่อไปนี้ถูกใช้ในขณะที่สร้างกระบวนการด้วย Fork -
fork()- เป็นการเรียกระบบโดยทั่วไปใช้ในเคอร์เนล ใช้เพื่อสร้างสำเนาของกระบวนการ p>
getpid() - การเรียกระบบนี้ส่งคืน ID กระบวนการ (PID) ของกระบวนการโทร
ตัวอย่าง
ตัวอย่างสคริปต์ Python ต่อไปนี้จะช่วยให้คุณเข้าใจวิธีการสร้างกระบวนการย่อยใหม่และรับ PID ของกระบวนการย่อยและพาเรนต์ -
import os
def child():
n = os.fork()
if n > 0:
print("PID of Parent process is : ", os.getpid())
else:
print("PID of Child process is : ", os.getpid())
child()
เอาต์พุต
PID of Parent process is : 25989
PID of Child process is : 25990
การสร้างกระบวนการด้วย Spawn
Spawn หมายถึงการเริ่มต้นสิ่งใหม่ ดังนั้นการวางไข่กระบวนการหมายถึงการสร้างกระบวนการใหม่โดยกระบวนการหลัก กระบวนการพาเรนต์ดำเนินการต่อไปแบบอะซิงโครนัสหรือรอจนกว่ากระบวนการลูกจะสิ้นสุดการดำเนินการ ทำตามขั้นตอนเหล่านี้สำหรับกระบวนการวางไข่ -
การนำเข้าโมดูลหลายกระบวนการ
การสร้างกระบวนการวัตถุ
เริ่มต้นกิจกรรมกระบวนการโดยโทร start() วิธี.
รอจนกว่ากระบวนการจะเสร็จสิ้นและออกโดยการโทร join() วิธี.
ตัวอย่าง
ตัวอย่างต่อไปนี้ของสคริปต์ Python ช่วยในการวางไข่สามกระบวนการ
import multiprocessing
def spawn_process(i):
print ('This is process: %s' %i)
return
if __name__ == '__main__':
Process_jobs = []
for i in range(3):
p = multiprocessing.Process(target = spawn_process, args = (i,))
Process_jobs.append(p)
p.start()
p.join()
เอาต์พุต
This is process: 0
This is process: 1
This is process: 2
การสร้างกระบวนการด้วย Forkserver
กลไก Forkserver มีให้เฉพาะบนแพลตฟอร์ม UNIX ที่เลือกซึ่งรองรับการส่งไฟล์ตัวอธิบายผ่าน Unix Pipes พิจารณาประเด็นต่อไปนี้เพื่อทำความเข้าใจการทำงานของกลไก Forkserver -
เซิร์ฟเวอร์ถูกสร้างอินสแตนซ์โดยใช้กลไก Forkserver สำหรับการเริ่มกระบวนการใหม่
จากนั้นเซิร์ฟเวอร์รับคำสั่งและจัดการคำขอทั้งหมดสำหรับการสร้างกระบวนการใหม่
สำหรับการสร้างกระบวนการใหม่โปรแกรม python ของเราจะส่งคำขอไปยัง Forkserver และมันจะสร้างกระบวนการให้เรา
ในที่สุดเราสามารถใช้กระบวนการที่สร้างขึ้นใหม่นี้ในโปรแกรมของเรา
Daemon ประมวลผลใน Python
Python multiprocessingโมดูลช่วยให้เรามีกระบวนการ daemon ผ่านอ็อพชัน daemonic กระบวนการ Daemon หรือกระบวนการที่กำลังทำงานอยู่เบื้องหลังเป็นไปตามแนวคิดที่คล้ายกันกับเธรด daemon ในการดำเนินการกระบวนการในเบื้องหลังเราจำเป็นต้องตั้งค่าแฟล็ก daemonic เป็น true กระบวนการ daemon จะทำงานต่อไปตราบเท่าที่กระบวนการหลักกำลังดำเนินการอยู่และกระบวนการดังกล่าวจะสิ้นสุดลงหลังจากเสร็จสิ้นการดำเนินการหรือเมื่อโปรแกรมหลักถูกฆ่า
ตัวอย่าง
ที่นี่เรากำลังใช้ตัวอย่างเดียวกับที่ใช้ในเธรด daemon ข้อแตกต่างเพียงอย่างเดียวคือการเปลี่ยนโมดูลจากmultithreading ถึง multiprocessingและตั้งค่าแฟล็ก daemonic เป็น true อย่างไรก็ตามจะมีการเปลี่ยนแปลงผลลัพธ์ดังที่แสดงด้านล่าง -
import multiprocessing
import time
def nondaemonProcess():
print("starting my Process")
time.sleep(8)
print("ending my Process")
def daemonProcess():
while True:
print("Hello")
time.sleep(2)
if __name__ == '__main__':
nondaemonProcess = multiprocessing.Process(target = nondaemonProcess)
daemonProcess = multiprocessing.Process(target = daemonProcess)
daemonProcess.daemon = True
nondaemonProcess.daemon = False
daemonProcess.start()
nondaemonProcess.start()
เอาต์พุต
starting my Process
ending my Process
เอาต์พุตจะแตกต่างกันเมื่อเปรียบเทียบกับที่สร้างโดย daemon เธรดเนื่องจากกระบวนการในโหมดไม่มี daemon มีเอาต์พุต ดังนั้นกระบวนการ daemonic จะสิ้นสุดโดยอัตโนมัติหลังจากโปรแกรมหลักสิ้นสุดลงเพื่อหลีกเลี่ยงการคงอยู่ของกระบวนการที่กำลังทำงานอยู่
การยุติกระบวนการใน Python
เราสามารถฆ่าหรือยุติกระบวนการได้ทันทีโดยใช้ไฟล์ terminate()วิธี. เราจะใช้วิธีนี้เพื่อยุติกระบวนการลูกซึ่งสร้างขึ้นด้วยความช่วยเหลือของฟังก์ชันทันทีก่อนที่จะดำเนินการเสร็จสิ้น
ตัวอย่าง
import multiprocessing
import time
def Child_process():
print ('Starting function')
time.sleep(5)
print ('Finished function')
P = multiprocessing.Process(target = Child_process)
P.start()
print("My Process has terminated, terminating main thread")
print("Terminating Child Process")
P.terminate()
print("Child Process successfully terminated")
เอาต์พุต
My Process has terminated, terminating main thread
Terminating Child Process
Child Process successfully terminated
ผลลัพธ์แสดงให้เห็นว่าโปรแกรมยุติก่อนการดำเนินการของกระบวนการลูกที่สร้างขึ้นด้วยความช่วยเหลือของฟังก์ชัน Child_process () นี่หมายความว่ากระบวนการย่อยสิ้นสุดลงเรียบร้อยแล้ว
การระบุกระบวนการปัจจุบันใน Python
ทุกกระบวนการในระบบปฏิบัติการมีเอกลักษณ์ของกระบวนการที่เรียกว่า PID ใน Python เราสามารถค้นหา PID ของกระบวนการปัจจุบันได้ด้วยความช่วยเหลือของคำสั่งต่อไปนี้ -
import multiprocessing
print(multiprocessing.current_process().pid)
ตัวอย่าง
ตัวอย่างต่อไปนี้ของสคริปต์ Python ช่วยค้นหา PID ของกระบวนการหลักรวมทั้ง PID ของกระบวนการลูก -
import multiprocessing
import time
def Child_process():
print("PID of Child Process is: {}".format(multiprocessing.current_process().pid))
print("PID of Main process is: {}".format(multiprocessing.current_process().pid))
P = multiprocessing.Process(target=Child_process)
P.start()
P.join()
เอาต์พุต
PID of Main process is: 9401
PID of Child Process is: 9402
การใช้กระบวนการในคลาสย่อย
เราสามารถสร้างเธรดได้โดยการแบ่งประเภทย่อยของไฟล์ threading.Threadชั้นเรียน นอกจากนี้เรายังสามารถสร้างกระบวนการโดยการแบ่งประเภทย่อยของไฟล์multiprocessing.Processชั้นเรียน สำหรับการใช้กระบวนการในคลาสย่อยเราต้องพิจารณาประเด็นต่อไปนี้ -
เราจำเป็นต้องกำหนดคลาสย่อยใหม่ของ Process ชั้นเรียน
เราจำเป็นต้องลบล้างไฟล์ _init_(self [,args] ) ชั้นเรียน
เราจำเป็นต้องลบล้างไฟล์ run(self [,args] ) วิธีการดำเนินการอะไร Process
เราจำเป็นต้องเริ่มกระบวนการโดยเรียกใช้ไฟล์start() วิธี.
ตัวอย่าง
import multiprocessing
class MyProcess(multiprocessing.Process):
def run(self):
print ('called run method in process: %s' %self.name)
return
if __name__ == '__main__':
jobs = []
for i in range(5):
P = MyProcess()
jobs.append(P)
P.start()
P.join()
เอาต์พุต
called run method in process: MyProcess-1
called run method in process: MyProcess-2
called run method in process: MyProcess-3
called run method in process: MyProcess-4
called run method in process: MyProcess-5
Python Multiprocessing Module - คลาสพูล
ถ้าเราพูดถึงเส้นขนานง่ายๆ processingงานในแอปพลิเคชัน Python ของเราจากนั้นโมดูลการประมวลผลหลายขั้นตอนจะมอบคลาส Pool ให้กับเรา วิธีการดังต่อไปนี้ของPool คลาสสามารถใช้เพื่อหมุนจำนวนโปรเซสลูกภายในโปรแกรมหลักของเรา
ใช้ () วิธีการ
วิธีนี้คล้ายกับไฟล์.submit()วิธีการของ .ThreadPoolExecutor.บล็อกจนกว่าผลลัพธ์จะพร้อม
apply_async () วิธีการ
เมื่อเราต้องการการดำเนินการแบบคู่ขนานกับงานของเราเราจำเป็นต้องใช้ไฟล์apply_async()วิธีการส่งงานไปยังพูล เป็นการดำเนินการแบบอะซิงโครนัสที่จะไม่ล็อกเธรดหลักจนกว่ากระบวนการย่อยทั้งหมดจะถูกดำเนินการ
map () วิธีการ
เช่นเดียวกับ apply()นอกจากนี้ยังบล็อกจนกว่าผลลัพธ์จะพร้อม เทียบเท่ากับในตัวmap() ฟังก์ชันที่แยกข้อมูลที่ทำซ้ำได้ในหลาย ๆ ส่วนและส่งไปยังกลุ่มกระบวนการเป็นงานแยกกัน
map_async () วิธีการ
มันเป็นตัวแปรของ map() วิธีการเป็น apply_async() คือไปที่ apply()วิธี. ส่งคืนวัตถุผลลัพธ์ เมื่อผลลัพธ์พร้อมแล้วจะมีการเรียกใช้กับผลลัพธ์นั้น โทรได้จะต้องเสร็จสิ้นทันที มิฉะนั้นเธรดที่จัดการผลลัพธ์จะถูกบล็อก
ตัวอย่าง
ตัวอย่างต่อไปนี้จะช่วยให้คุณใช้กลุ่มกระบวนการสำหรับการดำเนินการแบบขนาน การคำนวณกำลังสองอย่างง่ายได้ดำเนินการโดยใช้square() ฟังก์ชั่นผ่าน multiprocessing.Poolวิธี. แล้วpool.map() ถูกใช้เพื่อส่ง 5 เนื่องจากอินพุตเป็นรายการจำนวนเต็มตั้งแต่ 0 ถึง 4 ผลลัพธ์จะถูกเก็บไว้ใน p_outputs และจะพิมพ์
def square(n):
result = n*n
return result
if __name__ == '__main__':
inputs = list(range(5))
p = multiprocessing.Pool(processes = 4)
p_outputs = pool.map(function_square, inputs)
p.close()
p.join()
print ('Pool :', p_outputs)
เอาต์พุต
Pool : [0, 1, 4, 9, 16]