पाइथन में कंसीडर - मल्टीप्रोसेसिंग
इस अध्याय में, हम मल्टीप्रोसेसिंग और मल्टीथ्रेडिंग के बीच तुलना पर अधिक ध्यान केंद्रित करेंगे।
बहु
यह एक एकल कंप्यूटर प्रणाली के भीतर दो या अधिक CPU इकाइयों का उपयोग है। हमारे कंप्यूटर सिस्टम में उपलब्ध CPU कोर की पूरी संख्या का उपयोग करके हमारे हार्डवेयर से पूरी क्षमता प्राप्त करना सबसे अच्छा तरीका है।
बहु सूत्रण
यह एक सीपीयू की क्षमता है जो कई थ्रेड्स को समवर्ती रूप से निष्पादित करके ऑपरेटिंग सिस्टम के उपयोग का प्रबंधन करता है। मल्टीथ्रेडिंग का मुख्य विचार एक प्रक्रिया को कई थ्रेड में विभाजित करके समानता प्राप्त करना है।
निम्न तालिका उनके बीच कुछ महत्वपूर्ण अंतर दिखाती है -
बहु | बहु क्रमादेशन |
---|---|
मल्टीप्रोसेसिंग एक ही समय में कई सीपीयू द्वारा कई प्रक्रियाओं के प्रसंस्करण को संदर्भित करता है। | मल्टीप्रोग्रामिंग एक ही समय में कई कार्यक्रमों को मुख्य मेमोरी में रखता है और एकल सीपीयू का उपयोग करते हुए समवर्ती रूप से निष्पादित करता है। |
यह कई सीपीयू का उपयोग करता है। | यह सिंगल सीपीयू का उपयोग करता है। |
यह समानांतर प्रसंस्करण की अनुमति देता है। | प्रसंग स्विचिंग जगह लेता है। |
नौकरियों को संसाधित करने में कम समय। | नौकरियों को संसाधित करने में अधिक समय। |
यह कंप्यूटर प्रणाली के उपकरणों के बहुत कुशल उपयोग की सुविधा देता है। | मल्टीप्रोसेसिंग की तुलना में कम कुशल। |
आमतौर पर अधिक महंगा है। | इस तरह के सिस्टम कम खर्चीले हैं। |
वैश्विक दुभाषिया लॉक (GIL) के प्रभाव को खत्म करना
समवर्ती अनुप्रयोगों के साथ काम करते समय, पायथन में मौजूद एक सीमा होती है जिसे कहा जाता है GIL (Global Interpreter Lock)। जीआईएल हमें सीपीयू के कई कोर का उपयोग करने की अनुमति नहीं देता है और इसलिए हम कह सकते हैं कि पायथन में कोई सच्चे धागे नहीं हैं। जीआईएल म्यूटेक्स - म्यूचुअल एक्सक्लूजन लॉक है, जो चीजों को सुरक्षित रखता है। दूसरे शब्दों में, हम कह सकते हैं कि जीआईएल कई धागों को समानांतर में पायथन कोड को निष्पादित करने से रोकता है। ताला को एक समय में केवल एक धागे से रखा जा सकता है और अगर हम किसी धागे को निष्पादित करना चाहते हैं तो उसे पहले ताला प्राप्त करना होगा।
मल्टीप्रोसेसिंग के उपयोग के साथ, हम GIL की वजह से होने वाली सीमा को प्रभावी ढंग से बायपास कर सकते हैं -
मल्टीप्रोसेसिंग का उपयोग करके, हम कई प्रक्रियाओं की क्षमता का उपयोग कर रहे हैं और इसलिए हम GIL के कई उदाहरणों का उपयोग कर रहे हैं।
इसके कारण, किसी भी समय हमारे कार्यक्रमों के भीतर एक धागे के बाइटकोड को निष्पादित करने का कोई प्रतिबंध नहीं है।
पायथन में प्रक्रियाएं शुरू करना
मल्टीप्रोसेसिंग मॉड्यूल के भीतर पायथन में एक प्रक्रिया शुरू करने के लिए निम्नलिखित तीन विधियों का उपयोग किया जा सकता है -
- Fork
- Spawn
- Forkserver
फोर्क के साथ एक प्रक्रिया बनाना
फोर्क कमांड UNIX में पाया जाने वाला एक मानक कमांड है। इसका उपयोग बाल प्रक्रिया नामक नई प्रक्रियाओं को बनाने के लिए किया जाता है। यह बच्चे की प्रक्रिया समवर्ती प्रक्रिया के साथ चलती है जिसे मूल प्रक्रिया कहा जाता है। ये बच्चे प्रक्रियाएं अपनी मूल प्रक्रियाओं के समान होती हैं और माता-पिता के लिए उपलब्ध सभी संसाधनों को प्राप्त करती हैं। फोर्क के साथ एक प्रक्रिया बनाते समय निम्नलिखित सिस्टम कॉल का उपयोग किया जाता है -
fork()- यह एक सिस्टम कॉल है जिसे आम तौर पर कर्नेल में लागू किया जाता है। इसका उपयोग प्रक्रिया की एक प्रति बनाने के लिए किया जाता है। p>
getpid() - यह सिस्टम कॉल कॉलिंग प्रक्रिया की प्रक्रिया आईडी (पीआईडी) लौटाता है।
उदाहरण
निम्नलिखित पायथन लिपि का उदाहरण आपको समझने में मदद करेगा कि एक नई बाल प्रक्रिया कैसे बनाई जाए और बच्चे और माता-पिता की प्रक्रिया के पीआईडी प्राप्त करें।
import os
def child():
n = os.fork()
if n > 0:
print("PID of Parent process is : ", os.getpid())
else:
print("PID of Child process is : ", os.getpid())
child()
उत्पादन
PID of Parent process is : 25989
PID of Child process is : 25990
स्पॉन के साथ एक प्रक्रिया बनाना
स्पॉन का मतलब कुछ नया शुरू करना है। इसलिए, एक प्रक्रिया को जन्म देने का अर्थ है एक मूल प्रक्रिया द्वारा एक नई प्रक्रिया का निर्माण। मूल प्रक्रिया अपने निष्पादन को अतुल्यकालिक रूप से जारी रखती है या तब तक इंतजार करती है जब तक कि बच्चे की प्रक्रिया उसके निष्पादन को समाप्त नहीं कर देती। एक प्रक्रिया पैदा करने के लिए इन चरणों का पालन करें -
मल्टीप्रोसेसिंग मॉड्यूल आयात करना।
वस्तु प्रक्रिया बनाना।
कॉल करके प्रक्रिया गतिविधि शुरू करना start() तरीका।
तब तक प्रतीक्षा की जाती है जब तक कि प्रक्रिया ने अपना काम पूरा नहीं कर लिया हो और कॉल करके बाहर न निकल जाए join() तरीका।
उदाहरण
पायथन लिपि का निम्नलिखित उदाहरण तीन प्रक्रियाओं को पैदा करने में मदद करता है
import multiprocessing
def spawn_process(i):
print ('This is process: %s' %i)
return
if __name__ == '__main__':
Process_jobs = []
for i in range(3):
p = multiprocessing.Process(target = spawn_process, args = (i,))
Process_jobs.append(p)
p.start()
p.join()
उत्पादन
This is process: 0
This is process: 1
This is process: 2
Forkserver के साथ एक प्रक्रिया बनाना
Forkserver तंत्र केवल उन चयनित UNIX प्लेटफ़ॉर्म पर उपलब्ध है जो Unix पाइप्स पर फ़ाइल डिस्क्रिप्टर को पास करने में सहायता करते हैं। Forkserver तंत्र के कार्य को समझने के लिए निम्नलिखित बिंदुओं पर विचार करें -
नई प्रक्रिया शुरू करने के लिए Forkserver तंत्र का उपयोग करने पर एक सर्वर को त्वरित किया जाता है।
सर्वर तब कमांड प्राप्त करता है और नई प्रक्रियाओं को बनाने के लिए सभी अनुरोधों को संभालता है।
एक नई प्रक्रिया बनाने के लिए, हमारा अजगर कार्यक्रम फोर्स्कवर को एक अनुरोध भेजेगा और यह हमारे लिए एक प्रक्रिया तैयार करेगा।
अंत में, हम अपने कार्यक्रमों में इस नई बनाई गई प्रक्रिया का उपयोग कर सकते हैं।
पायथन में डेमन प्रक्रियाएं
अजगर multiprocessingमॉड्यूल हमें इसके डेमोनिक विकल्प के माध्यम से डेमॉन प्रक्रियाएं करने की अनुमति देता है। डेमन प्रक्रियाएं या पृष्ठभूमि में चल रही प्रक्रियाएं डेमन थ्रेड्स के समान अवधारणा का पालन करती हैं। पृष्ठभूमि में प्रक्रिया को निष्पादित करने के लिए, हमें डेमोनिक ध्वज को सही पर सेट करने की आवश्यकता है। डेमॉन प्रक्रिया तब तक चलती रहेगी जब तक कि मुख्य प्रक्रिया निष्पादित हो रही है और यह तब तक समाप्त हो जाएगी जब उसका निष्पादन समाप्त हो जाएगा या जब मुख्य कार्यक्रम को मार दिया जाएगा।
उदाहरण
यहां, हम उसी उदाहरण का उपयोग कर रहे हैं जैसा कि डेमन थ्रेड्स में उपयोग किया जाता है। एकमात्र अंतर मॉड्यूल के परिवर्तन से हैmultithreading सेवा multiprocessingऔर डेमोनिक झंडे को सच करना। हालाँकि, आउटपुट में बदलाव होगा जैसा कि नीचे दिखाया गया है -
import multiprocessing
import time
def nondaemonProcess():
print("starting my Process")
time.sleep(8)
print("ending my Process")
def daemonProcess():
while True:
print("Hello")
time.sleep(2)
if __name__ == '__main__':
nondaemonProcess = multiprocessing.Process(target = nondaemonProcess)
daemonProcess = multiprocessing.Process(target = daemonProcess)
daemonProcess.daemon = True
nondaemonProcess.daemon = False
daemonProcess.start()
nondaemonProcess.start()
उत्पादन
starting my Process
ending my Process
डेमन थ्रेड्स द्वारा उत्पन्न एक की तुलना में आउटपुट अलग है, क्योंकि नो डेमन मोड में प्रक्रिया का आउटपुट होता है। इसलिए, मुख्य प्रक्रियाओं के चलने की प्रक्रियाओं की दृढ़ता से बचने के लिए डेमोनिक प्रक्रिया स्वतः समाप्त हो जाती है।
पायथन में प्रक्रियाओं को समाप्त करना
हम किसी प्रक्रिया का उपयोग करके तुरंत उसे मार सकते हैं या समाप्त कर सकते हैं terminate()तरीका। हम इस पद्धति का उपयोग बच्चे की प्रक्रिया को समाप्त करने के लिए करेंगे, जो कि इसके निष्पादन को पूरा करने से ठीक पहले फ़ंक्शन की मदद से बनाया गया है।
उदाहरण
import multiprocessing
import time
def Child_process():
print ('Starting function')
time.sleep(5)
print ('Finished function')
P = multiprocessing.Process(target = Child_process)
P.start()
print("My Process has terminated, terminating main thread")
print("Terminating Child Process")
P.terminate()
print("Child Process successfully terminated")
उत्पादन
My Process has terminated, terminating main thread
Terminating Child Process
Child Process successfully terminated
आउटपुट दिखाता है कि प्रोग्राम चाइल्ड प्रोसेस के निष्पादन से पहले समाप्त हो जाता है जिसे चाइल्डप्रोसेस () फ़ंक्शन की सहायता से बनाया गया है। इसका तात्पर्य यह है कि बच्चे की प्रक्रिया को सफलतापूर्वक समाप्त कर दिया गया है।
पायथन में वर्तमान प्रक्रिया की पहचान करना
ऑपरेटिंग सिस्टम की प्रत्येक प्रक्रिया में PID के रूप में ज्ञात प्रक्रिया पहचान है। पायथन में, हम निम्नलिखित कमांड की मदद से वर्तमान प्रक्रिया के पीआईडी का पता लगा सकते हैं -
import multiprocessing
print(multiprocessing.current_process().pid)
उदाहरण
पायथन लिपि का निम्नलिखित उदाहरण मुख्य प्रक्रिया के पीआईडी के साथ-साथ बाल प्रक्रिया के पीआईडी का पता लगाने में मदद करता है -
import multiprocessing
import time
def Child_process():
print("PID of Child Process is: {}".format(multiprocessing.current_process().pid))
print("PID of Main process is: {}".format(multiprocessing.current_process().pid))
P = multiprocessing.Process(target=Child_process)
P.start()
P.join()
उत्पादन
PID of Main process is: 9401
PID of Child Process is: 9402
उपवर्ग में एक प्रक्रिया का उपयोग करना
हम उप-वर्गीकृत करके धागे बना सकते हैं threading.Threadकक्षा। इसके अतिरिक्त, हम सब-क्लासिंग करके भी प्रक्रियाएँ बना सकते हैंmultiprocessing.Processकक्षा। उपवर्ग में एक प्रक्रिया का उपयोग करने के लिए, हमें निम्नलिखित बिंदुओं पर विचार करने की आवश्यकता है -
हमें एक नए उपवर्ग को परिभाषित करने की आवश्यकता है Process कक्षा।
हमें इससे आगे निकलने की जरूरत है _init_(self [,args] ) कक्षा।
हमें ओवरराइड करने की जरूरत है run(self [,args] ) क्या लागू करने के लिए विधि Process
हमें इनवाइट करके प्रक्रिया शुरू करने की जरूरत हैstart() तरीका।
उदाहरण
import multiprocessing
class MyProcess(multiprocessing.Process):
def run(self):
print ('called run method in process: %s' %self.name)
return
if __name__ == '__main__':
jobs = []
for i in range(5):
P = MyProcess()
jobs.append(P)
P.start()
P.join()
उत्पादन
called run method in process: MyProcess-1
called run method in process: MyProcess-2
called run method in process: MyProcess-3
called run method in process: MyProcess-4
called run method in process: MyProcess-5
पायथन मल्टीप्रोसेसिंग मॉड्यूल - पूल क्लास
अगर हम साधारण समानांतर की बात करें processingहमारे पायथन अनुप्रयोगों में कार्य, फिर मल्टीप्रोसेसिंग मॉड्यूल हमें पूल वर्ग प्रदान करते हैं। के निम्नलिखित तरीकेPool कक्षा का उपयोग हमारे मुख्य कार्यक्रम के भीतर कई बाल प्रक्रियाओं को स्पिन करने के लिए किया जा सकता है
लागू () विधि
यह विधि के समान है.submit()उसकि विधि .ThreadPoolExecutor.यह परिणाम तैयार होने तक अवरुद्ध रहता है।
apply_async () विधि
जब हमें अपने कार्यों के समानांतर निष्पादन की आवश्यकता होती है तो हमें इसका उपयोग करने की आवश्यकता होती हैapply_async()पूल में कार्य प्रस्तुत करने की विधि। यह एक अतुल्यकालिक ऑपरेशन है जो मुख्य थ्रेड को तब तक लॉक नहीं करेगा जब तक कि सभी बच्चे प्रक्रियाओं को निष्पादित नहीं करते।
नक्शा () विधि
ठीक वैसे ही apply()विधि, यह परिणाम तैयार होने तक भी रोकती है। यह बिल्ट-इन के बराबर हैmap() फ़ंक्शन जो विभिन्न डेटा को विभिन्न कार्यों के रूप में प्रक्रिया पूल में पुनरावृत्त डेटा को विभाजित करता है और सबमिट करता है।
map_async () विधि
यह इसका एक प्रकार है map() विधि के रूप में apply_async() को है apply()तरीका। यह एक परिणाम वस्तु देता है। जब परिणाम तैयार हो जाता है, तो उस पर एक कॉल करने योग्य लागू होता है। कॉल करने योग्य को तुरंत पूरा किया जाना चाहिए; अन्यथा, परिणाम को संभालने वाला धागा अवरुद्ध हो जाएगा।
उदाहरण
निम्नलिखित उदाहरण आपको समानांतर निष्पादन करने के लिए एक प्रक्रिया पूल को लागू करने में मदद करेगा। संख्या के वर्ग की एक सरल गणना को लागू करके किया गया हैsquare() के माध्यम से कार्य करते हैं multiprocessing.Poolतरीका। फिरpool.map() 5 को सबमिट करने के लिए उपयोग किया गया है, क्योंकि इनपुट 0 से 4 तक पूर्णांकों की एक सूची है। परिणाम में संग्रहीत किया जाएगा p_outputs और यह छपा है।
def square(n):
result = n*n
return result
if __name__ == '__main__':
inputs = list(range(5))
p = multiprocessing.Pool(processes = 4)
p_outputs = pool.map(function_square, inputs)
p.close()
p.join()
print ('Pool :', p_outputs)
उत्पादन
Pool : [0, 1, 4, 9, 16]