पाइथन में कंसीडर - प्रोसेस का पूल
पूल ऑफ प्रोसेस को उसी तरह से बनाया और उपयोग किया जा सकता है, जैसा कि हमने थ्रेड्स के पूल को बनाया और इस्तेमाल किया है। प्रक्रिया पूल को पूर्व-तात्कालिक और निष्क्रिय प्रक्रियाओं के समूह के रूप में परिभाषित किया जा सकता है, जो काम देने के लिए तैयार हैं। जब हम बड़ी संख्या में कार्यों को करने की आवश्यकता होती है, तो प्रत्येक कार्य के लिए नई प्रक्रियाओं को तत्काल शुरू करने पर प्रक्रिया पूल बनाना पसंद किया जाता है।
पायथन मॉड्यूल - समवर्ती.फुट्स
पायथन मानक पुस्तकालय में एक मॉड्यूल होता है जिसे कहा जाता है concurrent.futures। डेवलपर्स को अतुल्यकालिक कार्यों को शुरू करने के लिए एक उच्च-स्तरीय इंटरफ़ेस प्रदान करने के लिए पायथन 3.2 में इस मॉड्यूल को जोड़ा गया था। यह थ्रेड या प्रक्रियाओं के पूल का उपयोग करके कार्यों को चलाने के लिए इंटरफ़ेस प्रदान करने के लिए पायथन के थ्रेडिंग और मल्टीप्रोसेसिंग मॉड्यूल के शीर्ष पर एक अमूर्त परत है।
अपने बाद के अनुभागों में, हम समवर्ती.फुट्स मॉड्यूल के विभिन्न उपवर्गों को देखेंगे।
एग्जीक्यूटिव क्लास
Executor का एक सार वर्ग है concurrent.futuresपायथन मॉड्यूल। इसे सीधे इस्तेमाल नहीं किया जा सकता है और हमें निम्नलिखित ठोस उपवर्गों में से एक का उपयोग करने की आवश्यकता है -
- ThreadPoolExecutor
- ProcessPoolExecutor
ProcessPoolExecutor - एक ठोस उपवर्ग
यह एक्ज़ीक्यूटर क्लास के ठोस उपवर्गों में से एक है। यह बहु-प्रसंस्करण का उपयोग करता है और हमें कार्यों को प्रस्तुत करने के लिए प्रक्रियाओं का एक पूल मिलता है। यह पूल उपलब्ध प्रक्रियाओं को कार्य सौंपता है और उन्हें चलाने के लिए शेड्यूल करता है।
कैसे एक ProcessPoolExecutor बनाने के लिए?
की मदद से concurrent.futures मॉड्यूल और उसके ठोस उपवर्ग Executor, हम आसानी से प्रक्रिया का एक पूल बना सकते हैं। इसके लिए, हमें निर्माण करने की आवश्यकता हैProcessPoolExecutorहम पूल में जितनी प्रक्रियाएँ चाहते हैं। डिफ़ॉल्ट रूप से, संख्या 5. यह प्रक्रिया पूल में एक कार्य सबमिट करने के बाद है।
उदाहरण
अब हम उसी उदाहरण पर विचार करेंगे जिसका उपयोग हमने थ्रेड पूल बनाते समय किया था, एकमात्र अंतर यह है कि अब हम उपयोग करेंगे ProcessPoolExecutor के बजाय ThreadPoolExecutor ।
from concurrent.futures import ProcessPoolExecutor
from time import sleep
def task(message):
sleep(2)
return message
def main():
executor = ProcessPoolExecutor(5)
future = executor.submit(task, ("Completed"))
print(future.done())
sleep(2)
print(future.done())
print(future.result())
if __name__ == '__main__':
main()
उत्पादन
False
False
Completed
उपरोक्त उदाहरण में, एक प्रक्रियाPoolExecutor5 धागे के साथ निर्माण किया गया है। फिर एक कार्य, जो संदेश देने से पहले 2 सेकंड के लिए प्रतीक्षा करेगा, प्रक्रिया पूल निष्पादक को प्रस्तुत किया जाता है। जैसा कि आउटपुट से देखा जाता है, कार्य 2 सेकंड तक पूरा नहीं होता है, इसलिए पहला कॉलdone()झूठा लौटेगा। 2 सेकंड के बाद, कार्य किया जाता है और हम कॉल करके भविष्य का परिणाम प्राप्त करते हैंresult() इस पर विधि।
इंस्टेंटिअटिंग प्रोसेसपूलएक्सक्यूटोर - प्रसंग प्रबंधक
ProcessPoolExecutor को त्वरित करने का एक और तरीका है संदर्भ प्रबंधक की मदद से। यह उपरोक्त उदाहरण में प्रयुक्त विधि के समान काम करता है। संदर्भ प्रबंधक का उपयोग करने का मुख्य लाभ यह है कि यह वाक्यात्मक रूप से अच्छा दिखता है। तत्काल कोड निम्नलिखित कोड की मदद से किया जा सकता है -
with ProcessPoolExecutor(max_workers = 5) as executor
उदाहरण
बेहतर समझ के लिए, हम उसी उदाहरण को ले रहे हैं जैसे कि थ्रेड पूल बनाते समय उपयोग किया जाता है। इस उदाहरण में, हमें आयात करके शुरू करने की आवश्यकता हैconcurrent.futuresमापांक। फिर एक समारोह का नामload_url()बनाया गया है जो अनुरोधित url को लोड करेगा। ProcessPoolExecutorइसके बाद पूल में 5 नंबरों के धागे बनाए जाते हैं। प्रक्रियाPoolExecutorसंदर्भ प्रबंधक के रूप में उपयोग किया गया है। हम भविष्य के परिणाम को कॉल करके प्राप्त कर सकते हैंresult() इस पर विधि।
import concurrent.futures
from concurrent.futures import ProcessPoolExecutor
import urllib.request
URLS = ['http://www.foxnews.com/',
'http://www.cnn.com/',
'http://europe.wsj.com/',
'http://www.bbc.co.uk/',
'http://some-made-up-domain.com/']
def load_url(url, timeout):
with urllib.request.urlopen(url, timeout = timeout) as conn:
return conn.read()
def main():
with concurrent.futures.ProcessPoolExecutor(max_workers=5) as executor:
future_to_url = {executor.submit(load_url, url, 60): url for url in URLS}
for future in concurrent.futures.as_completed(future_to_url):
url = future_to_url[future]
try:
data = future.result()
except Exception as exc:
print('%r generated an exception: %s' % (url, exc))
else:
print('%r page is %d bytes' % (url, len(data)))
if __name__ == '__main__':
main()
उत्पादन
उपरोक्त पायथन लिपि निम्न आउटपुट उत्पन्न करेगी -
'http://some-made-up-domain.com/' generated an exception: <urlopen error [Errno 11004] getaddrinfo failed>
'http://www.foxnews.com/' page is 229476 bytes
'http://www.cnn.com/' page is 165323 bytes
'http://www.bbc.co.uk/' page is 284981 bytes
'http://europe.wsj.com/' page is 967575 bytes
Executor.map () फ़ंक्शन का उपयोग
अजगर map()फ़ंक्शन का उपयोग कई कार्यों को करने के लिए व्यापक रूप से किया जाता है। ऐसा ही एक कार्य पुनरावृत्तियों के भीतर प्रत्येक तत्व के लिए एक निश्चित कार्य लागू करना है। इसी तरह, हम किसी फ़ंक्शन के लिए इट्रेटर के सभी तत्वों को मैप कर सकते हैं और इन्हें स्वतंत्र नौकरियों के रूप में सबमिट कर सकते हैंProcessPoolExecutor। इसे समझने के लिए पायथन लिपि के निम्नलिखित उदाहरण पर विचार करें।
उदाहरण
हम उसी उदाहरण पर विचार करेंगे जिसका उपयोग हमने थ्रेड पूल बनाते समय किया था Executor.map()समारोह। दिए गए उदाहरण में, मानचित्र फ़ंक्शन को लागू करने के लिए उपयोग किया जाता हैsquare() मान सरणी में प्रत्येक मान पर कार्य करें।
from concurrent.futures import ProcessPoolExecutor
from concurrent.futures import as_completed
values = [2,3,4,5]
def square(n):
return n * n
def main():
with ProcessPoolExecutor(max_workers = 3) as executor:
results = executor.map(square, values)
for result in results:
print(result)
if __name__ == '__main__':
main()
उत्पादन
उपरोक्त पायथन लिपि निम्न आउटपुट उत्पन्न करेगी
4
9
16
25
ProcessPoolExecutor और ThreadPoolExecutor का उपयोग कब करें?
अब जब हमने एक्ज़ीक्यूटर क्लासेस - थ्रेडपूल एक्ज़ीक्यूटर और प्रोसेसपूल एक्सक्यूटोर दोनों के बारे में अध्ययन किया है, तो हमें यह जानना होगा कि किस एग्ज़ॅक्टर को कब इस्तेमाल करना है। हमें CPU / बाउंड वर्कलोड के मामले में ProcessPoolExecutor और I / O- बाउंड वर्कलोड के मामले में ThreadPoolExecutor चुनने की आवश्यकता है।
अगर हम उपयोग करते हैं ProcessPoolExecutor, तब हमें जीआईएल के बारे में चिंता करने की आवश्यकता नहीं है क्योंकि यह मल्टीप्रोसेसिंग का उपयोग करता है। इसके अलावा, निष्पादन समय कम होगा जब तुलना की जाएगीThreadPoolExecution। इसे समझने के लिए निम्नलिखित पायथन लिपि उदाहरण पर विचार करें।
उदाहरण
import time
import concurrent.futures
value = [8000000, 7000000]
def counting(n):
start = time.time()
while n > 0:
n -= 1
return time.time() - start
def main():
start = time.time()
with concurrent.futures.ProcessPoolExecutor() as executor:
for number, time_taken in zip(value, executor.map(counting, value)):
print('Start: {} Time taken: {}'.format(number, time_taken))
print('Total time taken: {}'.format(time.time() - start))
if __name__ == '__main__':
main()
उत्पादन
Start: 8000000 Time taken: 1.5509998798370361
Start: 7000000 Time taken: 1.3259999752044678
Total time taken: 2.0840001106262207
Example- Python script with ThreadPoolExecutor:
import time
import concurrent.futures
value = [8000000, 7000000]
def counting(n):
start = time.time()
while n > 0:
n -= 1
return time.time() - start
def main():
start = time.time()
with concurrent.futures.ThreadPoolExecutor() as executor:
for number, time_taken in zip(value, executor.map(counting, value)):
print('Start: {} Time taken: {}'.format(number, time_taken))
print('Total time taken: {}'.format(time.time() - start))
if __name__ == '__main__':
main()
उत्पादन
Start: 8000000 Time taken: 3.8420000076293945
Start: 7000000 Time taken: 3.6010000705718994
Total time taken: 3.8480000495910645
उपरोक्त दोनों कार्यक्रमों के आउटपुट से, हम उपयोग करते समय निष्पादन समय का अंतर देख सकते हैं ProcessPoolExecutor तथा ThreadPoolExecutor।