मैकबुक एम 1 और अजगर पुस्तकालय [बंद]

Dec 02 2020

क्या नया मैकबुक एम 1 डाटा साइंस के लिए उपयुक्त है?

क्या डेटा साइंस पायथन लाइब्रेरी जैसे पांडा, सुपी, स्केलेर आदि मैकबुक एम 1 (ऐप्पल सिलिकॉन) चिप पर काम करते हैं और पिछली पीढ़ी के इंटेल आधारित मैकबुक की तुलना में कितना तेज है?

जवाब

23 jakub Dec 02 2020 at 00:43

इस GitHub रिपॉजिटरी में Python में Apple M1 चिप और डेटा साइंस के बारे में बहुत सारी उपयोगी जानकारी है https://github.com/neurolabusc/AppleSiliconForNeuroimaging। मैंने नीचे प्रतिनिधि उद्धरण शामिल किए हैं।

टीएल, डॉ

जब तक आप एक डेवलपर नहीं होते, मैं अल्पावधि में एप्पल सिलिकॉन कंप्यूटर खरीदने से वैज्ञानिकों को दृढ़ता से हतोत्साहित करता। उत्पादक कार्य को पोर्ट करने के लिए मुख्य उपकरणों की आवश्यकता होगी। लंबी अवधि में, यह वास्तुकला विज्ञान पर गहरा प्रभाव डाल सकता है। विशेष रूप से अगर Apple उन सर्वरों को विकसित करता है जो उनके सीपीयू (AWS Graviton के साथ प्रतिस्पर्धा) की उल्लेखनीय शक्ति दक्षता का दोहन करते हैं और गणना कार्यों के लिए धातु भाषा और GPU का लाभ उठाते हैं (NVidia के टेस्ला उत्पादों और CUDA भाषा के साथ प्रतिस्पर्धा)।

Apple सिलिकॉन की सीमाएँ

बुनियादी ढांचे के वैज्ञानिक इस वास्तुकला के लिए अभी तक उपलब्ध नहीं हैं। यहाँ कुछ अल्पकालिक सीमाएँ हैं:

  • लोकप्रिय आर, जूलिया और पायथन भाषाओं का उपयोग करने वाले वैज्ञानिकों को एक ओपन सोर्स फोरट्रान कंपाइलर की आवश्यकता होती है। जबकि ऐप्पल सिलिकॉन पर पायथन उपलब्ध है, वहीं नेम्पी और स्किप जैसे उपकरणों को फोरट्रान संकलन की आवश्यकता होती है। इसका एक उपाय यह है कि इंटेल पैकेजों को जोड़ने के लिए मिनीकॉन्डा की तरह एक पायथन वितरण स्थापित किया जाए और इसके पाइप इंस्टॉलर को चलाया जाए (इस रिपॉजिटरी में शामिल लिपियों के लिए सुन्न, पांड और सीबोर्न की आवश्यकता होती है)। देरी हो रही है जब कोई पहली बार इन पुस्तकालयों में से एक का आयात करता है, जबकि उनका अनुवाद किया जाता है। इसके बाद, अनुवादित पायथन पुस्तकालय अच्छी तरह से चलने लगते हैं।
  • जबकि Apple के C Clang कंपाइलर तेजी से देशी कोड तैयार करते हैं, कई वैज्ञानिक उपकरणों को gcc, golang और gFortran कंपाइलर उपलब्ध होने तक इंतजार करना होगा।
  • वर्चुअलबॉक्स, वीएमवेयर फ्यूजन, बूट कैंप और समानताएं जैसे उपकरण अभी तक एप्पल सिलिकॉन का समर्थन नहीं करते हैं। कई उपयोगकर्ता अपने मैकओएस कंप्यूटर पर विंडोज और लिनक्स कार्यक्रमों का उपयोग करने के लिए इन उपकरणों पर भरोसा करते हैं।
  • Docker Apple Silicon का समर्थन नहीं करता है। ये कंटेनर कई न्यूरोइमेजिंग टूल्स के साथ लोकप्रिय हैं।
  • कई होमब्रेव घटक एपल सिलिकॉन का समर्थन नहीं करते हैं। उपयोगकर्ताओं को अनुवादित घटकों को स्थापित करना होगा या स्रोत से समर्थित मॉड्यूल का निर्माण करना होगा।
  • MATLAB का उपयोग SPM सहित कई वैज्ञानिक उपकरणों द्वारा किया जाता है। जबकि Matlab अनुवाद में काम करता है, यह अभी तक मूल रूप से उपलब्ध नहीं है (और मेक्सिको में फ़ाइलों को पुन: संकलित करने की आवश्यकता होगी)।
  • एफएसएल और एएफएनआई अभी तक मूल रूप से इस वास्तुकला का समर्थन नहीं करते हैं। हालांकि कोड अनुवाद में काम कर सकता है, कुछ देशी उपकरण बनाने के लिए कंपाइलरों और पुस्तकालयों के अद्यतन होने की प्रतीक्षा करनी चाहिए। इसके लिए महीनों की आवश्यकता होगी।
  • वर्तमान पीढ़ी एम 1 में केवल चार उच्च प्रदर्शन कोर हैं। अधिकांश न्यूरोइमेजिंग पाइपलाइन अनुक्रमिक कार्यों को जोड़ती हैं जिन्हें केवल एक कोर (जहां एम 1 एक्सेल) के साथ-साथ समानांतर कार्यों की आवश्यकता होती है। उन समानांतर कार्यों में अधिक कोर के साथ सीपीयू का शोषण हो सकता है (जैसा कि पिगज़ और नीमथ परीक्षणों में दिखाया गया है)। ध्यान रखें कि धारावाहिक और समानांतर कोड का यह मिश्रण अतिरिक्त कोर के लिए कम रिटर्न के साथ, अमदहेल्स कानून का सामना करता है।
  • वर्तमान पीढ़ी एम 1 में अधिकतम 16 जीबी की रैम है। न्यूरोइमेजिंग डेटासेट में अक्सर बड़ी मेमोरी की मांग होती है (विशेष रूप से मल्टी-बैंड त्वरित कार्यात्मक, आराम-राज्य और प्रसार डेटासेट)।