5 Kick Ass Data Science Projects

Dec 13 2022
10x डेटा साइंटिस्ट बनें जिसकी हर कोई तलाश कर रहा है या बस एक अत्यधिक प्रभावशाली डेटा साइंस पोर्टफोलियो हो। आज हम पेशेवर कैरियर के लिए व्यावहारिक और उपयोगी अनुभव प्राप्त करने के साथ-साथ अपने दिमाग और क्षितिज को व्यापक बनाने और नवीनतम तकनीकों और भविष्य की संभावनाओं के लिए अपनी आंखें खोलने के मामले में काम करने के लिए 5 शानदार परियोजनाओं को देख रहे हैं।

10x डेटा साइंटिस्ट बनें जिसकी हर कोई तलाश कर रहा है या बस एक अत्यधिक प्रभावशाली डेटा साइंस पोर्टफोलियो हो।

आज हम पेशेवर कैरियर के लिए व्यावहारिक और उपयोगी अनुभव प्राप्त करने के साथ-साथ अपने दिमाग और क्षितिज को व्यापक बनाने और नवीनतम तकनीकों और भविष्य की संभावनाओं के लिए अपनी आंखें खोलने के मामले में काम करने के लिए 5 शानदार परियोजनाओं को देख रहे हैं।

चाहे आप डेटा साइंटिस्ट हों, जूनियर डेवलपर हों, या सिर्फ जुनूनी हॉबी प्रोग्रामर हों, जो डेटा विश्लेषण और इंजीनियरिंग में गोता लगाना पसंद करते हों, कुछ निश्चित प्रोजेक्ट हैं जो आपके डेटा साइंस पोर्टफोलियो को कई अन्य से अलग करने में मदद कर सकते हैं।

ये प्रोजेक्ट किसी भी डेटा साइंस पोर्टफोलियो के लिए बहुत अच्छे हैं। यदि आप सोच रहे हैं कि आप एक भयानक डेटा साइंस पोर्टफोलियो कैसे बना सकते हैं, तो मैं इस लेख में प्रक्रिया को स्पष्ट करता हूं:

द किलर डेटा साइंस पोर्टफोलियो जो आपको काम पर रखता है

Follow me for 5 more kick ass projects next week! 
You can also hit the message icon to get notified when I publish it.

1. फेक न्यूज का पता लगाना

एक विषय जिस पर अत्यधिक बहस जारी है, वह है नकली समाचार, डीपफेक वीडियो और अन्य समान रूप से हेरफेर की गई सामग्री का हमारे समाज पर प्रभाव। जैसा कि एलिजा शोमेकर के इस पेपर का निष्कर्ष है, फर्जी खबरों को बनने से रोकना असंभव है, लेकिन इसका पता लगाना संभव है।

आमतौर पर इन परियोजनाओं में सामग्री के विभिन्न रूपों का पता लगाने और पहचानने के लिए डिसीजन ट्री, एनएलपी, स्टॉप वर्ड, टीएफआईडीएफ, पीओएस और वीएडीईआर एल्गोरिदम का उपयोग भी शामिल है। यह कई अन्य क्षेत्रों में उपयोगी हो सकता है, जैसे अनुवाद और एआई सामग्री निर्माण, साथ ही आवाज पहचान आदि।

आपको प्रेरणा के लिए इन सार्वजनिक परियोजनाओं को भी देखना चाहिए कि उन्होंने इसे कैसे किया है।

मुझे इस परियोजना के बारे में जो पसंद है वह यह है कि उन्होंने अपने तर्क और डेटा प्रवाह को कितनी अच्छी तरह समझाया है।

2. एआई पावर्ड इंटेलिजेंट चैटबॉट

नए डेटा वैज्ञानिकों के लिए एक और आम परियोजना तथाकथित चैटबॉट है। इन परियोजनाओं में आम तौर पर प्राकृतिक भाषा प्रसंस्करण का उपयोग शामिल होता है, लेकिन एनएलयू और एनएलजी सुविधाओं के साथ-साथ मिलान पैटर्न के तरीकों का उपयोग करके भी बनाया जा सकता है।

स्क्रैच से अपना खुद का चैटबॉट बनाकर, आप संभावित नियोक्ताओं को दिखा सकते हैं कि आप पायथन की एनएलटीके लाइब्रेरी के बारे में जानते हैं, जिसका पेशेवर दुनिया में कई उद्देश्यों के लिए अत्यधिक उपयोग किया जाता है। और आपको यह दिखाने का भी मौका मिलेगा कि आप डेटा परिदृश्यों को कैसे संसाधित, परीक्षण और प्रशिक्षित करते हैं।

यहां एक सरल, अच्छी तरह से लिखी गई और समझने में आसान परियोजना है जिसे आप दोहराने और सीखने की कोशिश कर सकते हैं। जैसा कि आप इसके माध्यम से काम करते हैं, अपने स्वयं के अनुकूलन (कोड गुणवत्ता और तर्क दोनों) जोड़ना सुनिश्चित करें।

3. भाव विश्लेषण

यह परियोजना दुनिया भर के कई छात्रों और पेशेवरों के लिए एक और लोकप्रिय विकल्प है, और कई क्षेत्रों में इसका उपयोग किया जाता है। यदि आप शेयर बाजार में रुचि रखते हैं, तो आप अपनी परियोजना को कुछ स्टॉक टिकर्स के आसपास केंद्रित कर सकते हैं, और फिर भावनाओं के लिए वेब को परिमार्जन कर सकते हैं, ताकि यह पता लगाया जा सके कि किसी कंपनी को कितनी अच्छी तरह से पसंद किया गया है।

सेंटीमेंट विश्लेषण का उपयोग उत्पाद समीक्षाओं को देखने के लिए भी किया जा सकता है, ताकि सामान्य 1-5 स्टार समीक्षाओं से हटकर प्रत्येक समीक्षा के विशिष्ट विवरण पर ध्यान केंद्रित किया जा सके। इन परियोजनाओं में आम तौर पर डेटासेट या वेब स्क्रैपिंग का उपयोग शामिल होता है, लेकिन निष्कर्षण पैटर्न, एनएलपी और डेटा संरचनाएं वे तरीके हैं जिनका आप पता लगाने के लिए उपयोग करते हैं।

यहाँ दो परियोजनाएँ हैं जो मुझे पसंद हैं, विशेष रूप से क्योंकि उन्होंने कितनी अच्छी तरह से मूल बातें समझाई हैं और उस पर निर्माण किया है।

@betinacosta का हैंड्स-ऑन सेंटीमेंट एनालिसिस ट्यूटोरियल एक शानदार प्रोजेक्ट है जो आपको वास्तविक दुनिया के एप्लिकेशन (ट्विटर) से डेटा प्राप्त करने और सीखने के साथ-साथ विश्लेषण करने का अनुभव देता है ।

4. छवि वर्गीकरण

मशीन लर्निंग के उदय ने एआई के लिए एक छवि में मानवीय चेहरों का पता लगाने, पेंटिंग में सभी लाल वस्तुओं को वर्गीकृत करने और बहुत कुछ करने की क्षमता ला दी है। जबकि इस प्रकार की परियोजनाओं के लिए पेशेवर दुनिया में कई अनुप्रयोग हैं, इसे आगे बढ़ाने का एक महान व्यक्तिगत प्रयास भी है।

यहां आप डीप लर्निंग मॉडल को प्रशिक्षित करना सीखेंगे, और अपने प्रोजेक्ट के आधार पर आप अपने परिणामों को और बढ़ाने और अपने कौशल को चमकाने के लिए TensorFlow, MATLAB या RapidMiner जैसी लाइब्रेरी का उपयोग कर सकते हैं।

यह एक बहुत बड़ा क्षेत्र है और अधिकांश परियोजनाएं ऑनलाइन जीपीयू का उपयोग करती हैं। आइए ईमानदार रहें, हममें से कुछ ही लोगों के पास जीपीयू तक पहुंच है या क्लाउड वीएम पर $ खर्च करना चाहते हैं। इसलिए, मैं उन परियोजनाओं को शामिल करने की पूरी कोशिश करूंगा जिनका अनुसरण करना आसान है और जिनके लिए GPU की आवश्यकता नहीं है:

यह एक ट्यूटोरियल या हैंड्स-ऑन गाइड है जो लगभग सादे अंग्रेजी में तर्क की व्याख्या करता है:

5. डेटा आर्किटेक्चर

व्यवसायों को अपने ग्राहकों, उनके उत्पादों और उनके व्यावसायिक भागीदारों से डेटा की विशाल मात्रा को ठीक से संरचना और वर्गीकृत करने के लिए डेटा वैज्ञानिकों की आवश्यकता होती है। इस सभी डेटा को घड़ी के चारों ओर एक्सेस करने की आवश्यकता है, जबकि लागत अनुकूलित और/या प्रदर्शन अनुकूलित आर्किटेक्चर में सुरक्षित रूप से संग्रहीत भी किया गया है।

मुझे पता है, यह बहुत कुछ लगता है। लेकिन, एक पोर्टफोलियो (और आपके अनुभव के लिए) के लिए आपको डेटाबेस के साथ काम करने, डेटा को साफ करने और इसे सही प्रकारों में स्वरूपित करने आदि के लिए अपना प्यार दिखाना होगा।

मैंने यहां सर्वश्रेष्ठ 25 सार्वजनिक डेटासेट की एक सूची तैयार की है जिसका उपयोग आप डेटा आर्किटेक्चर प्रोजेक्ट के लिए उपयुक्त डेटासेट खोजने के लिए कर सकते हैं।

बोनस: 5 और किक ऐस प्रोजेक्ट!

आपके लिए अच्छी सामग्री लाने में समय लगता है! तो, कवर करने वाली 5 और किक अस परियोजनाओं की अगली किस्त के लिए मुझे फॉलो करें:

  • धोखाधड़ी का पता लगाना और रोकथाम
  • ग्राहक वरीयता भविष्यवाणी
  • डेटा संग्रह (वेब ​​स्क्रैपिंग और अधिक)
  • चिकित्सा स्थितियों का विश्लेषण
  • जंगली कैसे जाएं और कुछ परियोजनाओं को गठबंधन करें :)

हमेशा की तरह, मुझे डेटा साइंस प्रैक्टिशनर्स के लिए उपयोगी सामग्री बनाना पसंद है और आपसे सुनना अच्छा लगेगा - सकारात्मक या नकारात्मक! आप उन विषयों का सुझाव भी दे सकते हैं जिनके बारे में आप सुनना चाहते हैं।

लिंक्डइन :https://www.linkedin.com/in/vasinha