डाटाप्रेप - उच्चारण और विशेष वर्ण

Aug 17 2020

मैं इस समस्या का समाधान / विशेष पात्र में विशेषांक के साथ कैसे करूं? मुझे यह जानकारी दिखाई देने की आवश्यकता है।

ध्यान देने के लिये धन्यवाद।

जवाब

2 AlexandreMoraes Aug 17 2020 at 17:30

DataPrep में अंतर्निहित व्यंजन होते हैं जो आपको विशेष वर्णों को हटाने या बदलने की अनुमति देते हैं। उदाहरण के लिए, आप टेक्स्ट में हटाए गए लहजे के साथ अप्राप्य लोगों को उच्चारण पत्र बदल सकते हैं या आप किसी अन्य वर्ण के लिए गैर मान्यता प्राप्त वर्णों को प्रतिस्थापित पाठ या पैटर्न के साथ भी बदल सकते हैं ।

नीचे एक विशेष चरित्र या उच्चारण पत्र को बदलने के चरण दिए गए हैं।

  1. अपना प्रवाह बनाएं।
  2. अपना डेटा जोड़ें / आयात करें
  3. प्रलेखन के अनुसार, एक नुस्खा जोड़ें पर क्लिक करें । आपके मामले में आप निम्न में से एक या दोनों कर सकते हैं:

सबसे पहले, यदि आपके पास एक उच्चारण शब्द है, तो खोज रूपांतरण पर जाएं > पाठ में निकालें लहजे का चयन करें । फिर, कॉलम का चयन करें, जिसमें उच्चारण शब्द हैं। यह गैर-उच्चारण वाले के लिए उच्चारण शब्दों को बदल देगा। आपका डेटा आपका दिखाया गया है ताकि आप परिवर्तन की जांच कर सकें।

दूसरा, मामले में आप एक गैर मान्यता प्राप्त चरित्र है, के लिए जाने खोजें रूपांतरण > पाठ या पैटर्न बदलें> स्तंभ आप डेटा को बदलने के लिए चाहते हैं का चयन करें > के भीतर ढूँढें एकल उद्धरण के बीच पत्र / प्रतीक लिखने > में से बदले लिखने पत्र जो होगा इसके बजाय रखा जाए । अंत में, परिवर्तन देखने के लिए अपने डेटा का पूर्वावलोकन करें।

अद्यतन: मैं DataPrep में उल्लिखित वर्णों के साथ एक .csv फ़ाइल लोड करने में सक्षम था । नीचे मेरे चरण और नमूना डेटा हैं:

.Csv फ़ाइल जो मैंने उपयोग की है उसमें निम्नलिखित सामग्री थी:

Test
Non rec. char É
Non rec. char ç
Accented word não

DataPrep UI मुख पृष्ठ में, आयात डेटा (ऊपरी दाएं कोने) Google क्लाउड संग्रहण (स्क्रीन के बाएं भाग) पर क्लिक करें। फिर, आपको फ़ाइल ढूंढना और चुनना (परिक्षण के बजाय केवल एक फ़ाइल आयात करना) और ऐड ( + ) चिन्ह में क्लिक करें । इस चरण में, आप पहले से ही वर्ण देख सकते हैं, मेरे मामले में मैं उन्हें सामान्य रूप से देख सकता था। अंत में, Import & Wrangle में क्लिक करें और अपने डेटा की कल्पना करें। उपरोक्त डेटा का उपयोग करके, मैं बिना किसी समस्या के पात्रों को ठीक से देख पा रहा था।