Metin İşlevleriyle Verileri Temizleme

Farklı kaynaklardan elde ettiğiniz verilerin çoğu analize hazır bir biçimde değildir. Bu bölümde, metin biçimindeki verilerinizi analize nasıl hazırlayacağınızı anlayacaksınız.

Başlangıçta verileri temizlemeniz gerekir. Veri temizleme, istenmeyen karakterlerin metinden kaldırılmasını içerir. Daha sonra, verileri daha fazla analiz için ihtiyacınız olan biçimde yapılandırmanız gerekir. Aynısını şu şekilde yapabilirsiniz -

  • Metin fonksiyonları ile gerekli metin kalıplarını bulmak.
  • Metinden veri değerlerini çıkarma.
  • Verileri metin işlevleriyle biçimlendirme.
  • Metin işlevleriyle veri işlemlerinin gerçekleştirilmesi.

Metinden İstenmeyen Karakterleri Kaldırma

Başka bir uygulamadan veri aktardığınızda, içinde yazdırılamayan karakterler ve / veya fazla boşluk olabilir. Fazla boşluklar şunlar olabilir -

  • önde gelen boşluklar ve / veya
  • kelimeler arasında ekstra boşluklar.

Bu tür verileri sıralar veya analiz ederseniz, hatalı sonuçlar alırsınız.

Şu örneği düşünün -

Bu, Ürün Kimliği, Ürün açıklaması ve fiyatı içeren ürün bilgilerinden elde ettiğiniz ham verilerdir. "|" Karakteri her satırdaki alanı ayırır.

Bu verileri Excel çalışma sayfasına aktardığınızda, aşağıdaki gibi görünür -

Gördüğünüz gibi, tüm veriler tek bir sütunda. Veri analizi yapmak için bu verileri yapılandırmanız gerekir. Ancak, başlangıçta verileri temizlemeniz gerekir.

Verilerde olabilecek yazdırılamayan tüm karakterleri ve fazla boşlukları kaldırmanız gerekir. Bunun için TEMİZLE işlevini ve KIRP işlevini kullanabilirsiniz.

S.No. İşlev ve Açıklama
1.

CLEAN

Yazdırılamayan tüm karakterleri metinden kaldırır

2.

TRIM

Metinden boşlukları kaldırır

  • C3 - C11 Hücrelerini seçin.
  • = TRIM (CLEAN (B3)) yazın ve ardından CTRL + Enter tuşlarına basın.

Formül, C3 - C11 hücrelerine doldurulur.

Sonuç aşağıda gösterildiği gibi olacaktır -

Metin İşlevleriyle Gerekli Metin Modellerini Bulma

Verilerinizi yapılandırmak için, Veri Değerlerini ayıklayabileceğiniz belirli Metin Modeli eşleştirmesi yapmanız gerekebilir. Bu amaç için yararlı olan bazı Metin İşlevleri şunlardır:

S.No. İşlev ve Açıklama
1.

EXACT

İki metin değerinin aynı olup olmadığını kontrol eder

2.

FIND

Bir diğerinin içindeki bir metin değerini bulur (büyük / küçük harfe duyarlı)

3.

SEARCH

Bir diğerinin içindeki bir metin değerini bulur (büyük / küçük harfe duyarlı değildir)

Metinden Veri Değerlerini Çıkarma

Aynısını yapılandırmak için gerekli verileri metinden çıkarmanız gerekir. Yukarıdaki örnekte, verileri üç sütuna (Ürün Kimliği, Ürün_Açıklaması ve Fiyat) yerleştirmeniz gerektiğini varsayalım.

Verileri aşağıdaki yollardan biriyle çıkarabilirsiniz -

  • Metni Sütunlara Dönüştürme Sihirbazı ile Veri Değerlerini Ayıklama
  • Metin İşlevleriyle Veri Değerlerini Çıkarma
  • Flash Doldurma ile Veri Değerlerini Çıkarma

Metni Sütunlara Dönüştürme Sihirbazı ile Veri Değerlerini Ayıklama

Kullanabilirsiniz Convert Text to Columns Wizard alanlarınız aşağıdaki durumlarda Veri Değerlerini Excel sütunlarına çıkarmak için -

  • Bir karakterle sınırlandırılmış veya
  • Her alan arasında boşluk bulunan sütunlar halinde hizalanmıştır.

Yukarıdaki örnekte, alanlar “|” karakteriyle sınırlandırılmıştır. Bu nedenle, kullanabilirsinizConvert Text to Columns sihirbaz.

  • Verileri seçin.

  • Değerleri aynı yere kopyalayıp yapıştırın. Aksi takdirde,Convert Text to Columns girdi olarak verinin kendisinden ziyade işlevleri alır.

  • Verileri seçin.

  • Tıklamak Text to Columns içinde Data Tools altında grup Data Şeritte Sekme.

Step 1 - Metni Sütunlara Dönüştürme Sihirbazı - Adım 1/3 görüntülenir.

  • Sınırlandırılmış'ı seçin.
  • Sonrakine tıkla.

Step 2 - Metni Sütunlara Dönüştürme Sihirbazı - Adım 2/3 görünür.

  • Altında Delimiters, seçin Other.

  • Yanındaki kutuda Other, karakteri yazın |

  • Tıklayın Next.

Step 3 - Metni Sütunlara Dönüştürme Sihirbazı - Adım 3/3 görünür.

Bu ekranda, sihirbazdaki verilerinizin her bir sütununu seçebilir ve o sütunun biçimini ayarlayabilirsiniz.

  • İçin Destination, D3 hücresini seçin.

  • Tıklayabilirsiniz Advancedve ayarla Decimal Separator ve Thousands Separator içinde Advanced Text Import Settings görünen iletişim kutusu.

  • Tıklayın Finish.

Sütunlara dönüştürülen verileriniz üç Sütunda (D, E ve F) görünür.

  • Sütun başlıklarını Ürün Kimliği, Ürün_Açıklaması ve Fiyat olarak adlandırın.

Metin İşlevleriyle Veri Değerlerini Çıkarma

Verilerinizdeki alanların bir karakterle sınırlanmadığını veya her alan arasında boşluk bulunan sütunlarda hizalanmadığını varsayın, veri değerlerini çıkarmak için metin işlevlerini kullanabilirsiniz. Alanların sınırlandırılmış olması durumunda bile, verileri çıkarmak için metin işlevlerini kullanmaya devam edebilirsiniz.

Bu amaç için yararlı olan bazı metin işlevleri şunlardır:

S.No. İşlev ve Açıklama
1.

LEFT

Bir metin değerinden en soldaki karakterleri verir

2.

RIGHT

Bir metin değerinden en sağdaki karakterleri verir

3.

MID

Bir metin dizesinden, belirttiğiniz konumdan başlayarak belirli sayıda karakter verir

4.

LEN

Bir metin dizesindeki karakter sayısını verir

Ayrıca gerekli veri değerlerini çıkarmak için elinizdeki verilere göre bu metin işlevlerinden iki veya daha fazlasını birleştirebilirsiniz. Örneğin, SOL, SAĞ ve DEĞER işlevlerinin bir kombinasyonunu kullanmak veya BUL, SOL, UZUNLUK ve ORTA işlevlerinin bir kombinasyonunu kullanmak.

Yukarıdaki örnekte,

  • İlkine kalan tüm karakterler | ProductID adını verin.

  • İkinciye doğru tüm karakterler | Fiyat adını verin.

  • İlk arasında kalan tüm karakterler | ve ikinci | Product_Description adını verin.

  • Her biri | öncesi ve sonrası boşluk var.

Bu bilgileri gözlemleyerek veri değerlerini aşağıdaki adımlarla çıkarabilirsiniz -

  • İlk Pozisyonu Bulun | -First | Position

    • BUL işlevini kullanabilirsiniz

  • İkinci Pozisyonu Bulun | -Second | Position

    • BUL işlevini tekrar kullanabilirsiniz

  • Başlamak (First | Position - 2) Metnin karakterleri ProductID'yi verir

    • SOL İşlevini kullanabilirsiniz

  • (First | Position + 2) ile (Second | Position - 2) Metnin karakterleri Product_Description verir

    • MID İşlevini kullanabilirsiniz

  • (Second | Position + 2) Metnin Son Karakterlerine Fiyat Verir

    • SAĞ İşlevini kullanabilirsiniz

Sonuç aşağıda gösterildiği gibi olacaktır -

Fiyat sütunundaki değerlerin metin değerleri olduğunu gözlemleyebilirsiniz. Bu değerler üzerinde hesaplamalar yapmak için ilgili hücreleri biçimlendirmeniz gerekir. Metni biçimlendirmeyi anlamak için aşağıda verilen bölüme bakabilirsiniz.

Flash Doldurma ile Veri Değerlerini Çıkarma

Excel kullanarak Flash Fillmetinden veri değerlerini çıkarmanın başka bir yoludur. Ancak, bu yalnızca Excel verilerde bir model bulabildiğinde çalışır.

Step 1 - Verilerin yanında Ürün Kimliği, Ürün_Açıklaması ve Fiyat için üç sütun oluşturun.

Step 2 - B3'ten C3, D3 ve E3 değerlerini kopyalayıp yapıştırın.

Step 3 - C3 hücresini seçin ve tıklayın Flash Fill içinde Data Tools grup Datasekmesi. ProductID için tüm değerler doldurulur.

Step 4- Ürün_Açıklaması ve Fiyat için yukarıda verilen adımları tekrarlayın. Veriler doldurulur.

Metin İşlevleriyle Verileri Biçimlendirme

Excel, metin içeren verileri biçimlendirmek için kullanabileceğiniz birkaç yerleşik metin işlevine sahiptir. Bunlar arasında -

Functions that format the Text as per your need -

S.No. İşlev ve Açıklama
1.

LOWER

Metni küçük harfe dönüştürür

S.No. İşlev ve Açıklama
1.

UPPER

Metni büyük harfe dönüştürür

2.

PROPER

Bir metin değerinin her bir kelimesinin ilk harfini büyük yapar

Functions that convert and/or format the Numbers as Text -

S.No. İşlev ve Açıklama
1.

DOLLAR

$ (Dolar) para birimi biçimini kullanarak bir sayıyı metne dönüştürür

2.

FIXED

Bir sayıyı, sabit sayıda ondalıklı metin olarak biçimlendirir

3.

TEXT

Bir sayıyı biçimlendirir ve metne dönüştürür

Functions that convert the Text to Numbers -

S.No. İşlev ve Açıklama
1.

VALUE

Metin bağımsız değişkenini sayıya dönüştürür

Executing Data Operations with the Text Functions

Verileriniz üzerinde belirli Metin İşlemlerini gerçekleştirmeniz gerekebilir. Örneğin, Çalışanlar için Oturum Açma Kimlikleri, Biçim Değişikliğine bağlı olarak bir Kuruluşta Yeni Biçime değiştirilirse, Metin Değiştirmelerinin yapılması gerekebilir.

Aşağıdaki Metin İşlevleri, Metin içeren verileriniz üzerinde Metin İşlemleri gerçekleştirmenize yardımcı olur -

S.No. İşlev ve Açıklama
1.

REPLACE

Metin içindeki karakterleri değiştirir

2.

SUBSTITUTE

Bir metin dizesindeki eski metnin yerine yeni metni koyar

3.

CONCATENATE

Birkaç metin öğesini tek bir metin öğesi olarak birleştirir

4.

CONCAT

Birden çok aralık ve / veya dizeden gelen metni birleştirir, ancak sınırlayıcı veya Boşluğu Yoksay bağımsız değişkenleri sağlamaz.

5.

TEXTJOIN

Birden çok aralıktan ve / veya dizeden gelen metni birleştirir ve birleştirilecek her metin değeri arasında belirlediğiniz bir sınırlayıcı içerir. Sınırlayıcı boş bir metin dizesi ise, bu işlev aralıkları etkili bir şekilde birleştirecektir.

6.

REPT

Metni belirli sayıda yineler