การทำความสะอาดข้อมูลด้วยฟังก์ชันข้อความ

ข้อมูลที่คุณได้รับจากแหล่งต่างๆจำนวนมากไม่อยู่ในรูปแบบที่พร้อมสำหรับการวิเคราะห์ ในบทนี้คุณจะเข้าใจวิธีการเตรียมข้อมูลของคุณที่อยู่ในรูปแบบของข้อความสำหรับการวิเคราะห์

ในขั้นต้นคุณต้องล้างข้อมูล การล้างข้อมูลรวมถึงการลบอักขระที่ไม่ต้องการออกจากข้อความ ถัดไปคุณต้องจัดโครงสร้างข้อมูลในรูปแบบที่คุณต้องการสำหรับการวิเคราะห์เพิ่มเติม คุณสามารถทำได้โดย -

  • การค้นหารูปแบบข้อความที่ต้องการด้วยฟังก์ชันข้อความ
  • การแยกค่าข้อมูลจากข้อความ
  • การจัดรูปแบบข้อมูลด้วยฟังก์ชันข้อความ
  • การดำเนินการกับข้อมูลด้วยฟังก์ชันข้อความ

การลบอักขระที่ไม่ต้องการออกจากข้อความ

เมื่อคุณนำเข้าข้อมูลจากแอปพลิเคชันอื่นข้อมูลอาจมีอักขระที่พิมพ์ไม่ได้และ / หรือช่องว่างส่วนเกิน ช่องว่างส่วนเกินสามารถ -

  • ช่องว่างชั้นนำและ / หรือ
  • ช่องว่างพิเศษระหว่างคำ

หากคุณจัดเรียงหรือวิเคราะห์ข้อมูลดังกล่าวคุณจะได้ผลลัพธ์ที่ผิดพลาด

ลองพิจารณาตัวอย่างต่อไปนี้ -

นี่คือข้อมูลดิบที่คุณได้รับจากข้อมูลผลิตภัณฑ์ที่มีรหัสผลิตภัณฑ์คำอธิบายผลิตภัณฑ์และราคา อักขระ“ |” แยกเขตข้อมูลในแต่ละแถว

เมื่อคุณนำเข้าข้อมูลนี้ลงในแผ่นงาน Excel จะมีลักษณะดังนี้ -

ดังที่คุณสังเกตข้อมูลทั้งหมดอยู่ในคอลัมน์เดียว คุณต้องจัดโครงสร้างข้อมูลนี้เพื่อทำการวิเคราะห์ข้อมูล อย่างไรก็ตามในขั้นแรกคุณต้องล้างข้อมูล

คุณต้องลบอักขระที่พิมพ์ไม่ได้และช่องว่างส่วนเกินที่อาจมีอยู่ในข้อมูล คุณสามารถใช้ฟังก์ชัน CLEAN และฟังก์ชัน TRIM เพื่อจุดประสงค์นี้

ส. ฟังก์ชั่นและคำอธิบาย
1.

CLEAN

ลบอักขระที่พิมพ์ไม่ได้ทั้งหมดออกจากข้อความ

2.

TRIM

ลบช่องว่างจากข้อความ

  • เลือกเซลล์ C3 - C11
  • พิมพ์ = TRIM (CLEAN (B3)) แล้วกด CTRL + Enter

สูตรจะเต็มไปในเซลล์ C3 - C11

ผลลัพธ์จะเป็นดังภาพด้านล่าง -

การค้นหารูปแบบข้อความที่ต้องการด้วยฟังก์ชันข้อความ

ในการจัดโครงสร้างข้อมูลของคุณคุณอาจต้องทำการจับคู่รูปแบบข้อความบางอย่างตามที่คุณสามารถดึงค่าข้อมูลออกมาได้ ฟังก์ชันข้อความบางส่วนที่มีประโยชน์สำหรับวัตถุประสงค์นี้ ได้แก่ -

ส. ฟังก์ชั่นและคำอธิบาย
1.

EXACT

ตรวจสอบว่าค่าข้อความสองค่าเหมือนกันหรือไม่

2.

FIND

ค้นหาค่าข้อความหนึ่งค่าภายในอีกค่าหนึ่ง (พิจารณาตัวพิมพ์เล็กและใหญ่)

3.

SEARCH

ค้นหาค่าข้อความหนึ่งภายในค่าอื่น (ไม่คำนึงถึงตัวพิมพ์เล็กและใหญ่)

การแยกค่าข้อมูลออกจากข้อความ

คุณต้องดึงข้อมูลที่ต้องการออกจากข้อความเพื่อให้มีโครงสร้างเหมือนกัน ในตัวอย่างข้างต้นกล่าวว่าคุณต้องวางข้อมูลในสามคอลัมน์ - ProductID, Product_Description และ Price

คุณสามารถดึงข้อมูลด้วยวิธีใดวิธีหนึ่งดังต่อไปนี้ -

  • การแยกค่าข้อมูลด้วยตัวช่วยสร้างการแปลงข้อความเป็นคอลัมน์
  • การแยกค่าข้อมูลด้วยฟังก์ชันข้อความ
  • การแยกค่าข้อมูลด้วย Flash Fill

การแยกค่าข้อมูลด้วยตัวช่วยสร้างการแปลงข้อความเป็นคอลัมน์

คุณสามารถใช้ไฟล์ Convert Text to Columns Wizard เพื่อแยกค่าข้อมูลลงในคอลัมน์ Excel หากฟิลด์ของคุณ -

  • คั่นด้วยอักขระหรือ
  • จัดเรียงในคอลัมน์โดยมีช่องว่างระหว่างแต่ละฟิลด์

ในตัวอย่างข้างต้นช่องจะถูกคั่นด้วยอักขระ“ |” ดังนั้นคุณสามารถใช้ไฟล์Convert Text to Columns ตัวช่วย

  • เลือกข้อมูล

  • คัดลอกและวางค่าในที่เดียวกัน มิฉะนั้น,Convert Text to Columns ใช้ฟังก์ชันแทนที่จะใช้ข้อมูลเป็นอินพุต

  • เลือกข้อมูล

  • คลิกที่ Text to Columns ใน Data Tools กลุ่มภายใต้ Data แท็บบน Ribbon

Step 1 - แปลงข้อความเป็นตัวช่วยสร้างคอลัมน์ - ขั้นตอนที่ 1 จาก 3 จะปรากฏขึ้น

  • เลือกตัวคั่น
  • คลิกถัดไป

Step 2 - แปลงข้อความเป็นตัวช่วยสร้างคอลัมน์ - ขั้นตอนที่ 2 จาก 3 จะปรากฏขึ้น

  • ภายใต้ Delimitersเลือก Other.

  • ในช่องถัดจาก Otherพิมพ์อักขระ |

  • คลิก Next.

Step 3 - แปลงข้อความเป็นตัวช่วยสร้างคอลัมน์ - ขั้นตอนที่ 3 จาก 3 จะปรากฏขึ้น

ในหน้าจอนี้คุณสามารถเลือกแต่ละคอลัมน์ของข้อมูลของคุณในวิซาร์ดและกำหนดรูปแบบสำหรับคอลัมน์นั้นได้

  • สำหรับ Destinationเลือกเซลล์ D3

  • คุณสามารถคลิก Advancedและตั้งค่า Decimal Separator และ Thousands Separator ใน Advanced Text Import Settings กล่องโต้ตอบที่ปรากฏขึ้น

  • คลิก Finish.

ข้อมูลของคุณซึ่งถูกแปลงเป็นคอลัมน์จะปรากฏในสามคอลัมน์ - D, E และ F

  • ตั้งชื่อส่วนหัวคอลัมน์เป็น ProductID, Product_Description และ Price

การแยกค่าข้อมูลด้วยฟังก์ชันข้อความ

สมมติว่าฟิลด์ในข้อมูลของคุณไม่ได้ถูกคั่นด้วยอักขระหรือไม่ถูกจัดแนวในคอลัมน์ที่มีช่องว่างระหว่างแต่ละฟิลด์คุณสามารถใช้ฟังก์ชันข้อความเพื่อแยกค่าข้อมูลได้ แม้ในกรณีที่ช่องถูกคั่นคุณยังสามารถใช้ฟังก์ชันข้อความเพื่อดึงข้อมูลได้

ฟังก์ชันข้อความบางส่วนที่มีประโยชน์สำหรับวัตถุประสงค์นี้ ได้แก่ -

ส. ฟังก์ชั่นและคำอธิบาย
1.

LEFT

ส่งคืนอักขระซ้ายสุดจากค่าข้อความ

2.

RIGHT

ส่งคืนอักขระขวาสุดจากค่าข้อความ

3.

MID

ส่งคืนจำนวนอักขระเฉพาะจากสตริงข้อความที่เริ่มต้นที่ตำแหน่งที่คุณระบุ

4.

LEN

ส่งคืนจำนวนอักขระในสตริงข้อความ

คุณยังสามารถรวมฟังก์ชันข้อความเหล่านี้อย่างน้อยสองฟังก์ชันตามข้อมูลที่คุณมีอยู่ในมือเพื่อแยกค่าข้อมูลที่ต้องการ ตัวอย่างเช่นการใช้ฟังก์ชัน LEFT, RIGHT และ VALUE ร่วมกันหรือใช้ฟังก์ชัน FIND, LEFT, LEN และ MID ร่วมกัน

ในตัวอย่างข้างต้น

  • อักขระทั้งหมดเหลือตัวแรก | ตั้งชื่อ ProductID

  • อักขระทั้งหมดไปจนถึงวินาที | ให้ชื่อราคา.

  • อักขระทั้งหมดที่อยู่ระหว่างตัวแรก | และสอง | ตั้งชื่อ Product_Description

  • แต่ละ | มีช่องว่างก่อนและหลัง

จากการสังเกตข้อมูลนี้คุณสามารถแยกค่าข้อมูลโดยทำตามขั้นตอนต่อไปนี้ -

  • ค้นหาตำแหน่งของอันดับแรก | -First | Position

    • คุณสามารถใช้ฟังก์ชัน FIND

  • ค้นหาตำแหน่งที่สอง | -Second | Position

    • คุณสามารถใช้ฟังก์ชัน FIND ได้อีกครั้ง

  • เริ่มต้นที่ (First | Position - 2) อักขระของข้อความให้รหัสผลิตภัณฑ์

    • คุณสามารถใช้ฟังก์ชัน LEFT

  • (First | Position + 2) ถึง (Second | Position - 2) อักขระของข้อความให้ Product_Description

    • คุณสามารถใช้ฟังก์ชัน MID

  • (Second | Position + 2) ถึงอักขระสิ้นสุดของข้อความให้ราคา

    • คุณสามารถใช้ฟังก์ชัน RIGHT

ผลลัพธ์จะเป็นดังภาพด้านล่าง -

คุณสามารถสังเกตได้ว่าค่าในคอลัมน์ราคาเป็นค่าข้อความ ในการคำนวณค่าเหล่านี้คุณต้องจัดรูปแบบเซลล์ที่เกี่ยวข้อง คุณสามารถดูส่วนที่ระบุด้านล่างเพื่อทำความเข้าใจการจัดรูปแบบข้อความ

การแยกค่าข้อมูลด้วย Flash Fill

ใช้ Excel Flash Fillเป็นอีกวิธีหนึ่งในการดึงค่าข้อมูลจากข้อความ อย่างไรก็ตามจะใช้ได้เฉพาะเมื่อ Excel สามารถค้นหารูปแบบในข้อมูลได้

Step 1 - สร้างคอลัมน์สามคอลัมน์สำหรับ ProductID, Product_Description และ Price ถัดจากข้อมูล

Step 2 - คัดลอกและวางค่าสำหรับ C3, D3 และ E3 จาก B3

Step 3 - เลือกเซลล์ C3 แล้วคลิก Flash Fill ใน Data Tools กลุ่มบน Dataแท็บ ค่าทั้งหมดสำหรับ ProductID จะถูกเติม

Step 4- ทำซ้ำขั้นตอนที่ระบุข้างต้นสำหรับ Product_Description และ Price กรอกข้อมูลแล้ว

การจัดรูปแบบข้อมูลด้วยฟังก์ชันข้อความ

Excel มีฟังก์ชันข้อความในตัวหลายอย่างที่คุณสามารถใช้สำหรับการจัดรูปแบบข้อมูลที่มีข้อความ ซึ่ง ได้แก่ -

Functions that format the Text as per your need -

ส. ฟังก์ชั่นและคำอธิบาย
1.

LOWER

แปลงข้อความเป็นตัวพิมพ์เล็ก

ส. ฟังก์ชั่นและคำอธิบาย
1.

UPPER

แปลงข้อความเป็นตัวพิมพ์ใหญ่

2.

PROPER

อักษรตัวแรกเป็นตัวพิมพ์ใหญ่ในแต่ละคำของค่าข้อความ

Functions that convert and/or format the Numbers as Text -

ส. ฟังก์ชั่นและคำอธิบาย
1.

DOLLAR

แปลงตัวเลขเป็นข้อความโดยใช้รูปแบบสกุลเงิน $ (ดอลลาร์)

2.

FIXED

จัดรูปแบบตัวเลขเป็นข้อความโดยมีทศนิยมจำนวนคงที่

3.

TEXT

จัดรูปแบบตัวเลขและแปลงเป็นข้อความ

Functions that convert the Text to Numbers -

ส. ฟังก์ชั่นและคำอธิบาย
1.

VALUE

แปลงอาร์กิวเมนต์ข้อความเป็นตัวเลข

Executing Data Operations with the Text Functions

คุณอาจต้องดำเนินการข้อความบางอย่างกับข้อมูลของคุณ ตัวอย่างเช่นหากรหัสเข้าสู่ระบบสำหรับพนักงานถูกเปลี่ยนเป็นรูปแบบใหม่ในองค์กรตามการเปลี่ยนแปลงรูปแบบอาจต้องทำการเปลี่ยนข้อความ

ฟังก์ชั่นข้อความต่อไปนี้ช่วยคุณในการดำเนินการข้อความกับข้อมูลของคุณที่มีข้อความ -

ส. ฟังก์ชั่นและคำอธิบาย
1.

REPLACE

แทนที่อักขระภายในข้อความ

2.

SUBSTITUTE

แทนที่ข้อความใหม่สำหรับข้อความเก่าในสตริงข้อความ

3.

CONCATENATE

รวมรายการข้อความหลายรายการเป็นรายการข้อความเดียว

4.

CONCAT

รวมข้อความจากหลายช่วงและ / หรือสตริง แต่ไม่มีอาร์กิวเมนต์ตัวคั่นหรือ IgnoreEmpty

5.

TEXTJOIN

รวมข้อความจากหลายช่วงและ / หรือสตริงและรวมตัวคั่นที่คุณระบุระหว่างค่าข้อความแต่ละค่าที่จะรวมกัน ถ้าตัวคั่นเป็นสตริงข้อความว่างฟังก์ชันนี้จะเชื่อมต่อช่วงได้อย่างมีประสิทธิภาพ

6.

REPT

ทำซ้ำข้อความตามจำนวนครั้งที่กำหนด