SAP BODS - Transformasi Kueri
Ini adalah transformasi paling umum yang digunakan dalam Layanan Data dan Anda dapat melakukan fungsi berikut -
- Pemfilteran data dari sumber
- Menggabungkan data dari berbagai sumber
- Melakukan fungsi dan transformasi pada data
- Pemetaan kolom dari skema input ke output
- Menetapkan kunci utama
- Tambahkan kolom, skema, dan fungsi baru yang dihasilkan ke skema keluaran
Karena Transformasi kueri adalah transformasi yang paling umum digunakan, pintasan disediakan untuk kueri ini di palet alat.
Untuk menambahkan transformasi Query, ikuti langkah-langkah yang diberikan di bawah ini -
Step 1- Klik palet alat transformasi kueri. Klik di mana saja di ruang kerja Aliran data. Hubungkan ini ke input dan output.
Saat Anda mengklik dua kali ikon Transformasi kueri, ini akan membuka editor kueri yang digunakan untuk melakukan operasi kueri.
Area berikut ini hadir dalam transformasi Kueri -
- Skema Input
- Skema Keluaran
- Parameters
Skema Input dan Output berisi Kolom, Skema Bersarang, dan Fungsi. Skema Masuk dan Skema Keluar menunjukkan skema yang saat ini dipilih dalam transformasi.
Untuk mengubah skema keluaran, pilih skema dalam daftar, klik kanan dan pilih Make Current.
Transformasi Kualitas Data
Transformasi Kualitas Data tidak dapat langsung dihubungkan ke transformasi hulu, yang berisi tabel bertingkat. Untuk menghubungkan transformasi ini, Anda harus menambahkan transformasi kueri atau transformasi pipeline XML antara transformasi dari tabel bersarang dan transformasi kualitas data.
Bagaimana cara menggunakan Transformasi Kualitas Data?
Step 1 - Pergi ke Object Library → tab Transform
Step 2 - Perluas transformasi Kualitas Data dan tambahkan konfigurasi transformasi atau transformasi yang ingin Anda tambahkan ke aliran data.
Step 3- Gambarkan koneksi aliran data. Klik dua kali nama transformasi, itu membuka editor transformasi. Dalam skema masukan, pilih kolom masukan yang ingin Anda petakan.
Note - Untuk menggunakan Associate Transform, Anda dapat menambahkan field yang ditentukan pengguna ke tab input.
Transformasi Pengolahan Data Teks
Transformasi Pemrosesan Data Teks memungkinkan Anda mengekstrak informasi spesifik dari teks volume besar. Anda dapat mencari fakta dan entitas seperti pelanggan, produk, dan fakta keuangan, khusus untuk suatu organisasi.
Transformasi ini juga memeriksa hubungan antara entitas dan memungkinkan ekstraksi. Data yang diekstrak, menggunakan pemrosesan data teks, dapat digunakan di Business Intelligence, Pelaporan, kueri, dan analitik.
Transformasi Ekstraksi Entitas
Di Layanan Data, pemrosesan data teks dilakukan dengan bantuan Ekstraksi Entitas, yang mengekstrak entitas dan fakta dari data tidak terstruktur.
Ini melibatkan analisis dan pemrosesan data teks dalam jumlah besar, mencari entitas, menugaskannya ke jenis yang sesuai, dan menyajikan metadata dalam format standar.
Transformasi Ekstraksi Entitas dapat mengekstrak informasi dari teks, HTML, XML, atau konten format biner tertentu (seperti PDF) dan menghasilkan keluaran terstruktur. Anda dapat menggunakan output dalam beberapa cara berdasarkan alur kerja Anda. Anda dapat menggunakannya sebagai input untuk transformasi lain atau menulis ke beberapa sumber output seperti tabel database atau file datar. Outputnya dihasilkan dalam encoding UTF-16.
Entity Extract Transform can be used in the following scenarios −
Menemukan informasi spesifik dari volume teks yang besar.
Menemukan informasi terstruktur dari teks tidak terstruktur dengan informasi yang ada untuk membuat koneksi baru.
Pelaporan dan analisis kualitas produk.
Perbedaan antara TDP dan Data Cleansing
Pengolahan data teks digunakan untuk menemukan informasi yang relevan dari data teks tidak terstruktur. Namun, pembersihan data digunakan untuk standarisasi dan pembersihan data terstruktur.
Parameter | Pemrosesan Data Teks | Pembersihan data |
---|---|---|
Tipe masukan | Data Tidak Terstruktur | Data Terstruktur |
Ukuran Input | Lebih dari 5KB | Kurang dari 5KB |
Lingkup Input | Domain luas dengan banyak variasi | Variasi terbatas |
Potensi Penggunaan | Potensi informasi yang berarti dari data tidak terstruktur | Kualitas data untuk disimpan di Repository |
Keluaran | Buat anotasi dalam bentuk entitas, jenis, dll. Input tidak diubah | Buat bidang standar, Input diubah |