Apache Presto - Ikhtisar

Analisis data adalah proses menganalisis data mentah untuk mengumpulkan informasi yang relevan untuk pengambilan keputusan yang lebih baik. Ini terutama digunakan di banyak organisasi untuk membuat keputusan bisnis. Nah, analitik data besar melibatkan sejumlah besar data dan proses ini cukup kompleks, karenanya perusahaan menggunakan strategi yang berbeda.

Misalnya, Facebook adalah salah satu perusahaan data warehouse terdepan dan terbesar di dunia. Data gudang Facebook disimpan di Hadoop untuk komputasi skala besar. Kemudian, ketika data gudang bertambah menjadi petabyte, mereka memutuskan untuk mengembangkan sistem baru dengan latensi rendah. Di tahun 2012, anggota tim Facebook merancang“Presto” untuk analisis kueri interaktif yang akan beroperasi dengan cepat bahkan dengan data berukuran petabyte.

Apa itu Apache Presto?

Apache Presto adalah mesin eksekusi kueri paralel terdistribusi, dioptimalkan untuk latensi rendah dan analisis kueri interaktif. Presto menjalankan kueri dengan mudah dan menskalakan tanpa waktu henti bahkan dari gigabyte hingga petabyte.

Kueri Presto tunggal dapat memproses data dari berbagai sumber seperti HDFS, MySQL, Cassandra, Hive, dan banyak lagi sumber data. Presto dibangun di Java dan mudah diintegrasikan dengan komponen infrastruktur data lainnya. Presto sangat kuat, dan perusahaan terkemuka seperti Airbnb, DropBox, Groupon, Netflix mengadopsinya.

Presto - Fitur

Presto berisi beberapa fitur berikut -

  • Arsitektur yang sederhana dan dapat diperluas.
  • Konektor yang dapat dicolok - Presto mendukung konektor yang dapat dicolokkan untuk menyediakan metadata dan data untuk kueri.
  • Eksekusi pipelined - Menghindari overhead latensi I / O yang tidak perlu.
  • Fungsi yang ditentukan pengguna - Analis dapat membuat fungsi yang ditentukan pengguna khusus untuk bermigrasi dengan mudah.
  • Pemrosesan kolumnar vektor.

Presto - Manfaat

Berikut adalah daftar manfaat yang ditawarkan Apache Presto -

  • Operasi SQL khusus
  • Mudah dipasang dan di-debug
  • Abstraksi penyimpanan sederhana
  • Menskalakan data petabyte dengan cepat dengan latensi rendah

Presto - Aplikasi

Presto mendukung sebagian besar aplikasi industri terbaik saat ini. Mari kita lihat beberapa aplikasi penting.

  • Facebook- Facebook membangun Presto untuk kebutuhan analitik data. Presto dengan mudah mengukur kecepatan data yang besar.

  • Teradata- Teradata menyediakan solusi ujung ke ujung dalam analitik Big Data dan pergudangan data. Kontribusi teradata ke Presto memudahkan lebih banyak perusahaan untuk mengaktifkan semua kebutuhan analitis.

  • Airbnb- Presto adalah bagian integral dari infrastruktur data Airbnb. Ratusan karyawan menjalankan kueri setiap hari dengan teknologi tersebut.

Mengapa Presto?

Presto mendukung ANSI SQL standar yang membuatnya sangat mudah bagi analis data dan pengembang. Meskipun dibuat di Java, ia menghindari masalah umum kode Java yang terkait dengan alokasi memori dan pengumpulan sampah. Presto memiliki arsitektur konektor yang ramah Hadoop. Ini memungkinkan untuk dengan mudah mencolokkan sistem file.

Presto berjalan di beberapa distribusi Hadoop. Selain itu, Presto dapat menjangkau dari platform Hadoop untuk meminta Cassandra, database relasional, atau penyimpanan data lainnya. Kemampuan analitik lintas platform ini memungkinkan pengguna Presto mengekstrak nilai bisnis maksimum dari gigabyte hingga petabyte data.