AI adalah kata kunci. Inilah Kata Nyata yang Harus Diketahui

May 08 2023
Deskripsi bahasa Inggris sederhana tentang istilah seputar teknologi "AI".
Dalam ikhtisar saya tentang AI dan pembelajaran mesin, saya mendefinisikan AI sebagai “kemampuan untuk melakukan sesuatu yang 'terlihat cerdas'. Peringatan spoiler: Saya tahu ini adalah definisi yang buruk.
Saya diintimidasi oleh semua hal AI ini. Dibuat dengan Pembuat Gambar Bing.

Dalam ikhtisar saya tentang AI dan pembelajaran mesin , saya mendefinisikan AI sebagai “kemampuan untuk melakukan sesuatu yang 'terlihat cerdas'. Peringatan spoiler: Saya tahu ini adalah definisi yang buruk. Peringatan spoiler nyata: Saya tidak dapat menemukan yang bagus. Tidak ada yang menulis satu yang disetujui semua orang . Kami agak terjebak dengan "tampaknya pintar" untuk saat ini. Tapi tidak apa-apa, karena orang-orang industri teknologi tidak benar-benar mengatakan "mari kita buat aplikasi AI", mereka mengatakan "mari kita implementasikan solusi ini dengan pembelajaran mesin" atau "mari pastikan kita membumikan permintaan pengguna untuk menghindari halusinasi."

AI, sebagai sebuah istilah, hanyalah kata kunci. Di tahun 90-an, Deep Blue adalah AI jahat besar yang mengalahkan Garry Kasparov, Juara Catur Dunia saat itu, di permainannya sendiri! Namun, saat ini, banyak yang ragu untuk menyebutnya AI: Lagi pula, banyak yang dihafal dan sisanya mengikuti instruksi yang diberikan oleh programmer dan pakar catur. Apakah pintar jika hanya mengikuti instruksi? Tapi AI terdengar keren! Dan sepertinya pintar, jadi cocok! Di sini kita melihat tujuan sebenarnya dari istilah "AI": untuk memberikan nama yang lebih keren untuk program, sesuatu yang lebih baik daripada "menghafal catur dan komputer yang mengikuti instruksi" atau "pengikut aturan yang tampak cerdas". "AI" membungkus semuanya dengan rapi, dan pemasar sering kali berharap penonton tidak pernah benar-benar mempertanyakan apa yang terjadi di balik layar.

Jadi mari kita pergi ke belakang layar.

Penafian: Artikel ini menyebutkan Microsoft, majikan saya. Saya menulis artikel ini di waktu luang saya dan semua pendapat adalah milik saya sendiri.

Saat ini, hampir setiap aplikasi yang kami anggap sebagai AI dibangun melalui proses yang disebut pembelajaran mesin . Untuk meringkas liputan saya sebelumnya tentang istilah ini , algoritme pembelajaran mesin menciptakan caranya sendiri dalam bertindak berdasarkan contoh. Cara berakting ini disebut model , dan ini seperti resep memasak. Algoritme tradisional disediakan dengan resep buatan tangan oleh para insinyur. Namun, para insinyur tidak dapat membuat resep buatan tangan untuk pengenalan gambar dan banyak masalah lainnya, sehingga pembelajaran mesin telah menyelamatkan hari di bidang tersebut.

Empat bagian pembelajaran mesin cocok dengan dapur — terima kasih Cassie! Sumber: Cassie Kozyrkov

Untuk menggunakan analogi dapur Cassie Kozyrkov yang luar biasa , ada empat bagian untuk setiap proses pembelajaran mesin: Mengumpulkan data, memasukkannya ke dalam algoritme, memvalidasi model, dan menggunakannya untuk menyajikan prediksi. Secara analogi, ada empat bagian dapur: Bahan, peralatan, resep, dan hidangan. Tapi "peralatan" pembelajaran mesin jauh lebih pintar daripada oven rata-rata - mereka tidak hanya memanaskan makanan, mereka juga belajar cara menyiapkan hidangan!

Misalnya, untuk membuat ChatGPT, OpenAI mengumpulkan data dari seluruh internet dan membuat beberapa contoh percakapan mereka sendiri, memasukkan semuanya ke dalam algoritme generatif pre-trained transformer (GPT), keluar dengan model GPT-3.5 yang diperbarui, dan sekarang mereka menggunakannya untuk memprediksi kata-kata selanjutnya dalam percakapan. (Pembaruan 8 April: Ada sedikit pekerjaan ekstra: mereka "memeriksa model saat sedang memasak", boleh dikatakan, untuk membantu alat menggunakan proses yang dikenal sebagai Pembelajaran Penguatan dari Umpan Balik Manusia. Saya juga memodifikasi paragraf sebelumnya untuk mengklarifikasi bahwa ChatGPT adalah salah satu model yang dibuat terpisah dari model GPT-3.5 asli.)

Faktanya, pembelajaran mesin digunakan di mana-mana : Dari algoritme rekomendasi Twitter (lihat "penilai berat" untuk detailnya) hingga mungkin algoritme rekomendasi setiap situs web lain hingga diagnosis medis hingga deteksi penipuan hingga astronomi dan seterusnya!

Model bahasa besar hanyalah model pembelajaran mesin yang dilatih khusus untuk menampilkan teks berdasarkan input teks. Beberapa contoh model bahasa besar termasuk GPT-3, GPT-3.5, dan GPT-4 (terkadang hanya disebut sebagai GPT-n). Ada juga LaMDA oleh Google , LLaMA oleh Meta , dan BloombergGPT oleh perusahaan itu yang menamai semuanya dengan orang itu. Secara teknis, model GPT-n masing-masing merupakan keluarga model , tetapi sebagian besar artikel menggunakan "GPT-4" untuk merujuk pada model obrolannya yang paling dioptimalkan.

Beberapa produk yang menggunakan model bahasa besar adalah ChatGPT, yang menggunakan GPT-3.5* (sekarang GPT-4 untuk pelanggan), Bing baru (GPT-4), dan Google Bard (LaMDA). Harapkan banyak, banyak lagi yang akan datang. Dan ingat saja: siapa pun yang mengatakan Bing baru "diberdayakan oleh ChatGPT" tidak sepenuhnya benar — sekarang Anda dapat membantu mereka belajar!

*Pembaruan 8 April: Secara teknis, ChatGPT juga merupakan nama model , tetapi telah disesuaikan dari model GPT-3.5 dan disebut sebagai "GPT-3.5" pada aplikasi itu sendiri dan " gpt-3.5-turbo " seluruh dokumentasi OpenAI .

Produk adalah pembungkus model, cara untuk membuatnya lebih mudah bekerja dengan model dan mengintegrasikannya dengan hal lain, seperti situs web dan yang lainnya . Produk juga memberikan keamanan, privasi, dan logika kebijakan untuk memastikan prompt yang buruk tidak dikirim ke model dan output yang buruk tidak ditampilkan kepada Anda. Pemilik produk memutuskan apa yang "buruk" dan apa yang tidak, dan mereka biasanya menghindari ucapan standar yang berisi kebencian, kekerasan, atau sekadar ucapan kasar, antara lain. Anjuran yang diterima oleh produk biasanya diteruskan langsung ke model, meskipun hal ini sedang berubah.

Produk berbasis prompt yang lebih baru akan meng-ground prompt, yang berarti mereka akan menyesuaikan prompt untuk membuatnya lebih berguna sebelum memberikannya ke model (lihat pengumuman terbaru Microsoft pada 21:04). Prompt yang di-ground seharusnya lebih kecil kemungkinannya untuk menghasilkan halusinasi . Model berhalusinasi setiap kali mengeluarkan sesuatu yang mungkin tampak benar, tetapi sebenarnya tidak. Ada banyak contoh online ini, tetapi hari-hari awal Bing baru mengambil kue: dalam satu kasus, mengklaim Avatar 2 belum keluar dan mulai menghina pengguna . (Tangkapan layar dan cerita dapat dibuat-buat, tetapi saya membuat ulang halusinasi Avatar 2 sendiri, meskipun saya tidak dihina.)

Halusinasi $ 100 miliar Bard yang terkenal — JWST tidak mengambil gambar pertama dari sebuah planet ekstrasurya, VLT melakukannya.

Halusinasi sama berbahayanya dengan kedengarannya, jadi penting untuk diingat bahwa model tidak mengetahui kebenaran . Model hanya menebak kata-kata. Terserah produk, dan pada akhirnya pengguna, untuk memeriksa fakta apa pun yang dihasilkan oleh model. Halusinasi terkenal lainnya datang dari Google: pada 6 Februari, Google memamerkan jawaban publik pertama Bard —dan itu adalah halusinasi. Mereka tidak mengetahuinya dan tidak memberikan penafian apa pun, dan Google kemudian kehilangan nilai pasar $100 miliar . Agar adil, Bing lama masih membuat kesalahan yang sama ketika saya mencari "teleskop mana yang mengambil gambar pertama planet ekstrasurya", tetapi kegagalan Google untuk memeriksa fakta model mereka sendiri menunjukkan betapa mudahnya mempercayai halusinasi. Selalu periksa fakta!

Terakhir, mari kita bahas beberapa algoritme dasar yang membuat model. Yang pertama adalah jaringan saraf , dan kemudian orang-orang mulai membangun hal-hal seperti jaringan saraf convolutional dan jaringan saraf berulang dan jaringan saraf adversarial generatif , tetapi baru pada tahun 2017 kami mendapatkan algoritme terbaru: transformator , yang jauh lebih sederhana dan hanya membutuhkan waktu belasan jam untuk belajar intensif untuk mendapatkan pemahaman dasar.

Apakah kita perlu mengetahui cara kerja algoritme ini? Nah, perlukah kita mengetahui cara kerja oven? Tidak juga, kita hanya perlu tahu itu memasak makanan kita dan berbahaya saat panas! Detail teknisnya bisa menarik, tetapi semuanya bermuara pada sekumpulan matematika yang sama berulang kali, saya janji.

Mari kita rangkum semuanya dalam glosarium berpoin yang bagus, oke?

  • Kecerdasan buatan (AI): Istilah yang tidak jelas artinya yang pada dasarnya berarti "tampak pintar", sebagian besar digunakan dalam pemasaran.
  • Pembelajaran mesin (ML): Proses di mana pembuat kode membuat program yang belajar dengan contoh, bukan dengan instruksi.
  • Algoritma ML: Sedikit perangkat lunak yang menyempurnakan model setiap kali dibutuhkan masukan.
  • Model: Proses matematika yang bekerja pada data dari tipe tertentu untuk memprediksi sesuatu.
  • Model bahasa besar generatif (LLM): Jenis model yang memprediksi teks apa yang muncul berikutnya.
  • Produk: Aplikasi perangkat lunak apa pun yang menggunakan LLM di belakang layar.
  • Prompt: Saat Anda membuka ChatGPT dan mengirim pesan, pesan itu adalah prompt Anda.
  • Grounding: Menyesuaikan prompt dalam upaya menjadikannya lebih baik untuk LLM.
  • Berhalusinasi: Ketika LLM melakukan kesalahan, itu berhalusinasi - selalu periksa fakta!

Terima kasih telah membaca. Apa yang ingin Anda pelajari selanjutnya? Bagaimana saya bisa membantu?

Berikut sarannya, ini adalah artikel pertama dalam seri ini:

Mari belajar tentang kecerdasan buatan

Dan entri berikutnya:

Buka kekuatan ChatGPT dengan rekayasa cepat

Podcast Generator

Lainnya dari Generator

Mengapa Anda Perlu Tahu Tentang AutoGPT Legenda Yahudi Kuno Ini Adalah Kisah Peringatan Tentang AI Generatif