Mari belajar tentang kecerdasan buatan
Serangkaian tentang AI, pembelajaran mesin, ChatGPT, dan banyak lagi
Sejak ChatGPT dirilis secara eksplosif pada November 2022, saya merasakan sindrom penipu dan kecemasan seputar kecerdasan buatan (AI). Apa fungsinya, tepatnya? Bagaimana cara kerjanya? Apa berikutnya? Untuk konteksnya, saya seorang insinyur perangkat lunak, dan saya telah bekerja di Microsoft sejak saya lulus pada tahun 2020. Tetapi saya tidak pernah memiliki kesempatan untuk benar-benar "menggunakan AI", dan saya mengabaikan sebagian besar berita di sekitarnya karena terlalu penuh dengan kata kunci, hype, dan jargon.
Mari belajar tentang AI dan perkembangan terkini di lapangan. Seri ini untuk siapa saja, baik orang teknologi maupun non-teknologi, yang memiliki pengalaman minimal dengan AI. Kita akan belajar bersama tentang apa yang terjadi dengan semua alat chatbot ini — ChatGPT, Bing baru, Bard, Copilot, dan masih banyak lagi. Apakah mereka overhyped? Apa yang mereka mampu? Apakah mereka cukup pribadi, aman, dan etis? Ini adalah pertanyaan besar, dan semuanya tidak dapat dijawab dalam satu posting. Tapi saya berharap bisa memecahnya tanpa semua jargon yang sepertinya ada di setiap artikel yang saya baca sejauh ini.
Pada artikel ini , kami akan membahas definisi AI, pembelajaran mesin, OpenAI, dan pengumuman produk AI terbaru.
Artikel ini menyebutkan Microsoft, majikan saya. Saya menulis artikel ini di waktu luang saya dan semua pendapat adalah milik saya sendiri.
Saya tidak masuk ke AI sampai awal Februari , ketika tim kami bersemangat untuk FHL seluruh organisasi — minggu fix-hack-learn di mana kami pada dasarnya dapat melakukan apa pun yang kami inginkan. Topik yang mendominasi percakapan adalah ChatGPT dan potensi alat terkait. Saya menghabiskan minggu itu dengan gugup mempelajari dasar-dasar kecerdasan buatan modern, istilah-istilah di sekitarnya, dan rilis produk terbaru. Tim saya memasukkan data ke model dan yang lainnya, tetapi saya baru saja membaca artikel Wikipedia dan meminta ChatGPT menjelaskan kepada saya cara kerjanya. Setelah tim saya memiliki bukti konsep yang berfungsi, saya bertanya kepada mereka bagaimana mereka membuatnya dan dengan sukarela membuat video promosi. Saya sangat gugup sehingga saya mengambil cuti. Tapi saya terus belajar.
Dan kemudian "Bing baru" dirilis, dan GPT-4 keluar, dan Microsoft 365 Copilot diumumkan, dan Google membuat banyak pengumumannya sendiri. Semua ini adalah perkembangan yang sangat penting, dan menyoroti potensi baru alat AI. Mereka juga memperburuk perasaan ketidakmampuan saya dan kewalahan. Tapi satu-satunya jalan keluar adalah lewat, kan? Jadi ayo pergi.
AI adalah kemampuan untuk melakukan sesuatu yang “terlihat pintar” : memainkan permainan dengan baik, mengenali tulisan tangan, mengonversi ucapan menjadi teks, merekomendasikan video untuk ditonton, atau membuat paragraf sebagai tanggapan atas pertanyaan yang ditulis dalam bahasa Inggris biasa. Definisi ini sepertinya mencakup banyak hal: dan memang demikian! 100 tahun yang lalu semuanya dilakukan secara manual, dari aritmatika dasar hingga persiapan dokumen hingga penjadwalan hingga perencanaan pemerintah internasional. Alat yang tersedia hanya dapat menyampaikan informasi yang ada, mereka tidak dapat meringkasnya atau "melakukan" apa pun dengannya. Alat AI menentukan langkah selanjutnya dalam permainan papan, atau kata berikutnya dalam permintaan pencarian, atau apakah sebuah kata salah dieja. Alat apa pun yang dapat menghasilkan keluaran berbeda dari yang Anda masukkan, dalam arti paling dasar, adalah alat AI.
Lebih umum, kami berpikir tentang AI "tingkat lebih tinggi" yang melakukan "hal-hal yang sangat cerdas": saat kami merujuk ke "algoritme" yang ada di YouTube, Facebook, TikTok, Amazon, dan tempat lain yang merekomendasikan konten, kami mengacu pada algoritma AI. Tentu saja, apa yang seseorang anggap "sangat pintar" akan sangat bervariasi tergantung pada siapa Anda bertanya dan kapan Anda bertanya kepada mereka. 50 tahun yang lalu, kemampuan komputer untuk memainkan catur sangat mencengangkan, sekarang ini "hanya perhitungan". Ini adalah efek AI , dan saya mencoba melawannya dengan definisi AI saya yang luas sebelumnya. ChatGPT dan "alat chatbot" baru lainnya hampir dengan suara bulat dianggap sebagai AI "tingkat lebih tinggi", tetapi sebenarnya tidak ada perbedaan mendasar antara ChatGPT dan kalkulator sederhana. Keduanya mengambil input, melakukan beberapa perhitungan (Oke, ChatGPT melakukan banyak halperhitungan) dan memberikan beberapa output baru berdasarkan input. Keduanya AI. Jadi apa yang membedakan mereka?
Pembelajaran mesin adalah cara yang paling banyak dibicarakan para insinyur untuk membuat algoritme AI "tingkat lebih tinggi" ini. Dan, seperti AI, pembelajaran mesin adalah bidang yang sangat luas. Karakteristik yang menentukan dari algoritme pembelajaran mesin (vs beberapa algoritme AI lainnya) adalah bahwa para insinyur tidak "secara langsung" memberi tahu apa yang harus dilakukan. Sebaliknya, algoritma pembelajaran mesin diberikan data pelatihan (input dan output sampel) dan diharapkan untuk "mempelajari" pola antara input dan output. Misalnya, algoritme dapat memberikan 10.000 gambar anjing dengan keluaran sampel "ini adalah anjing", dan kemudian 10.000 gambar lainnya dengan keluaran sampel "ini bukan anjing". Dari sana, seseorang dapat memberikan gambaran baru pada algoritme, dan algoritme akan menggunakan pembelajarannya untuk mengatakan "ini anjing" atau "ini bukan anjing".
Pembelajaran mesin tidak terbatas pada mengklasifikasikan gambar, meskipun: itu adalah proses inti yang sama yang mendukung ChatGPT, "algoritme" yang ada di media sosial dan situs belanja, algoritme catur, dan banyak lagi. (Sebagai latihan, pertimbangkan kemungkinan data pelatihan untuk algoritme ini.)
Mari kita gunakan contoh : catur. Dalam algoritme tradisional, para insinyur mungkin berkata, “Oke komputer, ini papan saat ini. Jalankan semua kemungkinan gerakan selanjutnya, dan nilai setiap gerakan sesuai dengan berapa banyak bidak yang dimiliki pemain lain dan berapa banyak bidak Anda yang rentan. Pilih gerakan dengan skor tertinggi.” Sistem penilaian ini dianggap sebagai model: fungsi matematika yang menghitung skor untuk masukan yang diberikan. Algoritme ini adalah AI, tetapi bukan pembelajaran mesin. Dalam pembelajaran mesin, algoritme akan diberikan data pelatihan: “Oke komputer, ini papan catur, ini langkah terbaik selanjutnya. Kami telah memberi Anda 100 contoh seperti ini. Pelajari cara bermain catur.” Algoritme membangun modelnya sendiri dengan menyesuaikan kembali fungsi penilaiannya saat melewati data pelatihan. Itu mengubah penilaiannya berdasarkan apa yang ditebaknya dan apa hasil yang diharapkan. Sementara algoritme melewati data pelatihan, dikatakan belajar, atau melatih modelnya. Kemudian menggunakan model terlatih ini untuk membuat prediksi pada masukan baru. Kami dapat menunjukkan algoritme terlatih papan yang belum pernah terlihat sebelumnya, dan itu akan menggunakan modelnya untuk menilai kemungkinan langkah selanjutnya dan membuat pilihannya.
OpenAI adalah lab di balik ChatGPT . Itu didirikan pada 2015. OpenAI menciptakan istilah generative pre-trained transformer (GPT) pada 2018. Generatif berarti model akan menghasilkan konten, seperti teks. Kita akan berbicara lebih banyak tentang "pra-dilatih" dan "transformator" di artikel mendatang, tetapi mereka lebih banyak tentang bagaimana algoritme dibuat, bukan apa yang dapat dilakukannya. Tetapi hal-hal GPT-n ini (GPT-2, GPT-3, dll.) hanyalah model, khususnya model bahasa besar (LLM). LLM mengambil teks, menilai teks keluaran potensial, lalu mengembalikan teks dengan skor tertinggi. Mereka tidak langsung interaktif seperti ChatGPT.
Ada LLM lain yang dibuat oleh perusahaan besar lainnya: Google punya LaMDA , misalnya. "Alat chatbot" baru ini pada dasarnya terdiri dari dua bagian: Bagian yang membawa prompt Anda (pesan Anda ke chatbot) dan model bahasa itu sendiri. Kedua bagian tersebut berbicara satu sama lain seperti halnya browser Anda berbicara dengan Google saat Anda melakukan penelusuran web.
ChatGPT adalah situs web yang berbicara dengan model GPT di belakang layar. Perusahaan lain sedang membangun alat mereka sendiri yang berbicara dengan GPT-n atau model ChatGPT. Misalnya, “ Bing baru ” berbicara dengan GPT-4 , yang baru saja dirilis ke publik pada 14 Maret 2023.
(Pembaruan 8 April: Saya harus mengklarifikasi bahwa ChatGPT juga merupakan nama model yang digunakan oleh situs web ChatGPT. Ini terdaftar sebagai "gpt-3.5-turbo" di beberapa dokumen OpenAI , jadi Anda mungkin mendengar orang mengatakan "ChatGPT berbicara dengan GPT -3.5” atau “ChatGPT berbicara dengan model GPT-3.5”, keduanya biasanya cukup mirip.)
Sedikit bersinggungan: Microsoft adalah mitra utama OpenAI . GPT-4 dilatih di superkomputer buatan Microsoft . Superkomputer itu adalah yang terbesar kelima di dunia. Dan itu dibangun hanya untuk OpenAI. Microsoft telah menginvestasikan miliaran dolar di lab dan dilaporkan sebagai pemegang saham 49% pada Januari 2023. Oh, dan GPT-3 dilisensikan secara eksklusif untuk Microsoft — ini berarti Microsoft menentukan siapa yang dapat dan tidak dapat membangun alat masa depan seperti ChatGPT menggunakan model tersebut. Saya belum yakin dengan status GPT-4, tetapi saya tidak akan terlalu terkejut jika semua model GPT-n mendatang hanya untuk Microsoft.
Mengapa perusahaan mengumumkan begitu banyak alat chatbot? Singkatnya, banyak perusahaan mengenali potensi LLM beberapa waktu lalu, dan alat ini telah bekerja sejak saat itu. Tetapi dengan popularitas ChatGPT yang belum pernah terjadi sebelumnya, para insinyur mungkin mendapat kapasitas tambahan, dan ini menjadi balapan yang dipublikasikan dengan baik sejak saat itu.
Alat ini ampuh karena menggunakan bahasa Inggris biasa untuk input dan output . Seperti mesin telusur tradisional, kita tidak perlu mengingat cara tertentu berbicara dengan komputer: kita cukup mengetikkan apa yang kita pikirkan dan kita mendapatkan hasil. Lebih baik lagi, hasilnya juga bahasa Inggris biasa! Alih-alih daftar (iklan dan) tautan yang mungkin berguna, kami hanya mendapatkan… jawaban! Alat yang dibangun di sekitar model OpenAI benar-benar menghilangkan pencarian dari pencarian. Dapatkah Anda mengatakan bahwa saya bersemangat? (Catatan tambahan: para ahli menyebut "bahasa Inggris biasa" sebagai "bahasa alami".)
Terakhir, keluasan dan kedalaman alat ini benar-benar terasa tidak terbatas. Saya percaya pengumuman Microsoft tentang Microsoft 365 Copilotberbicara sendiri, tetapi jika demo dan ikhtisar 40 menit terlalu banyak untuk Anda, saya akan meringkas. Microsoft percaya pada kekuatan alat di mana Anda memasukkan bahasa Inggris biasa, dan itu menghasilkan informasi yang berguna atau bahkan modifikasi yang berguna untuk dokumen Anda. Kopilot pada dasarnya adalah "ChatGPT yang memiliki akses ke dokumen Microsoft 365 Anda." Mintalah draf pidato 3 menit kepada Kopilot untuk kelulusan putri Anda, pastikan untuk menyebutkan nilainya yang bagus, betapa bangganya Anda padanya, dan betapa bersemangatnya Anda untuk masa depannya, dan Anda akan mendapatkannya. Segera. Tidak ada pencarian, tidak ada copy-paste, tidak ada apa-apa. Tujuan dari paradigma “kopilot” adalah untuk menyediakan draf dan opsi perbaikan cepat tanpa mengambil alih dan tanpa harus membuat pengguna sibuk bekerja sama sekali. Alih-alih bertanya kepada "teman Excel" Anda bagaimana cara menulis rumus tertentu (Saya melihat Anda, Ayah) atau mencoba menyaring hasil dari Google, tanyakan saja pada Copilot. Itu tidak hanya memberi Anda formula, itu akan memvisualisasikannya untuk Anda, memberikan konteks tambahan tentangnya, memberikan saran alternatif - apa saja! Oke, ini mulai terdengar seperti iklan (bukan), tapi saya sangat bersemangat. Saya belum pernah menggunakan Copilot tapi saya sangat ingin, dan saya akan melaporkan kembali ketika saya bisa. Jika teknologi seperti ini berfungsi, "hanya Google saja" akan diganti dengan "tanyakan saja pada Kopilot".
Microsoft tidak sendiri: Google telah mengumumkan fitur serupa untuk Google Workspace , dan kedua perusahaan telah mengumumkan beberapa bentuk kerangka kerja pengembang untuk memberdayakan para insinyur untuk membuat pengalaman mereka sendiri yang didukung LLM-AI: Microsoft memiliki Semantic Kernel dan Google memiliki MakerSuite . Pada saat penulisan, Bard Google baru saja memasuki pratinjau publik . Saya belum mendengar banyak dari Amazon, Apple, atau perusahaan Teknologi Besar lainnya, tetapi ini hanya masalah waktu.
Selain itu, OpenAI menerbitkan 6 kisah pelanggan untuk GPT-4: Duolingo , Khan Academy , Government of Iceland , Stripe , Morgan Stanley , dan Be My Eyes . Kisah-kisah ini menyoroti keragaman aplikasi LLM di luar "alat chatbot" yang kami kenal. Harapkan teknologi ini mulai terintegrasi dengan cara yang semakin unik!
Jelas, banyak pemain besar di industri percaya alat chatbot baru ini akan sama revolusionernya dengan smartphone. Saya cenderung mempercayai mereka.
Itu bungkus pada bagian 1! Saya harap artikel ini membantu Anda memahami lanskap AI saat ini dan apa yang mungkin terjadi dalam waktu dekat. Jika belum, Anda dapat menggunakan ChatGPT secara gratis, coba Bing baru , atau tonton demo tanpa henti di situs web video mana pun di dekat Anda.
Terima kasih telah membaca. Apa yang ingin Anda pelajari selanjutnya? Bagaimana saya bisa membantu? Beri tahu saya di komentar!
Inilah artikel kedua dalam seri ini:
AI adalah kata kunci. Inilah kata-kata sebenarnya yang perlu diketahuiDiperbarui 8 April untuk mengklarifikasi bahwa ChatGPT adalah model dan produk.
Diperbarui 16 April untuk menambahkan subtitle.
Diperbarui 6 Mei untuk gambar unggulan yang lebih menarik (adalah otak, robot, dan emoji kepala meledak dengan latar belakang biru). Juga memperbarui kesimpulan dan mengubah "Bing baru" menjadi "Bing baru".
Perbarui 7 Mei untuk menentukan "prompt" dan menambahkan penafian "Microsoft independent".