Mengapa UX adalah medan pertempuran untuk masa depan AI

Nov 25 2022
Bagi mereka yang baru mengenal ruang ini, kami sedang mengalami salah satu perubahan teknologi terbesar sejak komputasi awan. Saya tidak akan menghabiskan terlalu banyak waktu pada shift ini karena ada banyak ringkasan bagus dan peta pasar yang diterbitkan, tetapi inilah slide yang saya buat untuk meringkas apa yang sedang terjadi.

Bagi mereka yang baru mengenal ruang ini, kami sedang mengalami salah satu perubahan teknologi terbesar sejak komputasi awan. Saya tidak akan menghabiskan terlalu banyak waktu pada shift ini karena ada banyak ringkasan bagus dan peta pasar yang diterbitkan, tetapi inilah slide yang saya buat untuk meringkas apa yang sedang terjadi.

Satu pertanyaan yang sering muncul saat menjelajahi ledakan kambrium baru-baru ini dari aplikasi bertenaga AI adalah defensibilitas . Ini karena investor dan pendiri sangat menyadari bahwa model AI menjadi komoditas sehingga nilai jaringan saraf dalam aplikasi AI cepat menurun.

Model ini telah dirilis secara terbuka oleh perusahaan seperti OpenAI dan Stability.ai . Jika Anda belum pernah bermain-main dengan GPT-3 (model yang dihosting oleh OpenAI), saya sangat menyarankan Anda melakukannya, sehingga Anda dapat menghargai kekuatan ajaib dari model off-the-shelf. Perlu dicatat bahwa bahkan jika Anda ingin membuat model sendiri, sekarang menjadi semakin sulit, karena penelitian AI menjadi fungsi dari kekuatan neraca.

NLP telah berkembang pesat dalam dekade terakhir - jaringan LSTM sangat meningkatkan kinerja RNN, karena kemampuannya untuk mengingat atau melupakan bagian urutan yang berbeda secara selektif. Transformers dan "mekanisme perhatian" (bersama hukum penskalaan) kemudian menghasilkan langkah-perubahan dalam apa yang mungkin karena model ini mulai benar-benar memahami bahasa. Sekarang, Model Difusi sedang membentuk kembali bagaimana kita dapat menghasilkan konten dari semua bentuk. Dulu terobosan dalam pembelajaran mendalam digunakan untuk membangun keunggulan kompetitif, namun, telah terjadi pergeseran budaya dan teknologi ( Hugging Face memiliki peran besar) dalam menempatkan model pra-pelatihan ini ke tempat terbuka. Pengembang sekarang dapat menyematkan AI canggih ke dalam produk mereka dengan beberapa baris kode.

Tapi bagaimana Anda membangun keunggulan kompetitif saat semua orang menggunakan model yang sama?

Miliki UX

Kami baru mulai memahami kekuatan yang tersembunyi di dalam ruang laten model besar ini. Semakin banyak konteks yang dapat Anda berikan untuk model ini, semakin baik mereka dapatkan dan mereka dapat dengan cepat menjadi sangat baik dalam tugas-tugas yang sebelumnya membutuhkan sejumlah besar rekayasa yang kuat. Satu pertanyaan untuk ditanyakan adalah “ Apakah satu-satunya antarmuka untuk model canggih ini akan selamanya menjadi kotak teks statis yang sederhana? ”.

Sebagian besar konsumen sangat tidak sadar akan AI sehingga hanya menempatkan mereka di depan model akan sangat jarang membantu mereka dalam memecahkan masalah mereka. Desain UX adalah masalah besar ( dan bahkan mungkin yang terbesar ) dalam produk AI saat ini.

Harus ada fokus pada alur kerja komprehensif untuk membantu mengumpulkan konteks yang diperlukan dari pengguna untuk petunjuk yang optimal. Harus ada juga alur kerja yang intuitif untuk mengumpulkan data umpan balik guna menyempurnakan model guna membangun parit lebih lanjut.

Ada celah besar antara momen "wow" dari model generatif dan membuat seseorang menjadi pengguna berbayar — sebagian besar celah ini diisi dengan UX yang bagus. Jasper.ai adalah contoh bagus dari perusahaan yang telah melaksanakan hal ini dan sekarang dikabarkan mendekati $80 juta ARR, karena baru diluncurkan tahun lalu.

Memanfaatkan Rekayasa Cepat

Sekarang ada kanvas kosong saat melihat bagaimana kami berinteraksi dengan AI, yang telah menyebabkan pergeseran fokus ke Prompt Engineering daripada model statistik. Ini secara luas berarti merekayasa input Anda ke model, mengoptimalkan kemudahan, akurasi, dan biaya . Beberapa contohnya adalah:

  • Zero-Shot — permintaan bahasa alami seolah-olah Anda meminta balita (yang membaca sebagian besar keseluruhan Wikipedia) untuk melakukan sesuatu, misalnya inputnya adalah "task description":{target text}. Ini jelas merupakan cara paling sederhana untuk berinteraksi dengan AI.
  • Sedikit Pemotretan — menambahkan beberapa contoh dan beberapa konteks pada keluaran yang diharapkan (lihat gambar di bawah). Ini membutuhkan lebih banyak "rekayasa" tetapi dapat meningkatkan akurasi secara besar-besaran . Namun, penambahan konteks ke dalam setiap prompt berarti harganya bisa lebih mahal (lebih lanjut tentang ini di bawah).
  • Penyempurnaan — mengambil banyak (ratusan atau ribuan) contoh dan melatih ulang model yang telah dilatih sebelumnya untuk mengubah parameter sehingga Anda tidak perlu lagi menyertakan contoh di setiap prompt. Proses ini bisa sangat mahal dan dapat menelan biaya $ juta tetapi setelah selesai, selesai.
Sumber: OpenAI — Model Bahasa adalah Sedikit Pembelajar

Fokus pada kasus penggunaan

AI menjadi platform, mirip dengan Cloud atau Seluler. Ada banyak perusahaan yang fokus membangun platform itu dan tidak diragukan lagi bahwa mereka akan memperoleh nilai yang sangat besar, dibuktikan dengan penilaian OpenAI sebesar $20 miliar. Namun, ada alasan mengapa AWS tidak fokus membangun solusi SaaS vertikal — sangat sulit untuk berfokus pada membangun platform dan membangun kasus penggunaan pada platform tersebut, yang selanjutnya dibuktikan oleh Aplikasi Apple yang biasa-biasa saja. Kami yakin bahwa ada nilai yang sangat besar untuk dibuka kuncinya dengan berfokus pada kasus penggunaan dan aplikasi AI tertentu, serupa dengan bagaimana model bisnis Uber dibuka kuncinya melalui perangkat seluler.

Namun, kasus bisnis ini harus diambil dengan sedikit garam. Ada banyak kasus penggunaan AI yang lebih banyak berada di dalam ember "fitur", daripada produk lengkap. PhotoRoom , yang baru-baru ini bermitra dengan kami, adalah salah satu perusahaan pertama yang memanfaatkan Stable Diffusion dalam membangun fitur AI yang sangat praktis dan kini telah mempercepat pertumbuhan. Banyak perusahaan besar, seperti Notion dan Microsoft , sekarang memanfaatkan model siap pakai untuk peningkatan produk mereka yang lebih lanjut membuktikan bahwa strategi memiliki UI dan rekayasa cepat daripada membangun model Anda sendiri tampaknya lebih unggul.

Saya juga harus memperingatkan bahwa dalam beberapa keadaan masuk akal untuk memiliki model dan membangun AI dari bawah ke atas. Salah satu area yang sangat menarik adalah dalam Decision Transformers dan memanfaatkan arsitektur model terobosan untuk menghasilkan tindakan, bukan hanya konten. Adept.ai adalah perusahaan luar biasa yang melakukan hal ini. Saya akan mengeksplorasi ini lebih jauh di posting lain…

Memahami Model-nomics

OpenAI mengenakan biaya $0,02 per 1000 token (kira-kira 750 kata) dan ini turun dari $0,06 musim panas ini. Saat menggunakan pembelajaran beberapa langkah, hingga 90% prompt dapat berupa "konteks" yang berarti biaya bisa ~10x lipat biaya zero-shot. Bisnis cerdas dapat membangun keunggulan dengan mengoptimalkan rasio "konteks" vs "teks target" dan melakukan hal-hal cerdas seperti menghapus kata apa pun dari "teks target" yang tidak memengaruhi hasil.

Jelas bahwa bisnis yang dibangun di atas model pihak ketiga berpotensi memiliki risiko harga dengan cara yang sama seperti bisnis yang dibangun di Cloud memiliki risiko harga bagi penyedia cloud. Kami percaya bahwa AI akan menemukan keseimbangan yang sama dengan yang dimiliki Cloud, di mana nilai yang dihasilkan membenarkan pembayaran untuk kelincahan dan kekuatan yang disediakan oleh perusahaan pihak ketiga seperti OpenAI. Banyak bisnis AI tahap awal yang kami temui dapat beroperasi dengan margin kotor 70–80% dan menurut kami ini akan meningkat karena mereka dapat meningkatkan proposisi nilainya ke depan.

Selain itu, perlu dicatat bahwa sebagian besar komputasi awan sudah digunakan untuk kasus penggunaan pembelajaran mendalam. Ini menandakan bahwa penetapan harga yang stabil untuk platform AI mungkin berada di wilayah yang sama dengan cloud computing saat ini, yang tampaknya cocok untuk sebagian besar bisnis.

Ada kemungkinan realistis daya komputasi mengejar ekspansi model sehingga model canggih (atau setidaknya mendekati canggih) dapat dijalankan di perangkat — ini berarti biaya marjinal AI cenderung nol. Stability.ai sudah dapat menjalankan beberapa model mereka di perangkat , yang pada akhirnya dapat menurunkan biaya marjinal menjadi nol untuk beberapa tugas. Ada juga semakin banyak platform AI ( Cohere , AI21 dll…), banyak di antaranya memilih untuk membuka sumber model mereka. Perlu juga disebutkan bahwa ada beberapa cara cerdas untuk meminimalkan biaya , seperti distilasi model.

Ini membatasi kekuatan harga mereka secara keseluruhan dan mereka mungkin harus membuat model bisnis yang lebih kreatif, selain panggilan API, untuk memonetisasi penelitian mereka.

Kesimpulan

Jika pasarnya cukup besar, kami yakin ada potensi besar untuk gangguan start-up dengan membangun aplikasi dari bawah ke atas, dengan model siap pakai sebagai intinya. Misalnya, Gong dan Otter adalah dua perusahaan hebat yang telah membangun produk di atas model transkripsi berpemilik.

Sekarang model transkripsi canggih sudah terbuka dan biaya AI cenderung nol, ini adalah bidang permainan yang setara. Ini telah membuka peluang besar bagi perusahaan baru untuk menangkap nilai di pasar produktivitas yang masif dengan memiliki lapisan UX dan Teknik Prompt. Jika Anda seorang pendiri yang memanfaatkan AI, kami ingin berbicara dengan Anda — jangan ragu untuk menghubungi saya di [email protected]

Apa itu posting blog AI tanpa gambar yang dihasilkan oleh AI yang diminta oleh judul (DALL.E 2)