UX neden yapay zekanın geleceği için savaş alanıdır?
Bu alanda yeni olanlar için, bulut bilgi işlemden bu yana en büyük teknolojik değişimlerden birini yaşıyoruz. Yayınlanmakta olan pek çok harika özet ve pazar haritası olduğu için bu geçişte çok fazla zaman harcamayacağım ama neler olup bittiğini özetlemek için yaptığım bir slayt var.
AI destekli uygulamaların son kambriyen patlamasını araştırırken sıklıkla ortaya çıkan bir soru savunulabilirliktir . Bunun nedeni, yatırımcıların ve kurucuların, yapay zeka modellerinin metalaştırıldığının ve dolayısıyla bir yapay zeka uygulamasındaki sinir ağının değerinin hızla düştüğünün farkında olmalarıdır.
Bu modeller, OpenAI ve Stability.ai gibi şirketler tarafından açık olarak yayınlandı . Henüz GPT-3 (OpenAI tarafından barındırılan bir model) ile oynamadıysanız, hazır modellerin neredeyse sihirli gücünü takdir edebilmeniz için kesinlikle oynamanızı tavsiye ederim. Kendi modellerinizi oluşturmak isteseniz bile, AI araştırması bilanço gücünün bir fonksiyonu haline geldiğinden, bunun artık giderek zorlaştığını belirtmekte fayda var.
NLP son on yılda çok ilerledi - LSTM ağları, bir dizinin farklı bölümlerini seçerek hatırlama veya unutma yetenekleri nedeniyle RNN'lerin performansını büyük ölçüde artırdı. Dönüştürücüler ve "dikkat mekanizması" (ölçeklendirme yasalarının yanı sıra), bu modeller dili gerçekten anlamaya başladıkça, mümkün olanda bir adım değişikliği üretti . Şimdi, Difüzyon Modelleri, her türden içeriği nasıl üretebileceğimizi yeniden şekillendiriyor. Derin öğrenmedeki atılımların rekabet avantajı oluşturmak için kullanıldığı bir durumdu, ancak bu önceden eğitilmiş modelleri açığa çıkarmada kültürel ve teknolojik bir değişim oldu ( Hugging Face'in oynayacağı büyük bir rol vardı). Geliştiriciler artık son teknoloji yapay zekayı birkaç satır kodla ürünlerine yerleştirebilirler.
Ancak herkes aynı modelleri kullanırken nasıl rekabet avantajı elde edersiniz?
Kullanıcı deneyimine sahip olun
Bu büyük modellerin gizli uzayında saklı güçleri daha yeni anlamaya başlıyoruz. Bu modellere ne kadar bağlam sağlayabilirseniz, o kadar iyi hale gelirler ve daha önce büyük miktarda sağlam mühendislik gerektiren görevlerde hızla çok iyi hale gelebilirler. Sorulacak bir soru şudur: " Bu güçlü modellerin tek arabirimi sonsuza dek basit, statik bir metin kutusu mu olacak? ”.
Tüketicilerin çoğu yapay zekanın farkında değildir, bu nedenle onları bir modelin önüne koymak, nadiren sorunlarını çözmelerine yardımcı olur. UX tasarımı, bugün yapay zeka ürünlerinde büyük ( hatta belki de en büyük ) sorundur.
Optimum bilgi istemleri için kullanıcılardan gerekli bağlamı toplamaya yardımcı olacak kapsamlı iş akışlarına odaklanılmalıdır. Ayrıca bir hendek inşa etmek için modellerin ince ayarı için geri bildirim verilerinin toplanmasına yönelik sezgisel iş akışları olmalıdır.
Üretken bir modelin "vay canına" anı ile birini ödeme yapan bir kullanıcı haline getirmek arasında büyük bir boşluk var - bu boşluğun çoğu harika bir UX ile dolduruluyor. Jasper.ai, bunu gerçekleştiren ve şimdi daha geçen yıl piyasaya sürülen 80 milyon $'a yaklaştığı söylenen bir şirkete harika bir örnek.
Kaldıraç İstemi Mühendisliği
Yapay zeka ile nasıl etkileşim kurduğumuza baktığımızda artık boş bir tuval var , bu da odağın istatistiksel modellerden ziyade Prompt Engineering'e kaymasına neden oldu. Bu, genel olarak, girdilerinizi bir modele göre tasarlamak, kolaylık, doğruluk ve maliyet için optimize etmek anlamına gelir . Birkaç örnek:
- Zero-Shot — yeni yürümeye başlayan bir çocuktan (Wikipedia'nın tamamını okumuş olan) bir şey yapmasını istiyormuşsunuz gibi doğal bir dil istemi; örneğin, girdi "görev açıklaması":{hedef metin} olacaktır. Bu açıkça AI ile etkileşim kurmanın en basit yoludur.
- Few-Shot — beklenen çıktıya birkaç örnek ve biraz bağlam ekleme (aşağıdaki resme bakın). Bu, daha fazla "mühendislik" gerektirir, ancak doğruluk konusunda büyük bir gelişme sağlayabilir . Bununla birlikte, her bir isteme bağlamın eklenmesi, çok daha pahalıya mal olabileceği anlamına gelir (bununla ilgili daha fazlası aşağıda).
- İnce Ayar — birçok (yüzlerce veya binlerce) örnek alarak ve önceden eğitilmiş bir modeli , parametreleri değiştirmek için yeniden eğiterek artık her istemde örnek eklemenize gerek kalmayacak şekilde. Bu süreç çok pahalı olabilir ve milyonlarca dolara mal olabilir, ancak bir kez bittiğinde yapılır.
Kullanım Durumuna Odaklanın
AI, Bulut veya Mobil'e benzer bir platform haline geliyor. Bu platformu oluşturmaya odaklanan birçok şirket var ve OpenAI'nin 20 milyar dolarlık değerinden de anlaşılacağı gibi, büyük miktarda değer elde edeceklerine şüphe yok. Bununla birlikte, AWS'nin dikey SaaS çözümleri oluşturmaya odaklanmamasının bir nedeni var — Apple'ın vasat Uygulamalarının da kanıtladığı gibi, hem bir platform oluşturmaya hem de bu platformda kullanım durumları oluşturmaya odaklanmak son derece zordur. Uber iş modelinin mobil cihazlar tarafından nasıl ortaya çıkarıldığına benzer şekilde, belirli yapay zeka kullanım durumlarına ve uygulamalarına odaklanmanın kilidini açacak çok büyük bir değer olduğuna inanıyoruz.
Ancak, bu iş davasına bir tutam tuzla yaklaşılmalıdır. Tam bir üründen ziyade "özellik" kovasında yer alan birçok yapay zeka kullanım durumu vardır. Kısa bir süre önce ortaklık kurduğumuz PhotoRoom , çok pratik bir AI özelliği oluşturmak için Stable Diffusion'dan yararlanan ilk şirketlerden biriydi ve şimdi büyümeyi hızlandırdı. Notion ve Microsoft gibi birçok büyük şirket artık ürünlerini geliştirmek için hazır modellerden yararlanıyor ve bu da kendi modellerinizi oluşturmak yerine kullanıcı arabirimine sahip olma ve hızlı mühendislik stratejisinin kazanıyor gibi göründüğünü daha da kanıtlıyor.
Ayrıca, bazı durumlarda modele sahip olmanın ve yapay zekayı sıfırdan oluşturmanın mantıklı olabileceğini de belirtmeliyim. Özellikle heyecan verici bir alan, Decision Transformers ve yalnızca içerik yerine eylemler oluşturmak için çığır açan model mimarisinden yararlanmaktır. Adept.ai tam da bunu yapan harika bir şirket. Bunu başka bir yazıda daha detaylı inceleyeceğim…
Model-nomics'i anlayın
OpenAI , 1000 simge (kabaca 750 kelime) başına 0,02 ABD doları ücret alıyor ve bu yaz bu yaz 0,06 ABD dolarından düştü. Az atışlı öğrenme kullanılırken, istemin %90'a kadarı "bağlam" olabilir, yani maliyetler sıfır atıştan ~10 kat daha fazla olabilir. Akıllı işletmeler, "bağlam" ve "hedef metin" oranını optimize ederek ve "hedef metin"den çıktıyı etkilemeyen sözcükleri çıkarmak gibi akıllıca şeyler yaparak avantaj elde edebilir.
Bulut üzerinde kurulan işletmelerin bulut sağlayıcıları için fiyatlandırma riski taşıması gibi, üçüncü taraf modelleri üzerine kurulu işletmelerin potansiyel olarak fiyatlandırma riski taşıdığı açıktır. Üretilen değerin, OpenAI gibi üçüncü taraf şirketler tarafından sağlanan çeviklik ve güç için ödeme yapılmasını haklı çıkarması açısından, AI'nın Cloud'un sahip olduğu dengeyi bulacağına inanıyoruz. Tanıştığımız birçok erken aşamadaki AI işletmesi, %70-80'lik bir brüt kar marjıyla çalışabiliyor ve ileriye dönük değer tekliflerini artırabildikçe bunun artacağını düşünüyoruz.
Ek olarak, bulut bilgi işlemin çoğunluğunun halihazırda derin öğrenme kullanım durumları için olduğunu belirtmekte fayda var. Bu, AI platformları için istikrarlı fiyatlandırma durumunun, çoğu işletmenin uygun göründüğü bulut bilişimin bugünkü durumuyla aynı bölgede olabileceğine işaret ediyor.
Son teknoloji (veya en azından son teknolojiye yakın ) modellerin cihaz üzerinde çalıştırılabilmesi için model genişletmeyi yakalayan gerçekçi bir işlem gücü olasılığı vardır - bu, yapay zekanın marjinal maliyetinin sıfır olma eğiliminde olduğu anlamına gelir. Stability.ai zaten bazı modellerini cihazda çalıştırabiliyor , bu da sonunda bazı görevler için marjinal maliyeti sıfıra indirebilir. Ayrıca , birçoğu modellerini açık kaynaklı hale getirmeyi seçen, sayısı giderek artan yapay zeka platformları (Cohere, AI21 vb. ) vardır . Ayrıca , model damıtma gibi maliyetleri en aza indirmenin bazı akıllı yolları olduğunu da belirtmekte fayda var .
Bu, genel fiyatlandırma güçlerini sınırlar ve araştırmalarından para kazanmak için API çağrılarına ek olarak daha yaratıcı iş modelleri bulmaları gerekebilir.
Çözüm
Pazar yeterince büyükse, temelde kullanıma hazır modeller olacak şekilde uygulamaları sıfırdan oluşturarak başlatma kesintisi için büyük bir potansiyel olduğuna inanıyoruz. Örneğin, Gong ve Otter , tescilli transkripsiyon modellerinin üzerine ürünler inşa eden iki büyük şirkettir.
Artık son teknoloji transkripsiyon modelleri açıkta olduğuna ve yapay zekanın maliyeti sıfıra düşme eğiliminde olduğuna göre, bu eşit bir oyun alanı. Bu, start-up'ların UX ve Prompt Engineering katmanına sahip olarak devasa üretkenlik pazarında değer yakalamaları için büyük bir fırsat yarattı. Yapay zekadan yararlanan bir kurucuysanız , sizinle konuşmak isteriz — [email protected] adresinden bana ulaşmaktan çekinmeyin