Почему UX — это поле битвы за будущее ИИ
Для тех, кто плохо знаком с этой областью, мы переживаем один из самых больших технологических сдвигов со времен облачных вычислений. Я не буду тратить слишком много времени на этот сдвиг, так как публикуется много отличных сводок и карт рынка , но вот слайд, который я сделал, чтобы обобщить то, что происходит.
Один вопрос, который часто возникает при изучении недавнего кембрийского взрыва приложений на основе ИИ, — это защита . Это связано с тем, что инвесторы и основатели хорошо осведомлены о том, что модели ИИ становятся товаром, поэтому ценность нейронной сети в приложении ИИ быстро снижается.
Эти модели были выпущены в открытом доступе такими компаниями, как OpenAI и Stability.ai . Если вы еще не пробовали GPT-3 (модель, поддерживаемая OpenAI), я настоятельно рекомендую вам это сделать, чтобы вы могли оценить почти волшебную силу готовых моделей. Стоит отметить, что даже если вы хотите построить свои собственные модели, сейчас это становится все труднее, поскольку исследования ИИ становятся функцией силы баланса.
NLP сильно продвинулся за последнее десятилетие — сети LSTM значительно повысили производительность RNN благодаря их способности выборочно запоминать или забывать разные части последовательности. Трансформаторы и «механизм внимания» (наряду с законами масштабирования) привели к резкому изменению того, что было возможно, поскольку эти модели начали по-настоящему понимать язык. Теперь модели распространения меняют то, как мы можем генерировать контент всех форм. Раньше прорывы в глубоком обучении использовались для создания конкурентного преимущества, однако произошел культурный и технологический сдвиг ( большую роль сыграла Hugging Face ), когда эти предварительно обученные модели были выставлены на всеобщее обозрение. Теперь разработчики могут внедрять в свои продукты передовой ИИ с помощью нескольких строк кода.
Но как создать конкурентное преимущество, если все используют одни и те же модели?
Владейте UX
Мы только начинаем понимать силы, скрытые в скрытом пространстве этих больших моделей. Чем больше контекста вы можете предоставить этим моделям, тем лучше они становятся, и они могут быстро стать очень хорошими для задач , которые ранее требовали огромного количества надежной инженерии. Один вопрос, который следует задать: « Останется ли единственным интерфейсом этих мощных моделей всегда простое статическое текстовое поле? ».
Большинство потребителей совершенно не осведомлены об ИИ, поэтому простое размещение их перед моделью очень редко поможет им решить их проблему. UX-дизайн — большая ( и, возможно, даже самая большая ) проблема в продуктах ИИ сегодня.
Необходимо сосредоточить внимание на комплексных рабочих процессах, чтобы помочь собрать необходимый контекст от пользователей для оптимальных подсказок. Также должны быть интуитивно понятные рабочие процессы для сбора данных обратной связи для точной настройки моделей для дальнейшего создания рва.
Существует большой разрыв между моментом «вау» генеративной модели и превращением кого-то в платного пользователя — большая часть этого разрыва заполнена отличным UX. Jasper.ai — отличный пример компании, которая реализовала это и, по слухам , приближается к $80 млн ARR, запустившись только в прошлом году.
Используйте подсказку
Теперь при взгляде на то, как мы взаимодействуем с ИИ, остается чистый холст, что привело к смещению акцента на оперативное проектирование, а не на статистические модели. В широком смысле это означает проектирование вашего вклада в модель, оптимизацию для простоты, точности и стоимости . Вот несколько примеров:
- Zero-Shot — подсказка на естественном языке, как если бы вы просили малыша (который прочитал почти всю Википедию) что-то сделать, например, входными данными было бы «описание задачи»: {целевой текст}. Очевидно, это самый простой способ взаимодействия с ИИ.
- Few-Shot — добавление нескольких примеров и некоторого контекста ожидаемого результата (см. изображение ниже). Это требует большего «инженерного подхода», но может значительно улучшить точность . Однако добавление контекста в каждое приглашение означает, что это может стоить намного дороже (подробнее об этом ниже).
- Точная настройка — использование множества (сотни или тысячи) примеров и повторное обучение предварительно обученной модели для изменения параметров таким образом, что вам больше не нужно включать примеры в каждое приглашение. Этот процесс может быть очень дорогим и может стоить миллионы долларов, но как только это будет сделано, это будет сделано.
Сосредоточьтесь на прецеденте
ИИ становится платформой, похожей на облачную или мобильную. Есть много компаний, сосредоточенных на создании этой платформы, и нет сомнений, что они получат огромную прибыль, о чем свидетельствует оценка OpenAI в 20 миллиардов долларов. Однако есть причина, по которой AWS не сосредотачивается на создании вертикальных решений SaaS — чрезвычайно сложно сосредоточиться как на создании платформы, так и на создании сценариев использования на этой платформе, о чем еще раз свидетельствуют посредственные приложения Apple. Мы считаем, что сосредоточение внимания на конкретных случаях использования и приложениях ИИ может принести огромную пользу, подобно тому, как бизнес-модель Uber была раскрыта мобильными устройствами.
Однако к этому бизнес-кейсу следует относиться с долей скептицизма. Есть много вариантов использования ИИ, которые в большей степени относятся к категории «функций», а не к полноценному продукту. PhotoRoom , с которой мы недавно установили партнерские отношения, была одной из первых компаний, которые использовали Stable Diffusion для создания очень практичной функции искусственного интеллекта, и в настоящее время она ускорила рост. Многие крупные корпорации, такие как Notion и Microsoft , в настоящее время используют готовые модели для улучшения своих продуктов, что еще раз свидетельствует о том, что стратегия владения пользовательским интерфейсом и быстрой разработки, а не создания собственных моделей, кажется выигрышной.
Я также должен предостеречь, что в некоторых обстоятельствах может иметь смысл владеть моделью и создавать ИИ с нуля. Одной из особенно захватывающих областей являются преобразователи решений и использование революционной архитектуры модели для создания действий, а не только контента. Adept.ai — замечательная компания, которая занимается именно этим. Я рассмотрю это подробнее в другом посте…
Понимание модели-номики
OpenAI взимает 0,02 доллара за 1000 токенов (примерно 750 слов), а этим летом она снизилась с 0,06 доллара. При использовании обучения с несколькими выстрелами до 90% подсказок могут быть «контекстными», что означает, что затраты могут быть примерно в 10 раз выше, чем при нулевом выстреле. Умные компании могут получить преимущество, оптимизируя соотношение «контекст» и «целевой текст» и делая умные вещи, такие как удаление любых слов из «целевого текста», которые не влияют на результат.
Понятно, что компании, построенные на сторонних моделях, потенциально подвержены риску ценообразования точно так же, как компании, построенные в облаке, подвержены риску ценообразования для облачных провайдеров. Мы считаем, что ИИ найдет тот же баланс, что и облако, в том смысле, что создаваемая ценность оправдывает оплату гибкости и мощности, предоставляемых сторонними компаниями, такими как OpenAI. Многие предприятия ИИ на ранних стадиях, с которыми мы встречались, могут работать с валовой прибылью в 70–80%, и мы думаем, что она будет увеличиваться, поскольку они смогут увеличить свое ценностное предложение в будущем.
Кроме того, стоит отметить, что большая часть облачных вычислений уже используется для глубокого обучения. Это сигнализирует о том, что стабильное состояние цен на платформы ИИ может быть в том же регионе, что и облачные вычисления сегодня, что, похоже, устраивает большинство предприятий.
Существует реальная вероятность того, что вычислительная мощность достигнет уровня расширения модели, так что самые современные (или, по крайней мере , почти самые современные) модели можно будет запускать на устройстве — это будет означать, что предельные затраты на ИИ стремятся к нулю. Stability.ai уже может запускать некоторые из своих моделей на устройстве , что в конечном итоге может снизить предельные затраты до нуля для некоторых задач. Также растет число платформ ИИ ( Cohere , AI21 и т. д.), многие из которых предпочитают открывать свои модели с открытым исходным кодом. Также стоит упомянуть, что есть несколько разумных способов минимизировать затраты , например, дистилляция модели.
Это ограничивает их общую способность ценообразования, и им, возможно, придется придумать более творческие бизнес-модели в дополнение к вызовам API, чтобы монетизировать свои исследования.
Заключение
Если рынок достаточно велик, мы считаем, что существует огромный потенциал для прорыва стартапов за счет создания приложений с нуля, в основе которых лежат готовые модели. Например, Gong и Otter — две замечательные компании, которые создали продукты на основе проприетарных моделей транскрипции.
Теперь, когда передовые модели транскрипции открыты, а стоимость ИИ стремится к нулю, это равные условия игры. Это открыло огромные возможности для стартапов, чтобы получить прибыль на огромном рынке производительности, владея уровнем UX и Prompt Engineering. Если вы являетесь основателем, использующим ИИ, мы будем рады поговорить с вами — не стесняйтесь обращаться ко мне по адресу [email protected].
