Нейронные сети для всех

Nov 29 2022
Мне потребовалась научная ярмарка 6-го класса, чтобы обучить свою первую за долгое время нейронную сеть. Моя семья живет в сельской местности Северной Калифорнии, где растут дубы, секвойи и другая местная флора.

Мне потребовалась научная ярмарка 6-го класса, чтобы обучить свою первую за долгое время нейронную сеть. Моя семья живет в сельской местности Северной Калифорнии, где растут дубы, секвойи и другая местная флора. Для предстоящей научной ярмарки мой сын решил построить модель машинного обучения для идентификации местных деревьев. В субботу днем ​​мы отправились в поход, чтобы сделать снимки и построить набор данных, а в субботу вечером мы работали над моделью нейронной сети. Научная ярмарка состоится через два месяца, и я подумал, что нам понадобится это время, чтобы построить достойную модель. Как оказалось, я сильно недооценил, насколько простым и доступным стало машинное обучение. Версия 1 была завершена всего за пару часов с удивительной точностью. Мы использовали тот же мощный механизм искусственного интеллекта, что и многие ведущие исследовательские лаборатории искусственного интеллекта. Мы сделали все это в браузере, и это было бесплатно.

Впервые я столкнулся с нейронными сетями на курсах по искусственному интеллекту в колледже во время так называемой зимы искусственного интеллекта в конце 90-х. Это был самый низкий уровень энтузиазма в отношении ИИ в целом и нейронных сетей в частности. Несмотря на теоретические достижения 80-х годов, коммерческое применение было ограниченным, и относительно немногие исследовательские лаборатории занимались нейронными сетями. Тем не менее, меня заинтриговали биологические подходы к ИИ, и я экспериментировал с различными подходами к обучению и приложениями. Я построил модели нейронных сетей и закодировал алгоритмы обучения в основном с нуля на лиспе .язык программирования. Обучение могло занять несколько часов, а данных об обучении было мало. На какое-то время я присоединился к лаборатории искусственного интеллекта в Калифорнийском университете в Сан-Диего, чтобы продолжить изучение нейронных сетей, но в конце концов я пошел дальше. Прошло еще 15 лет, прежде чем нейронные сети действительно взлетели, и термин « глубокое обучение » стал широко использоваться.

Интерес к глубокому обучению ускорился в период с 2012 по 2018 год.

За последнее десятилетие или около того нейронные сети пережили новое возрождение благодаря графическим процессорам, облачным вычислениям, массивным наборам данных и постоянному развитию алгоритмов обучения. Коммерческие приложения взорвались. Приложения включают распознавание речи (Siri, Alexa), перевод (Google Translate), генерацию текста (GPT-3 OpenAI), распознавание изображений (Tesla Autopilot, Adobe Sensei), генерацию изображений (Dall-E 2, Midjourney, Stable Diffusion), распознавание лиц. признание (Apple Photos), создание видео (Runway) и открытие лекарств. Некоторые из самых впечатляющих новых приложений относятся к генеративному ИИ , который развивается с ошеломляющей скоростью.

Перенесемся в прошлые выходные, посвященные Дню Благодарения, которые вызвали несколько замечаний.

Во-первых, удивительно легко настроить и обучить даже довольно сложные модели машинного обучения. Вам не нужно программировать или иметь опыт машинного обучения. Существует множество инструментов машинного обучения без кода и AutoML , которые автоматизируют стандартные этапы рабочего процесса машинного обучения. Чтобы объединить свои собственные рабочие процессы, полезно иметь базовые знания Python, популярного языка в сообществе машинного обучения. Мой 12-летний сын изучает Python около двух лет. По собственной инициативе он загрузил TensorFlow — библиотеку машинного обучения, на которой работают Google и OpenAI, — и быстро запустил образец модели на своем ноутбуке. Еще проще, я нашел учебникпо классификации изображений, которая использует TensorFlow и работает в среде Google Colab . Colab позволяет создавать модели машинного обучения в веб-браузере и бесплатно выполнять их на графических процессорах Google, вообще не загружая и не устанавливая никаких пакетов. Существует множество руководств и предварительно обученных моделей , с которых можно начать.

Во-вторых, факторами, ограничивающими скорость развертывания этой технологии, являются воображение новых реальных приложений и качественные данные для обучения моделей. Проблема распознавания типа дерева на основе изображения относится к области классификации изображений. Поскольку это распространенное применение машинного обучения, самым сложным шагом является сбор надежного набора данных. Мы не смогли найти готовый набор данных о местных деревьях, помеченных именами, поэтому создали свой собственный. Короткий поход с айфоном дал около 250 снимков. Это мизер по сегодняшним меркам. Последняя модель стабильной диффузии обучается с использованием недавно выпущенного набора данных LAION-5B из 5,85 миллиардов изображений из Интернета. По мере того, как все больше наборов данных становятся общедоступными, барьеры для разработки моделей специального назначения исчезают.

В-третьих, в настоящее время существует множество решений и ресурсов для запуска моделей машинного обучения в производство (ML Ops). Всего несколько лет назад было непросто обучить модель и развернуть ее на веб-скорости и в масштабе. Сегодня относительно просто развернуть модели в браузере, на телефоне, на сервере или в рабочем процессе предприятия.

Мы вступили в золотой век нейронных сетей. Это невероятно захватывающее время для исследователя ИИ/глубокого обучения, предпринимателя в области ИИ или студента, интересующегося ИИ. Сейчас уже готовы зрелые приложения, а также ряд новых исследований в области искусственного интеллекта, которые обеспечат инновационные приложения на долгие годы. Доступность технологии означает, что вам не нужна исследовательская лаборатория или капитал, чтобы принять участие. Удивительно, как концепция может существовать десятилетиями (например, электромобили, нейронные сети), но не развиваться до тех пор, пока не создадутся подходящие условия.