Машинное обучение - Краткое руководство

Сегодняшний искусственный интеллект (ИИ) намного превзошел ажиотаж вокруг блокчейна и квантовых вычислений. Это связано с тем, что огромные вычислительные ресурсы легко доступны обычному человеку. Теперь разработчики используют это преимущество при создании новых моделей машинного обучения и для повторного обучения существующих моделей для повышения производительности и результатов. Легкая доступность высокопроизводительных вычислений (HPC) привела к внезапному увеличению спроса на ИТ-специалистов, обладающих навыками машинного обучения.

В этом руководстве вы подробно узнаете о -

В чем суть машинного обучения?

  • Какие бывают типы машинного обучения?

  • Какие существуют различные алгоритмы для разработки моделей машинного обучения?

  • Какие инструменты доступны для разработки этих моделей?

  • Какие есть варианты языков программирования?

  • Какие платформы поддерживают разработку и развертывание приложений машинного обучения?

  • Какие IDE (интегрированная среда разработки) доступны?

  • Как быстро повысить квалификацию в этой важной сфере?

Когда вы отмечаете лицо на фотографии в Facebook, именно ИИ работает за кадром и идентифицирует лица на изображении. Теги лиц теперь повсеместно присутствуют в нескольких приложениях, отображающих изображения с человеческими лицами. Почему только человеческие лица? Есть несколько приложений, которые обнаруживают объекты, такие как кошки, собаки, бутылки, автомобили и т. Д. У нас есть автономные автомобили, которые бегают по нашим дорогам и обнаруживают объекты в реальном времени, чтобы управлять автомобилем. Когда вы путешествуете, вы пользуетесь GoogleDirectionsчтобы узнать о ситуации на дорогах в режиме реального времени и выбрать лучший путь, предложенный Google на тот момент. Это еще одна реализация метода обнаружения объектов в реальном времени.

Рассмотрим на примере Google Translateприложение, которое мы обычно используем во время посещения зарубежных стран. Приложение онлайн-переводчика Google на вашем мобильном телефоне поможет вам общаться с местными жителями, говорящими на чужом для вас языке.

Есть несколько приложений ИИ, которые мы используем практически сегодня. Фактически, каждый из нас использует ИИ во многих сферах нашей жизни, даже без нашего ведома. Сегодняшний ИИ может выполнять чрезвычайно сложные задачи с большой точностью и скоростью. Давайте обсудим пример сложной задачи, чтобы понять, какие возможности ожидаются от приложения ИИ, которое вы бы сегодня разрабатывали для своих клиентов.

пример

Мы все пользуемся Google Directionsво время нашей поездки в любую точку города для ежедневных поездок на работу или даже для междугородних поездок. Приложение Google Directions предлагает самый быстрый путь к месту назначения на данный момент. Следуя по этому пути, мы заметили, что Google почти на 100% прав в своих предложениях, и мы экономим свое драгоценное время в поездке.

Вы можете себе представить сложность, связанную с разработкой такого типа приложения, учитывая, что существует несколько путей к пункту назначения, и приложение должно оценивать дорожную ситуацию на каждом возможном пути, чтобы дать вам оценку времени в пути для каждого такого пути. Кроме того, учтите, что Google Directions охватывает весь земной шар. Несомненно, многие методы ИИ и машинного обучения используются под капотами таких приложений.

Учитывая постоянный спрос на разработку таких приложений, теперь вы поймете, почему внезапно возник спрос на ИТ-специалистов с навыками искусственного интеллекта.

В следующей главе мы узнаем, что нужно для разработки программ ИИ.

Путешествие искусственного интеллекта началось в 1950-х годах, когда вычислительные мощности были незначительны по сравнению с сегодняшними. ИИ начал с предсказаний, сделанных машиной, как статистик делает предсказания с помощью своего калькулятора. Таким образом, изначально вся разработка ИИ была основана в основном на статистических методах.

В этой главе давайте подробно обсудим, что это за статистические методы.

Статистические методы

Разработка современных приложений ИИ началась с использования устаревших традиционных статистических методов. Вы, должно быть, использовали прямую интерполяцию в школах, чтобы предсказать будущее значение. Есть несколько других таких статистических методов, которые успешно применяются при разработке так называемых программ ИИ. Мы говорим «так называемые», потому что программы ИИ, которые у нас есть сегодня, намного сложнее и используют методы, выходящие за рамки статистических методов, используемых в ранних программах ИИ.

Некоторые из примеров статистических методов, которые использовались для разработки приложений ИИ в те дни и все еще применяются на практике, перечислены здесь.

  • Regression
  • Classification
  • Clustering
  • Теории вероятностей
  • Деревья решений

Здесь мы перечислили лишь некоторые основные приемы, которых достаточно, чтобы начать работу с ИИ, не пугая вас масштабами, которые требует ИИ. Если вы разрабатываете приложения AI на основе ограниченных данных, вы должны использовать эти статистические методы.

Однако на сегодняшний день данных предостаточно. Для анализа огромных данных, которыми мы располагаем, статистические методы не очень полезны, поскольку они имеют некоторые собственные ограничения. Поэтому для решения многих сложных проблем разрабатываются более продвинутые методы, такие как глубокое обучение.

По мере продвижения в этом руководстве мы поймем, что такое машинное обучение и как оно используется для разработки таких сложных приложений ИИ.

Рассмотрим следующий рисунок, на котором показан график зависимости цен на дом от его размера в квадратных футах.

После нанесения различных точек данных на график XY, мы рисуем линию, которая лучше всего подходит для наших прогнозов для любого другого дома с учетом его размера. Вы передадите в машину известные данные и попросите его найти наиболее подходящую линию. Как только машина найдет наиболее подходящую линию, вы протестируете ее на пригодность, загрузив птичник известного размера, т. Е. Значение Y на приведенной выше кривой. Теперь машина вернет предполагаемое значение X, то есть ожидаемую цену дома. Диаграмма может быть экстраполирована, чтобы узнать цену дома площадью 3000 кв. Футов или даже больше. В статистике это называется регрессией. В частности, этот вид регрессии называется линейной регрессией, поскольку связь между точками данных X и Y является линейной.

Во многих случаях связь между точками данных X и Y может быть не прямой линией, а кривой со сложным уравнением. Теперь ваша задача будет заключаться в том, чтобы найти наиболее подходящую кривую, которую можно экстраполировать для предсказания будущих значений. Один из таких графиков применения показан на рисунке ниже.

Источник:

https://upload.wikimedia.org/wikipedia/commons/c/c9/

Вы будете использовать методы статистической оптимизации, чтобы найти здесь уравнение для кривой наилучшего соответствия. И именно в этом суть машинного обучения. Вы используете известные методы оптимизации, чтобы найти лучшее решение вашей проблемы.

Затем давайте рассмотрим различные категории машинного обучения.

Машинное обучение подразделяется на следующие категории:

Машинное обучение развивалось слева направо, как показано на диаграмме выше.

  • Первоначально исследователи начали с контролируемого обучения. Это уже обсуждавшийся ранее случай прогнозирования цен на жилье.

  • За этим последовало обучение без учителя, при котором машина учится сама по себе без какого-либо контроля.

  • Ученые далее обнаружили, что может быть хорошей идеей вознаградить машину, если она выполняет свою работу ожидаемым образом, и наступило обучение с подкреплением.

  • Очень скоро данные, доступные в наши дни, стали настолько огромными, что традиционные методы, разработанные до сих пор, не смогли проанализировать большие данные и дать нам прогнозы.

  • Таким образом, пришло глубокое обучение, при котором человеческий мозг моделируется в искусственных нейронных сетях (ИНС), созданных в наших двоичных компьютерах.

  • Теперь машина обучается сама, используя доступную сегодня высокую вычислительную мощность и огромные ресурсы памяти.

  • Сейчас наблюдается, что глубокое обучение решило многие из ранее неразрешимых проблем.

  • В настоящее время эта техника получила дальнейшее развитие, благодаря поощрению сетей глубокого обучения в качестве наград, и, наконец, наступило глубокое обучение с подкреплением.

Давайте теперь изучим каждую из этих категорий более подробно.

Контролируемое обучение

Обучение с учителем аналогично обучению ребенка ходить. Вы будете держать ребенка за руку, показывать ему, как ставить ногу вперед, ходить самостоятельно для демонстрации и так далее, пока ребенок не научится ходить самостоятельно.

Регресс

Точно так же в случае обучения с учителем вы даете компьютеру конкретные известные примеры. Вы говорите, что для данного значения функции x1 на выходе будет y1, для x2 это y2, для x3 это y3 и так далее. Основываясь на этих данных, вы позволяете компьютеру вычислить эмпирическую связь между x и y.

Как только машина обучена таким образом с достаточным количеством точек данных, теперь вы должны попросить машину предсказать Y для данного X. Предполагая, что вы знаете реальное значение Y для этого данного X, вы сможете вывести верен ли прогноз машины.

Таким образом, вы проверите, обучилась ли машина, используя известные тестовые данные. Когда вы убедитесь, что машина способна делать прогнозы с желаемым уровнем точности (скажем, от 80 до 90%), вы можете прекратить дальнейшее обучение машины.

Теперь вы можете безопасно использовать машину для прогнозирования неизвестных точек данных или попросить машину предсказать Y для данного X, для которого вы не знаете реальное значение Y. Это обучение проходит в рамках регрессии, о которой мы говорили. ранее.

Классификация

Вы также можете использовать методы машинного обучения для решения задач классификации. В задачах классификации вы классифицируете объекты схожей природы в одну группу. Например, в наборе из 100 учеников вы можете сгруппировать их в три группы в зависимости от их роста: короткие, средние и длинные. Измеряя рост каждого ученика, вы поместите его в соответствующую группу.

Теперь, когда приходит новый ученик, вы помещаете его в соответствующую группу, измеряя его рост. Следуя принципам регрессионного обучения, вы научите тренажер классифицировать ученика по его характеристике - росту. Когда машина узнает, как формируются группы, она сможет правильно классифицировать любого неизвестного нового ученика. Еще раз, вы должны использовать тестовые данные, чтобы убедиться, что машина изучила вашу технику классификации, прежде чем запускать разработанную модель в производство.

Обучение с учителем - вот где ИИ действительно начал свой путь. Этот прием успешно применялся в нескольких случаях. Вы использовали эту модель при распознавании рукописного текста на своем компьютере. Для обучения с учителем было разработано несколько алгоритмов. Вы узнаете о них в следующих главах.

Неконтролируемое обучение

При обучении без учителя мы не указываем машине целевую переменную, а спрашиваем машину: «Что вы можете сказать мне о X?». В частности, мы можем задать вопросы, например, учитывая огромный набор данных X: «Какие пять лучших групп мы можем составить из X?» или «Какие функции чаще всего встречаются вместе в X?». Чтобы получить ответы на такие вопросы, вы можете понять, что количество точек данных, которые потребуются машине для вывода стратегии, будет очень большим. В случае обучения с учителем машину можно обучить даже с несколькими тысячами точек данных. Однако в случае обучения без учителя количество точек данных, которые разумно принимаются для обучения, начинается с нескольких миллионов. В наши дни данных, как правило, предостаточно. В идеале данные требуют кураторства. Тем не менее, объем данных, которые постоянно передаются в социальной сети, в большинстве случаев является невыполнимой задачей.

На следующем рисунке показана граница между желтыми и красными точками, определенная с помощью машинного обучения без учителя. Вы можете ясно видеть, что машина сможет определить класс каждой из черных точек с довольно хорошей точностью.

Источник:

https://chrisjmccormick.files.wordpress.com/2013/08/approx_decision_boun dary.png

Обучение без учителя показало большой успех во многих современных приложениях искусственного интеллекта, таких как обнаружение лиц, обнаружение объектов и т. Д.

Обучение с подкреплением

Подумайте о том, чтобы дрессировать собаку, мы обучаем нашего питомца приносить нам мяч. Кидаем мяч на определенное расстояние и просим собаку вернуть его нам. Каждый раз, когда собака делает это правильно, мы награждаем собаку. Постепенно собака узнает, что правильное выполнение работы дает ей вознаграждение, и тогда собака начинает выполнять ее правильно каждый раз в будущем. Именно это понятие применяется в обучении типа «подкрепление». Изначально эта техника была разработана для игровых автоматов. Машине дан алгоритм анализа всех возможных ходов на каждом этапе игры. Машина может выбрать одно из ходов наугад. Если ход правильный, машина награждается, в противном случае она может быть оштрафована. Постепенно машина начнет различать правильные и неправильные ходы и после нескольких итераций научится решать головоломку с большей точностью. Точность выигрыша в игре повысится, поскольку автомат будет играть все больше и больше игр.

Весь процесс можно изобразить на следующей диаграмме -

Этот метод машинного обучения отличается от обучения с учителем тем, что вам не нужно указывать помеченные пары ввода / вывода. Основное внимание уделяется поиску баланса между изучением новых решений и использованием изученных решений.

Глубокое обучение

Глубокое обучение - это модель, основанная на искусственных нейронных сетях (ИНС), а точнее на сверточных нейронных сетях (CNN). В глубоком обучении используется несколько архитектур, таких как глубокие нейронные сети, сети глубоких убеждений, рекуррентные нейронные сети и сверточные нейронные сети.

Эти сети успешно применяются для решения задач компьютерного зрения, распознавания речи, обработки естественного языка, биоинформатики, дизайна лекарств, анализа медицинских изображений и игр. Есть несколько других областей, в которых активно применяется глубокое обучение. Глубокое обучение требует огромной вычислительной мощности и огромных данных, которые в наши дни обычно легко доступны.

Мы поговорим о глубоком обучении более подробно в следующих главах.

Глубокое обучение с подкреплением

Глубокое обучение с подкреплением (DRL) сочетает в себе методы как глубокого обучения, так и обучения с подкреплением. Алгоритмы обучения с подкреплением, такие как Q-Learning, теперь объединены с глубоким обучением для создания мощной модели DRL. Этот метод имел большой успех в области робототехники, видеоигр, финансов и здравоохранения. Многие ранее не решаемые проблемы теперь решаются созданием моделей ДХО. В этой области ведется множество исследований, которые очень активно проводятся в различных отраслях.

Итак, у вас есть краткое введение в различные модели машинного обучения, а теперь давайте немного глубже исследуем различные алгоритмы, доступные в этих моделях.

Обучение с учителем - одна из важных моделей обучения, задействованных в обучающих машинах. В этой главе подробно рассказывается о том же.

Алгоритмы контролируемого обучения

Для обучения с учителем доступно несколько алгоритмов. Некоторые из широко используемых алгоритмов обучения с учителем показаны ниже -

  • k-Ближайшие соседи
  • Деревья решений
  • Наивный байесовский
  • Логистическая регрессия
  • Машины опорных векторов

По мере продвижения в этой главе давайте подробно обсудим каждый из алгоритмов.

k-Ближайшие соседи

Метод k-ближайших соседей, который просто называют kNN, представляет собой статистический метод, который можно использовать для решения задач классификации и регрессии. Обсудим случай классификации неизвестного объекта с помощью kNN. Рассмотрим распределение объектов, как показано на изображении ниже -

Источник:

https://en.wikipedia.org/wiki/K-nearest_neighbors_algorithm

На схеме показаны три типа объектов, отмеченные красным, синим и зеленым цветами. Когда вы запускаете классификатор kNN для вышеуказанного набора данных, границы для каждого типа объекта будут отмечены, как показано ниже -

Источник:

https://en.wikipedia.org/wiki/K-nearest_neighbors_algorithm

Теперь рассмотрим новый неизвестный объект, который вы хотите классифицировать как красный, зеленый или синий. Это показано на рисунке ниже.

Как вы видите визуально, неизвестная точка данных принадлежит к классу синих объектов. Математически это можно сделать, измерив расстояние от этой неизвестной точки до любой другой точки в наборе данных. Когда вы это сделаете, вы узнаете, что большинство его соседей имеют синий цвет. Среднее расстояние до красных и зеленых объектов определенно будет больше, чем среднее расстояние до синих объектов. Таким образом, этот неизвестный объект можно отнести к синему классу.

Алгоритм kNN также можно использовать для задач регрессии. Алгоритм kNN доступен в виде готового к использованию в большинстве библиотек ML.

Деревья решений

Простое дерево решений в формате блок-схемы показано ниже -

Вы должны написать код для классификации ваших входных данных на основе этой блок-схемы. Блок-схема очевидна и тривиальна. В этом сценарии вы пытаетесь классифицировать входящее электронное письмо, чтобы решить, когда его читать.

В действительности деревья решений могут быть большими и сложными. Для создания и обхода этих деревьев доступно несколько алгоритмов. Как энтузиаст машинного обучения, вам необходимо понять и освоить эти методы создания деревьев решений и их обхода.

Наивный байесовский

Наивный байесовский метод используется для создания классификаторов. Предположим, вы хотите отсортировать (классифицировать) фрукты разных видов из корзины с фруктами. Вы можете использовать такие характеристики, как цвет, размер и форма плода. Например, любой фрукт красного цвета, округлой формы и диаметром около 10 см может считаться яблоком. Итак, чтобы обучить модель, вы должны использовать эти функции и проверить вероятность того, что данная функция соответствует желаемым ограничениям. Затем вероятности различных характеристик объединяются, чтобы получить вероятность того, что данный фрукт является яблоком. Наивный байесовский метод обычно требует небольшого количества обучающих данных для классификации.

Логистическая регрессия

Взгляните на следующую диаграмму. Он показывает распределение точек данных в плоскости XY.

На диаграмме мы можем визуально проверить, насколько красные точки отделяются от зеленых. Вы можете провести граничную линию, чтобы отделить эти точки. Теперь, чтобы классифицировать новую точку данных, вам просто нужно определить, на какой стороне линии расположена точка.

Машины опорных векторов

Посмотрите на следующее распределение данных. Здесь три класса данных нельзя разделить линейно. Граничные кривые нелинейны. В таком случае поиск уравнения кривой становится сложной задачей.

Источник: http://uc-r.github.io/svm

Машины опорных векторов (SVM) удобны при определении границ разделения в таких ситуациях.

К счастью, в большинстве случаев вам не нужно кодировать алгоритмы, упомянутые в предыдущем уроке. Существует множество стандартных библиотек, которые предоставляют готовую к использованию реализацию этих алгоритмов. Один из таких широко используемых инструментов - scikit-learn. На рисунке ниже показаны типы алгоритмов, которые доступны для использования в этой библиотеке.

Источник: https://scikit-learn.org/stable/tutorial/machine_learning_map/index.html

Использование этих алгоритмов тривиально, и, поскольку они хорошо протестированы и прошли полевые испытания, вы можете безопасно использовать их в своих приложениях AI. Большинство этих библиотек можно использовать бесплатно даже в коммерческих целях.

Пока что вы видели, как заставить машину научиться находить решение для нашей цели. В регрессии мы обучаем машину предсказанию будущей стоимости. При классификации мы обучаем машину классифицировать неизвестный объект по одной из категорий, определенных нами. Короче говоря, мы тренировали машины, чтобы они могли предсказывать Y для наших данных X. Учитывая огромный набор данных и не оценивая категории, нам было бы сложно обучить машину с помощью контролируемого обучения. Что, если машина сможет искать и анализировать большие данные, занимающие несколько гигабайт и терабайт, и сообщать нам, что эти данные содержат так много разных категорий?

В качестве примера рассмотрим данные избирателя. Рассматривая некоторые входные данные от каждого избирателя (в терминологии ИИ они называются функциями), позвольте машине предсказать, что есть так много избирателей, которые проголосуют за политическую партию X, и так много проголосуют за Y, и так далее. Таким образом, в общем, мы спрашиваем машину, учитывая огромный набор точек данных X: «Что вы можете сказать мне о X?». Или это может быть вопрос типа «Какие пять лучших групп мы можем составить из X?». Или это может быть даже что-то вроде «Какие три функции чаще всего встречаются вместе в X?».

В этом и заключается суть обучения без учителя.

Алгоритмы обучения без учителя

Давайте теперь обсудим один из широко используемых алгоритмов классификации в неконтролируемом машинном обучении.

k-означает кластеризацию

Президентские выборы 2000 и 2004 годов в США были близки - очень близки. Наибольший процент голосов избирателей, который получил любой кандидат, составил 50,7%, а самый низкий - 47,9%. Если бы какой-то процент избирателей перешёл на другую сторону, исход выборов был бы другим. Есть небольшие группы избирателей, которые при правильном обращении переходят на другую сторону. Эти группы могут быть небольшими, но при такой близкой гонке они могут быть достаточно большими, чтобы изменить исход выборов. Как вам найти эти группы людей? Как вы обращаетесь к ним с ограниченным бюджетом? Ответ - кластеризация.

Давайте разберемся, как это делается.

  • Во-первых, вы собираете информацию о людях с их согласия или без такового: любую информацию, которая может дать некоторое представление о том, что для них важно и что повлияет на их голосование.

  • Затем вы помещаете эту информацию в какой-то алгоритм кластеризации.

  • Затем для каждого кластера (было бы разумно сначала выбрать самый большой) вы создаете сообщение, которое понравится этим избирателям.

  • Наконец, вы доставляете кампанию и измеряете, работает ли она.

Кластеризация - это тип обучения без учителя, который автоматически формирует кластеры схожих вещей. Это похоже на автоматическую классификацию. Вы можете кластеризовать практически все, и чем более похожи элементы в кластере, тем лучше кластеры. В этой главе мы собираемся изучить один тип алгоритма кластеризации, называемый k-средними. Он называется k-средним, потому что он находит k уникальных кластеров, а центр каждого кластера является средним значением в этом кластере.

Идентификация кластера

Идентификация кластера сообщает алгоритму: «Вот некоторые данные. А теперь сгруппируйте похожие вещи и расскажите мне об этих группах ». Ключевое отличие от классификации состоит в том, что при классификации вы знаете, что ищете. В то время как это не относится к кластеризации.

Кластеризацию иногда называют классификацией без учителя, поскольку она дает тот же результат, что и классификация, но без предопределенных классов.

Теперь нам комфортно работать как с учителем, так и без него. Чтобы понять остальные категории машинного обучения, мы должны сначала понять искусственные нейронные сети (ИНС), о которых мы узнаем в следующей главе.

Идея искусственных нейронных сетей была основана на нейронных сетях человеческого мозга. Человеческий мозг действительно сложен. Тщательно изучая мозг, ученые и инженеры придумали архитектуру, которая могла бы вписаться в наш цифровой мир двоичных компьютеров. Одна такая типичная архитектура показана на схеме ниже -

Существует входной слой, на котором есть множество датчиков для сбора данных из внешнего мира. С правой стороны у нас есть выходной слой, который дает нам результат, предсказанный сетью. Между этими двумя скрыто несколько слоев. Каждый дополнительный уровень усложняет обучение сети, но в большинстве случаев дает лучшие результаты. Существует несколько типов архитектур, которые мы сейчас обсудим.

Архитектуры ИНС

На приведенной ниже диаграмме показано несколько архитектур ИНС, разработанных за определенный период времени и используемых сегодня.

Источник:

https://towardsdatascience.com/the-mostly-complete-chart-of-neural-networks-explained-3fb6f2367464

Каждая архитектура разрабатывается для определенного типа приложения. Таким образом, когда вы используете нейронную сеть для своего приложения машинного обучения, вам придется использовать либо одну из существующих архитектур, либо разработать свою собственную. Тип приложения, которое вы окончательно выберете, зависит от потребностей вашего приложения. Не существует единого правила, которое говорит вам использовать конкретную сетевую архитектуру.

Глубокое обучение использует ИНС. Сначала мы рассмотрим несколько приложений для глубокого обучения, которые дадут вам представление о его возможностях.

Приложения

Глубокое обучение показало большой успех в нескольких областях приложений машинного обучения.

Self-driving Cars- В автономных беспилотных автомобилях используются методы глубокого обучения. Обычно они приспосабливаются к постоянно меняющимся дорожным условиям и со временем становятся все лучше и лучше вождения.

Speech Recognition- Еще одно интересное приложение Deep Learning - распознавание речи. Все мы сегодня пользуемся несколькими мобильными приложениями, которые могут распознавать нашу речь. Apple Siri, Amazon Alexa, Microsoft Cortena и Google Assistant - все они используют методы глубокого обучения.

Mobile Apps- Мы используем несколько веб-приложений и мобильных приложений для организации наших фотографий. Распознавание лиц, идентификация лиц, маркировка лиц, идентификация объектов на изображении - все это требует глубокого обучения.

Неиспользованные возможности глубокого обучения

Посмотрев на огромный успех приложений глубокого обучения во многих областях, люди начали изучать другие области, в которых машинное обучение еще не применялось. Есть несколько областей, в которых успешно применяются методы глубокого обучения, и есть много других областей, которые можно использовать. Некоторые из них обсуждаются здесь.

  • Сельское хозяйство - одна из таких отраслей, где люди могут применять методы глубокого обучения для повышения урожайности.

  • Потребительское финансирование - еще одна область, в которой машинное обучение может значительно помочь в раннем обнаружении мошенничества и анализе платежеспособности клиентов.

  • Методы глубокого обучения также применяются в области медицины для создания новых лекарств и предоставления пациенту индивидуального рецепта.

Возможности безграничны, и нужно постоянно наблюдать, как часто появляются новые идеи и разработки.

Что требуется для более эффективного использования глубокого обучения

Для использования глубокого обучения мощность суперкомпьютеров является обязательным требованием. Для разработки моделей глубокого обучения необходимы как память, так и ЦП. К счастью, сегодня у нас есть легкая доступность HPC - High Performance Computing. Благодаря этому разработка приложений глубокого обучения, о которых мы упоминали выше, стала реальностью сегодня, и в будущем мы также можем увидеть приложения в тех неосвоенных областях, которые мы обсуждали ранее.

Теперь мы рассмотрим некоторые ограничения глубокого обучения, которые мы должны учитывать, прежде чем использовать его в нашем приложении для машинного обучения.

Недостатки глубокого обучения

Некоторые из важных моментов, которые необходимо учитывать перед использованием глубокого обучения, перечислены ниже:

  • Подход черного ящика
  • Продолжительность развития
  • Количество данных
  • В вычислительном отношении дорого

Теперь мы подробно изучим каждое из этих ограничений.

Подход черного ящика

ИНС похожа на черный ящик. Вы даете ему определенный ввод, и он предоставит вам конкретный результат. На следующей диаграмме показано одно из таких приложений, в котором вы скармливаете изображение животного нейронной сети, и оно сообщает вам, что это изображение собаки.

Этот подход называется методом черного ящика, потому что вы не знаете, почему сеть дала определенный результат. Вы не знаете, как в сети сделали вывод, что это собака? Теперь рассмотрим банковское приложение, в котором банк хочет определить кредитоспособность клиента. Сеть обязательно даст вам ответ на этот вопрос. Однако сумеете ли вы оправдать это перед клиентом? Банкам необходимо объяснить своим клиентам, почему по кредиту не применяются санкции?

Продолжительность развития

Процесс обучения нейронной сети изображен на диаграмме ниже -

Сначала вы определяете проблему, которую хотите решить, создаете для нее спецификацию, выбираете входные функции, проектируете сеть, развертываете ее и тестируете выход. Если результат не соответствует ожиданиям, примите это как отзыв, чтобы реструктурировать вашу сеть. Это итеративный процесс, который может потребовать нескольких итераций, пока временная сеть не будет полностью обучена для получения желаемых результатов.

Количество данных

Сети глубокого обучения обычно требуют огромного количества данных для обучения, в то время как традиционные алгоритмы машинного обучения могут успешно использоваться даже с несколькими тысячами точек данных. К счастью, объем данных растет на 40% в год, а вычислительная мощность процессора растет на 20% в год, как показано на диаграмме, приведенной ниже -

В вычислительном отношении дорого

Для обучения нейронной сети требуется в несколько раз больше вычислительной мощности, чем требуется для запуска традиционных алгоритмов. Для успешного обучения глубоких нейронных сетей может потребоваться несколько недель обучения.

В отличие от этого, обучение традиционным алгоритмам машинного обучения занимает всего несколько минут / часов. Кроме того, количество вычислительной мощности, необходимой для обучения глубокой нейронной сети, сильно зависит от размера ваших данных и от того, насколько глубока и сложна сеть?

Ознакомившись с тем, что такое машинное обучение, его возможности, ограничения и приложения, давайте теперь погрузимся в изучение «машинного обучения».

Машинное обучение имеет очень большую ширину и требует навыков в нескольких областях. Навыки, которые вам необходимо приобрести, чтобы стать экспертом в области машинного обучения, перечислены ниже:

  • Statistics
  • Теории вероятностей
  • Calculus
  • Методы оптимизации
  • Visualization

Необходимость различных навыков машинного обучения

Чтобы дать вам краткое представление о том, какие навыки вам необходимо приобрести, давайте обсудим несколько примеров:

Математические обозначения

Большинство алгоритмов машинного обучения в значительной степени основаны на математике. Уровень математики, который вам нужно знать, вероятно, просто начальный уровень. Важно то, что вы должны уметь читать обозначения, которые математики используют в своих уравнениях. Например, если вы умеете читать обозначения и понимать, что они означают, вы готовы к обучению машинному обучению. Если нет, возможно, вам придется освежить свои математические знания.

$$ f_ {AN} (net- \ theta) = \ begin {cases} \ gamma & if \: net- \ theta \ geq \ epsilon \\ net- \ theta & if - \ epsilon <net- \ theta <\ epsilon \\ - \ gamma & if \: net- \ theta \ leq- \ epsilon \ end {case} $$

$$ \ displaystyle \\\ max \ limits _ {\ alpha} \ begin {bmatrix} \ displaystyle \ sum \ limits_ {i = 1} ^ m \ alpha- \ frac {1} {2} \ displaystyle \ sum \ limits_ { i, j = 1} ^ m label ^ \ left (\ begin {array} {c} i \\ \ end {array} \ right) \ cdot \: label ^ \ left (\ begin {array} {c} j \\ \ end {array} \ right) \ cdot \: a_ {i} \ cdot \: a_ {j} \ langle x ^ \ left (\ begin {array} {c} i \\ \ end {array} \ справа), x ^ \ left (\ begin {array} {c} j \\ \ end {array} \ right) \ rangle \ end {bmatrix} $$

$$ f_ {AN} (net- \ theta) = \ left (\ frac {e ^ {\ lambda (net- \ theta)} - e ^ {- \ lambda (net- \ theta)}} {e ^ { \ lambda (net- \ theta)} + e ^ {- \ lambda (net- \ theta)}} \ right) \; $$

Теория вероятности

Вот пример для проверки ваших текущих знаний теории вероятностей: Классификация с условными вероятностями.

$$ p (c_ {i} | x, y) \; = \ frac {p (x, y | c_ {i}) \; p (c_ {i}) \;} {p (x, y) \ ;} $$

С этими определениями мы можем определить правило байесовской классификации -

  • Если P (c1 | x, y)> P (c2 | x, y), классом является c1.
  • Если P (c1 | x, y) <P (c2 | x, y), классом является c2.

Проблема оптимизации

Вот функция оптимизации

$$ \ displaystyle \\\ max \ limits _ {\ alpha} \ begin {bmatrix} \ displaystyle \ sum \ limits_ {i = 1} ^ m \ alpha- \ frac {1} {2} \ displaystyle \ sum \ limits_ { i, j = 1} ^ m label ^ \ left (\ begin {array} {c} i \\ \ end {array} \ right) \ cdot \: label ^ \ left (\ begin {array} {c} j \\ \ end {array} \ right) \ cdot \: a_ {i} \ cdot \: a_ {j} \ langle x ^ \ left (\ begin {array} {c} i \\ \ end {array} \ справа), x ^ \ left (\ begin {array} {c} j \\ \ end {array} \ right) \ rangle \ end {bmatrix} $$

При соблюдении следующих ограничений -

$$ \ alpha \ geq0 и \: \ displaystyle \ sum \ limits_ {i-1} ^ m \ alpha_ {i} \ cdot \: label ^ \ left (\ begin {array} {c} i \\ \ end {array} \ right) = 0 $$

Если вы можете прочитать и понять вышеизложенное, все готово.

Визуализация

Во многих случаях вам нужно будет понять различные типы графиков визуализации, чтобы понять распределение ваших данных и интерпретировать результаты вывода алгоритма.

Помимо вышеперечисленных теоретических аспектов машинного обучения, вам необходимы хорошие навыки программирования для кодирования этих алгоритмов.

Итак, что нужно для внедрения машинного обучения? Давайте рассмотрим это в следующей главе.

Для разработки приложений машинного обучения вам нужно будет выбрать платформу, IDE и язык разработки. Доступно несколько вариантов. Большинство из них будет легко соответствовать вашим требованиям, поскольку все они обеспечивают реализацию алгоритмов ИИ, обсуждаемых до сих пор.

Если вы разрабатываете алгоритм машинного обучения самостоятельно, необходимо внимательно изучить следующие аспекты:

Язык по вашему выбору - это, по сути, ваше владение одним из языков, поддерживаемых при разработке ML.

IDE, которую вы используете - это будет зависеть от вашего знакомства с существующими IDE и вашего уровня комфорта.

Development platform- Доступно несколько платформ для разработки и развертывания. Большинство из них бесплатны. В некоторых случаях вам, возможно, придется взимать лицензионный сбор сверх определенной суммы использования. Вот краткий список языков, IDE и платформ для вашего удобства.

Выбор языка

Вот список языков, поддерживающих разработку машинного обучения:

  • Python
  • R
  • Matlab
  • Octave
  • Julia
  • C++
  • C

Этот список не является исчерпывающим; однако он охватывает многие популярные языки, используемые при разработке машинного обучения. В зависимости от вашего уровня комфорта выберите язык для разработки, разработайте свои модели и протестируйте.

Иды

Вот список IDE, которые поддерживают разработку ML -

  • R Студия
  • Pycharm
  • Блокнот iPython / Jupyter
  • Julia
  • Spyder
  • Anaconda
  • Rodeo
  • Google –Colab

Приведенный выше список не является исчерпывающим. У каждого есть свои достоинства и недостатки. Читателю рекомендуется опробовать эти разные IDE, прежде чем сузиться до одной.

Платформы

Вот список платформ, на которых могут быть развернуты приложения ML:

  • IBM
  • Microsoft Azure
  • Google Cloud
  • Amazon
  • Mlflow

И снова этот список не является исчерпывающим. Читателю предлагается подписаться на вышеупомянутые услуги и попробовать их самостоятельно.

Это руководство познакомило вас с машинным обучением. Теперь вы знаете, что машинное обучение - это метод обучения машин выполнению действий, которые может выполнять человеческий мозг, хотя и немного быстрее и лучше, чем у обычного человека. Сегодня мы увидели, что машины могут побеждать человеческих чемпионов в таких играх, как Chess, AlphaGO, которые считаются очень сложными. Вы видели, что машины можно обучить выполнять человеческую деятельность в нескольких областях, и они могут помочь людям жить лучше.

Машинное обучение может быть контролируемым или неконтролируемым. Если у вас меньше данных и четко обозначены данные для обучения, выберите обучение с учителем. Неконтролируемое обучение обычно дает более высокую производительность и лучшие результаты для больших наборов данных. Если у вас есть легкий доступ к огромному набору данных, используйте методы глубокого обучения. Вы также изучили обучение с подкреплением и глубокое обучение с подкреплением. Теперь вы знаете, что такое нейронные сети, их приложения и ограничения.

Наконец, когда дело доходит до разработки собственных моделей машинного обучения, вы изучили выбор различных языков разработки, IDE и платформ. Следующее, что вам нужно сделать, это начать изучать и практиковать каждый метод машинного обучения. Тема обширна, значит, есть широта, но если учесть глубину, каждую тему можно изучить за несколько часов. Каждая тема не зависит друг от друга. Вам нужно рассматривать одну тему за раз, изучать ее, практиковать и реализовывать в ней алгоритм / ы, используя ваш выбор языка. Это лучший способ начать изучать машинное обучение. Практикуясь по одной теме за раз, очень скоро вы приобретете ширину, которая в конечном итоге потребуется от эксперта по машинному обучению.

Удачи!