Генетические алгоритмы - Краткое руководство
Генетический алгоритм (ГА) - это метод поисковой оптимизации, основанный на принципах Genetics and Natural Selection. Он часто используется для поиска оптимальных или почти оптимальных решений сложных проблем, решение которых в противном случае заняло бы всю жизнь. Он часто используется для решения задач оптимизации, в исследованиях и в машинном обучении.
Введение в оптимизацию
Оптимизация - это процесс making something better. В любом процессе у нас есть набор входов и набор выходов, как показано на следующем рисунке.
Оптимизация относится к поиску значений входных данных таким образом, чтобы мы получали «лучшие» выходные значения. Определение «наилучшего» варьируется от проблемы к проблеме, но с математической точки зрения оно означает максимизацию или минимизацию одной или нескольких целевых функций путем изменения входных параметров.
Набор всех возможных решений или значений, которые могут принимать входные данные, составляет пространство поиска. В этом пространстве поиска находится точка или набор точек, которые дают оптимальное решение. Цель оптимизации - найти эту точку или набор точек в пространстве поиска.
Что такое генетические алгоритмы?
Природа всегда была великим источником вдохновения для всего человечества. Генетические алгоритмы (ГА) - это алгоритмы, основанные на поиске, основанные на концепциях естественного отбора и генетики. ГА - это подмножество гораздо более крупной ветви вычислений, известной какEvolutionary Computation.
ГА были разработаны Джоном Холландом и его студентами и коллегами из Мичиганского университета, в первую очередь Дэвидом Э. Голдбергом, и с тех пор с большим успехом опробовали различные задачи оптимизации.
В ГА у нас есть pool or a population of possible solutionsк данной проблеме. Затем эти решения подвергаются рекомбинации и мутации (как в естественной генетике), производя новых детей, и этот процесс повторяется в разных поколениях. Каждому индивиду (или возможному решению) присваивается значение пригодности (на основе его значения целевой функции), и более приспособленные индивидуумы получают более высокий шанс спариться и дать более «приспособленных» особей. Это соответствует дарвиновской теории «выживания сильнейшего».
Таким образом, мы продолжаем «развивать» лучших людей или решения из поколения в поколение, пока не достигнем критерия остановки.
Генетические алгоритмы достаточно рандомизированы по своей природе, но они работают намного лучше, чем случайный локальный поиск (в котором мы просто пробуем различные случайные решения, отслеживая лучшие на данный момент), поскольку они также используют историческую информацию.
Преимущества ГА
ГА имеют различные преимущества, которые сделали их чрезвычайно популярными. К ним относятся -
Не требует какой-либо производной информации (которая может быть недоступна для многих реальных проблем).
Быстрее и эффективнее по сравнению с традиционными методами.
Имеет очень хорошие параллельные возможности.
Оптимизирует как непрерывные, так и дискретные функции, а также многокритериальные задачи.
Предоставляет список «хороших» решений, а не одно решение.
Всегда получает ответ на проблему, который со временем становится лучше.
Полезно, когда пространство поиска очень велико и задействовано большое количество параметров.
Ограничения ГА
Как и любой метод, ГА также страдает некоторыми ограничениями. К ним относятся -
ГА не подходят для всех проблем, особенно для простых задач, по которым доступна производная информация.
Значение пригодности вычисляется многократно, что для некоторых задач может потребовать больших вычислительных ресурсов.
Поскольку решение является стохастическим, нет никаких гарантий оптимальности или качества решения.
При неправильной реализации ГА может не прийти к оптимальному решению.
GA - Мотивация
Генетические алгоритмы обладают способностью предоставлять «достаточно хорошее» решение «достаточно быстро». Это делает генетические алгоритмы привлекательными для использования при решении задач оптимизации. Причины, по которым необходимы ГА, следующие:
Решение сложных проблем
В информатике существует большой набор проблем, которые NP-Hard. По сути, это означает, что даже самым мощным вычислительным системам требуется очень много времени (даже годы!) Для решения этой проблемы. В таком сценарии ГА оказываются эффективным инструментом для обеспеченияusable near-optimal solutions в короткие сроки.
Неудача градиентных методов
Традиционные методы, основанные на исчислении, работают, начиная со случайной точки и двигаясь в направлении градиента, пока мы не достигнем вершины холма. Этот метод эффективен и очень хорошо работает для однопиковых целевых функций, таких как функция стоимости в линейной регрессии. Но в большинстве реальных ситуаций у нас есть очень сложная проблема, называемая ландшафтами, которые состоят из множества пиков и долин, что приводит к сбою таких методов, поскольку они страдают от присущей им тенденции застревать на локальных оптимумах. как показано на следующем рисунке.
Быстрое получение хорошего решения
Некоторые сложные задачи, такие как задача коммивояжера (TSP), имеют реальные приложения, такие как поиск пути и проектирование СБИС. Теперь представьте, что вы используете свою систему GPS-навигации, и требуется несколько минут (или даже несколько часов), чтобы вычислить «оптимальный» путь от источника до пункта назначения. Задержка в таких реальных приложениях неприемлема, и поэтому требуется «достаточно хорошее» решение, которое доставляется «быстро».
В этом разделе представлена основная терминология, необходимая для понимания GA. Кроме того, общая структура ГА представлена в обоихpseudo-code and graphical forms. Читателю рекомендуется правильно понимать все концепции, представленные в этом разделе, и помнить о них при чтении других разделов этого руководства.
Базовая терминология
Перед тем, как начать обсуждение генетических алгоритмов, важно ознакомиться с некоторой базовой терминологией, которая будет использоваться в этом руководстве.
Population- Это подмножество всех возможных (закодированных) решений данной проблемы. Популяция для GA аналогична популяции для людей, за исключением того, что вместо людей у нас есть решения-кандидаты, представляющие людей.
Chromosomes - Хромосома - одно из таких решений данной проблемы.
Gene - Ген - это позиция одного элемента в хромосоме.
Allele - Это значение, которое ген принимает для определенной хромосомы.
Genotype- Генотип - это популяция в вычислительном пространстве. В вычислительном пространстве решения представлены таким образом, чтобы их можно было легко понять и ими можно было управлять с помощью вычислительной системы.
Phenotype - Фенотип - это совокупность в реальном пространстве решений реального мира, в котором решения представлены таким образом, как они представлены в ситуациях реального мира.
Decoding and Encoding - Для простых задач phenotype and genotypeпробелы такие же. Однако в большинстве случаев пространства фенотипа и генотипа различаются. Декодирование - это процесс преобразования решения из пространства генотипа в пространство фенотипа, а кодирование - это процесс преобразования из фенотипа в пространство генотипа. Декодирование должно быть быстрым, поскольку оно многократно выполняется в GA во время вычисления значения пригодности.
Например, рассмотрим задачу о рюкзаке 0/1. Пространство «Фенотип» состоит из решений, которые содержат только номера элементов, которые нужно выбрать.
Однако в пространстве генотипов его можно представить как двоичную строку длины n (где n - количество элементов). А0 at position x представляет, что xthэлемент выбирается, а 1 означает обратное. Это тот случай, когда пространства генотипа и фенотипа различны.
Fitness Function- Просто определенная функция пригодности - это функция, которая принимает решение в качестве входных данных и производит пригодность решения в качестве выходных данных. В некоторых случаях функция пригодности и целевая функция могут совпадать, а в других - различаться в зависимости от проблемы.
Genetic Operators- Они изменяют генетический состав потомства. К ним относятся кроссовер, мутация, отбор и т. Д.
Базовая структура
Базовая структура ГА выглядит следующим образом -
Мы начинаем с начальной популяции (которая может быть сгенерирована случайным образом или с помощью других эвристических методов), выбираем родителей из этой популяции для спаривания. Примените операторы кроссовера и мутации к родителям для создания новых потомков. И, наконец, эти потомки заменяют существующих особей в популяции, и процесс повторяется. Таким образом, генетические алгоритмы на самом деле пытаются в некоторой степени имитировать эволюцию человека.
Каждый из следующих шагов рассматривается в отдельной главе далее в этом руководстве.
Обобщенный псевдокод для GA объясняется в следующей программе -
GA()
initialize population
find fitness of population
while (termination criteria is reached) do
parent selection
crossover with probability pc
mutation with probability pm
decode and fitness calculation
survivor selection
find best
return best
Одним из наиболее важных решений, которые необходимо принять при реализации генетического алгоритма, является выбор представления, которое мы будем использовать для представления наших решений. Было замечено, что неправильное представление может привести к плохой работе GA.
Следовательно, выбор правильного представления, правильное определение сопоставлений между фенотипом и пространством генотипа имеет важное значение для успеха ГА.
В этом разделе мы представляем некоторые из наиболее часто используемых представлений генетических алгоритмов. Однако представление очень специфично для задачи, и читатель может обнаружить, что другое представление или сочетание представлений, упомянутых здесь, может лучше удовлетворить его / ее проблему.
Двоичное представление
Это одно из самых простых и наиболее широко используемых представлений в ГА. В этом типе представления генотип состоит из битовых строк.
Для некоторых задач, когда пространство решений состоит из логических переменных решения - да или нет, двоичное представление является естественным. Возьмем, к примеру, задачу о рюкзаке 0/1. Если имеется n элементов, мы можем представить решение двоичной строкой из n элементов, где x- й элемент сообщает, выбран ли элемент x (1) или нет (0).
Для других задач, особенно связанных с числами, мы можем представить числа в их двоичном представлении. Проблема с этим типом кодирования заключается в том, что разные биты имеют разное значение, и поэтому операторы мутации и кроссовера могут иметь нежелательные последствия. В некоторой степени это можно решить, используяGray Coding, поскольку изменение одного бита не оказывает большого влияния на решение.
Реальное ценностное представление
Для задач, в которых мы хотим определять гены, используя непрерывные, а не дискретные переменные, наиболее естественным является представление с действительными значениями. Однако точность этих действительных чисел или чисел с плавающей запятой ограничена компьютером.
Целочисленное представление
Для генов с дискретными значениями мы не всегда можем ограничить пространство решений двоичным «да» или «нет». Например, если мы хотим закодировать четыре расстояния - север, юг, восток и запад, мы можем закодировать их как{0,1,2,3}. В таких случаях желательно целочисленное представление.
Представление перестановки
Во многих задачах решение представлено порядком элементов. В таких случаях перестановочное представление является наиболее подходящим.
Классическим примером такого представления является задача коммивояжера (TSP). При этом продавец должен совершить поездку по всем городам, посетив каждый город ровно один раз, и вернуться в исходный город. Общее расстояние тура должно быть минимальным. Решением этого TSP, естественно, является упорядочение или перестановка всех городов, и поэтому использование представления перестановки имеет смысл для этой проблемы.
Население - это подмножество решений в текущем поколении. Его также можно определить как набор хромосом. Имея дело с населением GA, следует помнить о нескольких вещах:
Необходимо поддерживать разнообразие населения, иначе это может привести к преждевременной конвергенции.
Размер популяции не должен быть очень большим, так как это может вызвать замедление ГА, в то время как меньшей популяции может быть недостаточно для хорошего брачного пула. Следовательно, оптимальный размер популяции необходимо определять методом проб и ошибок.
Население обычно определяется как двумерный массив: size population, size x, chromosome size.
Инициализация популяции
Есть два основных метода инициализации популяции в GA. Они -
Random Initialization - Заполните начальную популяцию полностью случайными решениями.
Heuristic initialization - Заполните начальную популяцию, используя известную эвристику для проблемы.
Было замечено, что не следует инициализировать всю популяцию с использованием эвристики, так как это может привести к тому, что популяция будет иметь похожие решения и очень мало разнообразия. Экспериментально обнаружено, что именно случайные решения приводят популяцию к оптимальности. Таким образом, при эвристической инициализации мы просто заполняем совокупность парой хороших решений, заполняя остальное случайными решениями, а не заполняя всю совокупность эвристическими решениями.
Также было замечено, что эвристическая инициализация в некоторых случаях влияет только на начальную приспособленность популяции, но, в конце концов, именно разнообразие решений приводит к оптимальности.
Модели населения
Широко используются две модели населения:
Устойчивое состояние
В устойчивом состоянии GA мы генерируем один или два потомка в каждой итерации, и они заменяют одного или двух особей из популяции. ГА в устойчивом состоянии также известен какIncremental GA.
Поколений
В модели поколений мы генерируем n потомков, где n - размер популяции, и вся популяция заменяется новой в конце итерации.
Просто определенная фитнес-функция - это функция, которая принимает candidate solution to the problem as input and produces as output насколько «подходит» нам насколько «хорошее» решение по отношению к рассматриваемой проблеме.
Расчет значения пригодности выполняется в GA повторно, поэтому он должен быть достаточно быстрым. Медленное вычисление значения пригодности может отрицательно повлиять на GA и сделать его исключительно медленным.
В большинстве случаев функция пригодности и целевая функция совпадают, поскольку цель состоит в том, чтобы максимизировать или минимизировать данную целевую функцию. Однако для более сложных задач с множеством целей и ограниченийAlgorithm Designer может выбрать другую фитнес-функцию.
Фитнес-функция должна обладать следующими характеристиками:
Функция пригодности должна быть достаточно быстрой для вычисления.
Он должен количественно измерить, насколько подходит данное решение или насколько подходящие люди могут быть получены из данного решения.
В некоторых случаях вычисление функции пригодности напрямую может оказаться невозможным из-за внутренней сложности решаемой задачи. В таких случаях мы делаем приблизительную оценку пригодности в соответствии с нашими потребностями.
На следующем изображении показан расчет пригодности для решения «Рюкзак 0/1». Это простая функция фитнеса, которая просто суммирует значения прибыли выбранных предметов (у которых есть 1), просматривая элементы слева направо, пока рюкзак не заполнится.
Выбор родителей - это процесс выбора родителей, которые спариваются и рекомбинируют для создания потомков для следующего поколения. Отбор родителей очень важен для скорости конвергенции ГА, поскольку хорошие родители подталкивают людей к лучшим и более подходящим решениям.
Однако следует позаботиться о том, чтобы одно чрезвычайно подходящее решение не захватило всю совокупность в течение нескольких поколений, поскольку это приводит к тому, что решения находятся рядом друг с другом в пространстве решений, что приводит к потере разнообразия. Maintaining good diversityв популяции чрезвычайно важен для успеха ГА. Этот захват всего населения одним чрезвычайно подходящим решением известен какpremature convergence и является нежелательным состоянием в ГА.
Пропорциональный отбор по фитнесу
Пропорциональный отбор по фитнесу - один из самых популярных способов родительского отбора. В этом случае каждый человек может стать родителем с вероятностью, пропорциональной его приспособленности. Следовательно, у более приспособленных особей больше шансов спариться и передать свои особенности следующему поколению. Следовательно, такая стратегия отбора применяет давление отбора к более подходящим особям в популяции, со временем развивая лучших особей.
Рассмотрим круглое колесо. Колесо делится наn pies, где n - количество особей в популяции. Каждый человек получает часть круга, пропорциональную его значению приспособленности.
Возможны две реализации пропорционального отбора по пригодности:
Выбор колеса рулетки
При выборе колеса рулетки круговое колесо делится, как описано ранее. На окружности колеса выбирается фиксированная точка, как показано, и колесо вращается. Область колеса, которая находится перед фиксированной точкой, выбирается в качестве родительской. Для второго родителя процесс повторяется.
Понятно, что у более сильного специалиста больше на колесе и, следовательно, больше шансов приземлиться перед фиксированной точкой при вращении колеса. Поэтому вероятность выбора индивидуума напрямую зависит от его приспособленности.
Для реализации мы используем следующие шаги -
Вычислите S = сумма тонкости.
Сгенерируйте случайное число от 0 до S.
Начиная с верхушки популяции, продолжайте добавлять тонкости к частичной сумме P, пока P <S.
Индивидуум, для которого P превышает S, является выбранным человеком.
Стохастическая универсальная выборка (SUS)
Стохастическая универсальная выборка очень похожа на выбор колеса рулетки, однако вместо одной фиксированной точки у нас есть несколько фиксированных точек, как показано на следующем изображении. Таким образом, все родители выбираются одним вращением колеса. Кроме того, такая установка поощряет выбор наиболее подходящих людей хотя бы один раз.
Следует отметить, что методы пропорционального выбора пригодности не работают в случаях, когда приспособленность может принимать отрицательные значения.
Выбор турнира
При отборе турниров K-Way мы случайным образом выбираем K человек из популяции и выбираем лучших из них, чтобы стать родителями. Тот же процесс повторяется для выбора следующего родителя. Выбор турнира также чрезвычайно популярен в литературе, поскольку он может работать даже с отрицательными значениями пригодности.
Выбор ранга
Выбор ранга также работает с отрицательными значениями пригодности и в основном используется, когда люди в популяции имеют очень близкие значения пригодности (обычно это происходит в конце пробега). Это приводит к тому, что каждый человек имеет почти равную долю пирога (как в случае выбора, пропорционального пригодности), как показано на следующем изображении, и, следовательно, каждый человек, независимо от того, насколько он подходит друг другу, имеет примерно одинаковую вероятность быть выбранным в качестве родитель. Это, в свою очередь, приводит к потере давления отбора в сторону более приспособленных людей, заставляя GA делать плохой выбор родителей в таких ситуациях.
Здесь мы удаляем понятие фитнес-ценности при выборе родителя. Однако каждый человек в популяции оценивается в соответствии с его физической подготовкой. Выбор родителей зависит от ранга каждого человека, а не от физической подготовки. Люди с более высоким рейтингом предпочтительнее, чем лица с более низким рейтингом.
Хромосома | Ценность фитнеса | Ранг |
---|---|---|
А | 8.1 | 1 |
B | 8.0 | 4 |
C | 8,05 | 2 |
D | 7,95 | 6 |
E | 8,02 | 3 |
F | 7,99 | 5 |
Случайный выбор
В этой стратегии мы случайным образом выбираем родителей из существующей популяции. В отношении более подготовленных специалистов отсутствует давление отбора, поэтому этой стратегии обычно избегают.
В этой главе мы обсудим, что такое оператор кроссовера, а также другие его модули, их использование и преимущества.
Введение в кроссовер
Оператор кроссовера аналогичен воспроизведению и биологическому кроссоверу. В этом случае выбирается более одного родителя, и одно или несколько потомков производятся с использованием генетического материала родителей. Кроссовер обычно применяется в ГА с большой вероятностью -pc .
Операторы кроссовера
В этом разделе мы обсудим некоторые из наиболее часто используемых операторов кроссовера. Следует отметить, что эти операторы кроссовера являются очень общими, и конструктор GA также может реализовать специфический для проблемы оператор кроссовера.
Одноточечный кроссовер
В этом одноточечном кроссовере выбирается случайная точка кроссовера, и хвосты двух ее родителей меняются местами, чтобы получить новые пружины.
Многоточечный кроссовер
Многоточечный кроссовер - это обобщение одноточечного кроссовера, в котором чередующиеся сегменты меняются местами, чтобы получить новые пружины.
Униформа Кроссовер
При однородном кроссовере мы не разделяем хромосому на сегменты, а рассматриваем каждый ген отдельно. По сути, мы подбрасываем монетку для каждой хромосомы, чтобы решить, будет ли она включена в потомство. Мы также можем склонить монету к одному из родителей, чтобы у ребенка было больше генетического материала от этого родителя.
Полная арифметическая рекомбинация
Это обычно используется для целочисленных представлений и работает путем взятия средневзвешенного значения двух родителей с использованием следующих формул:
- Ребенок1 = α.x + (1-α) .y
- Ребенок2 = α.x + (1-α) .y
Очевидно, что если α = 0,5, то оба ребенка будут идентичны, как показано на следующем изображении.
Кроссовер Ордена Дэвиса (OX1)
OX1 используется для кроссоверов на основе перестановок с целью передачи информации об относительном порядке вторичным пружинам. Это работает следующим образом -
Создайте две случайные точки пересечения в родительском элементе и скопируйте сегмент между ними от первого родителя к первому потомству.
Теперь, начиная со второй точки пересечения во втором родителе, скопируйте оставшиеся неиспользуемые числа из второго родителя в первый потомок, обернув список.
Повторите для второго ребенка с обратной ролью родителя.
Существует множество других кроссоверов, таких как частично отображенный кроссовер (PMX), кроссовер на основе порядка (OX2), случайный кроссовер, кольцевой кроссовер и т. Д.
Введение в мутацию
Проще говоря, мутацию можно определить как небольшую случайную настройку хромосомы для получения нового решения. Он используется для поддержания и внедрения разнообразия в генетической популяции и обычно применяется с низкой вероятностью -pm. Если вероятность очень высока, ГА сводится к случайному поиску.
Мутация - это часть ГА, которая связана с «исследованием» поискового пространства. Было замечено, что мутации важны для конвергенции GA, в то время как кроссовер - нет.
Операторы мутации
В этом разделе мы описываем некоторые из наиболее часто используемых операторов мутации. Как и операторы кроссовера, этот список не является исчерпывающим, и разработчик GA может счесть комбинацию этих подходов или оператор мутации для конкретной задачи более полезным.
Мутация переворота битов
В этой мутации переворота битов мы выбираем один или несколько случайных битов и меняем их местами. Это используется для GA с двоичным кодированием.
Произвольный сброс
Случайный сброс - это расширение переворота бит для целочисленного представления. При этом случайное значение из набора допустимых значений присваивается случайно выбранному гену.
Своп Мутация
При мутации подкачки мы выбираем две позиции на хромосоме случайным образом и меняем значения местами. Это распространено в кодировках на основе перестановок.
Схватка мутации
Мутация Scramble также популярна с представлениями перестановок. При этом из всей хромосомы выбирается подмножество генов, и их значения перемешиваются или перемешиваются случайным образом.
Инверсия мутации
При инверсионной мутации мы выбираем подмножество генов, как при скремблирующей мутации, но вместо перетасовки подмножества мы просто инвертируем всю строку в подмножестве.
Политика отбора выживших определяет, каких людей нужно выгнать, а каких оставить в следующем поколении. Это очень важно, поскольку оно должно гарантировать, что более приспособленные люди не будут исключены из популяции, и в то же время должно поддерживаться разнообразие в популяции.
Некоторые ГА используют Elitism. Проще говоря, это означает, что текущий наиболее приспособленный член популяции всегда передается следующему поколению. Следовательно, ни при каких обстоятельствах нельзя заменить наиболее приспособленного члена нынешнего населения.
Самый простой способ - исключить случайных членов из популяции, но при таком подходе часто возникают проблемы с конвергенцией, поэтому широко используются следующие стратегии.
Выбор по возрасту
В отборе по возрасту мы не имеем понятия о фитнесе. Он основан на предположении, что каждому человеку разрешено входить в популяцию для конечного поколения, где ему разрешено воспроизводить потомство, после чего его исключают из популяции, независимо от того, насколько хорошо он приспособлен.
Например, в следующем примере возраст - это количество поколений, в течение которых человек был в популяции. Самые старые члены популяции, то есть P4 и P7, исключаются из популяции, а возраст остальных членов увеличивается на единицу.
Выбор по фитнесу
В этом отборе, основанном на пригодности, дети, как правило, заменяют наименее приспособленных людей в популяции. Отбор наименее подходящих людей может быть выполнен с использованием вариации любой из описанных выше политик отбора - турнирный отбор, пропорциональный отбор и т. Д.
Например, на следующем изображении дети заменяют наименее подходящих людей P1 и P10 в популяции. Следует отметить, что, поскольку P1 и P9 имеют одинаковое значение приспособленности, решение об удалении какого-либо индивидуума из популяции является произвольным.
Условие завершения генетического алгоритма важно для определения того, когда закончится прогон GA. Было замечено, что изначально ГА прогрессирует очень быстро, и лучшие решения появляются через каждые несколько итераций, но на более поздних этапах, когда улучшения очень небольшие, это имеет тенденцию к насыщению. Обычно нам нужно такое условие завершения, чтобы наше решение было близко к оптимальному в конце цикла.
Обычно мы соблюдаем одно из следующих условий расторжения договора -
- Когда не было улучшений в популяции для X итераций.
- Когда мы достигнем абсолютного количества поколений.
- Когда значение целевой функции достигло определенного заранее заданного значения.
Например, в генетическом алгоритме мы ведем счетчик, который отслеживает поколения, для которых не произошло улучшения в популяции. Изначально мы устанавливаем этот счетчик на ноль. Каждый раз, когда мы не производим потомков, которые лучше, чем особи в популяции, мы увеличиваем счетчик.
Однако, если пригодность какой-либо из вторичных пружин лучше, мы сбрасываем счетчик на ноль. Алгоритм завершается, когда счетчик достигает заданного значения.
Как и другие параметры GA, условие завершения также сильно зависит от конкретной проблемы, и разработчик GA должен попробовать различные варианты, чтобы увидеть, что лучше всего подходит для его конкретной проблемы.
До сих пор в этом руководстве все, что мы обсуждали, соответствует дарвиновской модели эволюции - естественный отбор и генетическая изменчивость через рекомбинацию и мутацию. В природе только информация, содержащаяся в генотипе человека, может быть передана следующему поколению. Это подход, которому мы следовали до сих пор в руководстве.
Однако другие модели пожизненной адаптации - Lamarckian Model и Baldwinian Modelтоже существуют. Следует отметить, что какая бы модель ни была лучшей, она открыта для обсуждения, и результаты, полученные исследователями, показывают, что выбор пожизненной адаптации сильно зависит от проблемы.
Часто мы гибридизируем ГА с локальным поиском - как в меметических алгоритмах. В таких случаях можно выбрать вариант Ламарка или Балдвина, чтобы решить, что делать с людьми, сгенерированными после локального поиска.
Ламарковская модель
Модель Ламарка, по сути, говорит, что черты, которые человек приобретает в течение своей жизни, могут передаваться его потомству. Он назван в честь французского биолога Жана-Батиста Ламарка.
Несмотря на то, что естественная биология полностью игнорировала ламаркизм, все мы знаем, что может передаваться только информация генотипа. Однако с точки зрения вычислений было показано, что принятие модели Ламарка дает хорошие результаты для некоторых проблем.
В модели Ламарка локальный оператор поиска исследует окрестности (приобретая новые черты), и, если обнаруживается лучшая хромосома, она становится потомком.
Балдвинская модель
Модель Болдуина - промежуточная идея, названная в честь Джеймса Марка Болдуина (1896 г.). В модели Болдуина хромосомы могут кодировать тенденцию к обучению полезному поведению. Это означает, что в отличие от модели Ламарка, мы не передаем приобретенные черты следующему поколению, а также полностью игнорируем приобретенные черты, как в модели Дарвина.
Модель Болдуина находится посередине этих двух крайностей, где закодирована склонность человека к приобретению определенных черт, а не сами черты.
В этой модели Балдвина местный оператор поиска исследует окрестности (приобретая новые черты), и, если найдена лучшая хромосома, он только приписывает улучшенную приспособленность хромосоме и не изменяет саму хромосому. Изменение приспособленности означает способность хромосом «приобретать признак», даже если он не передается напрямую будущим поколениям.
GA имеют очень общий характер, и простое их применение к любой задаче оптимизации не даст хороших результатов. В этом разделе мы опишем несколько моментов, которые могут помочь проектировщику или разработчику GA в их работе.
Представьте знания предметной области
Было замечено, что более специфические знания предметной области мы включаем в ГА; тем лучше объективные значения, которые мы получаем. Добавление информации о проблеме может быть выполнено с помощью операторов кроссовера или мутации для конкретной проблемы, пользовательских представлений и т. Д.
Следующее изображение показывает взгляд Михалевича (1990) на EA:
Уменьшить скученность
Переполнение происходит, когда хорошо приспособленная хромосома начинает много воспроизводиться, и через несколько поколений вся популяция заполняется подобными решениями, имеющими аналогичную приспособленность. Это снижает разнообразие, что является очень важным элементом для обеспечения успеха ГА. Есть множество способов ограничить скопление людей. Некоторые из них -
Mutation ввести разнообразие.
Переход на rank selection и tournament selection которые имеют большее давление отбора, чем пропорциональный отбор для людей с аналогичной приспособленностью.
Fitness Sharing - При этом физическая форма индивидуума снижается, если в популяции уже есть похожие особи.
Рандомизация помогает!
Экспериментально было обнаружено, что лучшие решения основаны на рандомизированных хромосомах, поскольку они придают разнообразие популяции. Разработчик GA должен следить за тем, чтобы для достижения наилучших результатов сохранялась достаточная степень рандомизации и разнообразия в популяции.
Гибридизируйте GA с локальным поиском
Локальный поиск относится к проверке решений в окрестности данного решения для поиска лучших объективных значений.
Иногда может быть полезно гибридизировать GA с локальным поиском. На следующем изображении показаны различные места, в которых можно ввести локальный поиск в GA.
Вариация параметров и методов
В генетических алгоритмах не существует универсальной формулы, подходящей для всех. Даже после того, как начальный ГА готов, требуется много времени и усилий, чтобы поиграть с такими параметрами, как размер популяции, вероятность мутации, кроссинговера и т. Д., Чтобы найти те, которые подходят для конкретной проблемы.
В этом разделе мы познакомим вас с некоторыми дополнительными темами генетических алгоритмов. Читатель, который хочет просто познакомиться с GA, может пропустить этот раздел.
Ограниченные проблемы оптимизации
Задачи оптимизации с ограничениями - это задачи оптимизации, в которых мы должны максимизировать или минимизировать заданное значение целевой функции, на которое накладываются определенные ограничения. Следовательно, не все результаты в пространстве решений достижимы, а пространство решений содержит возможные области, как показано на следующем изображении.
В таком сценарии операторы кроссовера и мутации могут дать нам решения, которые невозможно реализовать. Следовательно, при решении задач оптимизации с ограничениями в GA должны использоваться дополнительные механизмы.
Некоторые из наиболее распространенных методов:
С помощью penalty functions что снижает пригодность недопустимых решений, предпочтительно так, чтобы соответствие уменьшалось пропорционально количеству нарушенных ограничений или расстоянию от допустимой области.
С помощью repair functions которые принимают недопустимое решение и модифицируют его таким образом, чтобы удовлетворялись нарушенные ограничения.
Not allowing infeasible solutions вообще не входить в популяцию.
Использовать special representation or decoder functions что обеспечивает выполнимость решений.
Основные теоретические основы
В этом разделе мы обсудим теорему схемы и NFL, а также гипотезу о строительных блоках.
Схема теоремы
Исследователи пытались выяснить математику, лежащую в основе работы генетических алгоритмов, и теорема о схеме Холланда является шагом в этом направлении. В течение года в теорему схемы были внесены различные улучшения и предложения, чтобы сделать ее более общей.
В этом разделе мы не углубляемся в математику теоремы схемы, скорее мы пытаемся развить базовое понимание того, что такое теорема схемы. Основная терминология, которую необходимо знать, заключается в следующем:
А Schemaэто «шаблон». Формально это строка в алфавите = {0,1, *},
где * не имеет значения и может принимать любое значение.
Следовательно, * 10 * 1 может означать 01001, 01011, 11001 или 11011.
Геометрически схема - это гиперплоскость в пространстве поиска решений.
Order схемы - это количество указанных фиксированных позиций в гене.
Defining length расстояние между двумя самыми дальними фиксированными символами в гене.
Теорема схемы утверждает, что эта схема с приспособленностью выше среднего, короткой определяющей длиной и более низким порядком с большей вероятностью выживет при кроссовере и мутации.
Гипотеза строительных блоков
Строительные блоки - это схемы низкого порядка с небольшой определяющей длиной и приведенной выше средней пригодностью. Гипотеза строительных блоков гласит, что такие строительные блоки служат основой для успеха ГА и адаптации ГА по мере его продвижения путем последовательной идентификации и рекомбинации таких «строительных блоков».
Теорема об отсутствии бесплатного обеда (НФЛ)
Вольперт и Макреди в 1997 году опубликовали статью под названием «Теоремы об отсутствии бесплатных обедов для оптимизации». По сути, он гласит, что если мы усредним пространство всех возможных проблем, то все алгоритмы черного ящика без пересмотра будут демонстрировать одинаковую производительность.
Это означает, что чем больше мы понимаем проблему, тем больше становится наша общая оценка проблемы и дает лучшую производительность, но это компенсируется низкой эффективностью для других проблем.
Машинное обучение на основе GA
Генетические алгоритмы также находят применение в машинном обучении. Classifier systems являются формой genetics-based machine learning(GBML), которые часто используются в области машинного обучения. Методы GBML - нишевый подход к машинному обучению.
Есть две категории систем GBML -
The Pittsburg Approach - При таком подходе одна хромосома кодирует одно решение, поэтому решениям присваивается соответствие.
The Michigan Approach - одно решение обычно представлено множеством хромосом, поэтому пригодность присваивается частичным решениям.
Следует иметь в виду, что стандартные проблемы, такие как кроссовер, мутация, ламаркистский или дарвиновский и т. Д., Также присутствуют в системах GBML.
Генетические алгоритмы в основном используются в задачах оптимизации различного рода, но они часто используются и в других областях применения.
В этом разделе мы перечисляем некоторые области, в которых часто используются генетические алгоритмы. Это -
Optimization- Генетические алгоритмы чаще всего используются в задачах оптимизации, в которых мы должны максимизировать или минимизировать заданное значение целевой функции при заданном наборе ограничений. Подход к решению проблем оптимизации освещался на протяжении всего руководства.
Economics - GA также используются для характеристики различных экономических моделей, таких как модель паутины, разрешение равновесия теории игр, ценообразование активов и т. Д.
Neural Networks - GA также используются для обучения нейронных сетей, особенно рекуррентных нейронных сетей.
Parallelization - ГА также обладают очень хорошими параллельными возможностями и доказывают, что являются очень эффективным средством решения определенных проблем, а также предоставляют хорошую область для исследований.
Image Processing - GA используются для различных задач обработки цифровых изображений (DIP), а также для сопоставления плотных пикселей.
Vehicle routing problems - С несколькими мягкими временными окнами, несколькими депо и неоднородным флотом.
Scheduling applications - GA также используются для решения различных задач планирования, в частности, проблемы табуляции времени.
Machine Learning - как уже говорилось, машинное обучение на основе генетики (GBML) - нишевая область в машинном обучении.
Robot Trajectory Generation - GA использовались для планирования пути, по которому рука робота перемещается из одной точки в другую.
Parametric Design of Aircraft - ГА использовались для проектирования самолетов путем изменения параметров и разработки лучших решений.
DNA Analysis - ГА были использованы для определения структуры ДНК с использованием спектрометрических данных об образце.
Multimodal Optimization - Очевидно, что ГА - очень хорошие подходы к мультимодальной оптимизации, в которой мы должны найти несколько оптимальных решений.
Traveling salesman problem and its applications - ГА были использованы для решения TSP, которая является хорошо известной комбинаторной задачей с использованием новых стратегий кроссовера и упаковки.
Следующие книги могут быть использованы для дальнейшего расширения знаний читателя о генетических алгоритмах и эволюционных вычислениях в целом:
Генетические алгоритмы в поиске, оптимизации и машинном обучении. David E. Goldberg.
Генетические алгоритмы + структуры данных = эволюционные программы Zbigniew Michalewicz.
Практические генетические алгоритмы Randy L. Haupt и Sue Ellen Haupt.
Многоцелевая оптимизация с использованием эволюционных алгоритмов Kalyanmoy Deb.