Python을 사용한 AI – 유전 알고리즘

이 장에서는 AI의 유전 알고리즘에 대해 자세히 설명합니다.

유전 알고리즘이란 무엇입니까?

유전 알고리즘 (GA)은 자연 선택 및 유전학의 개념을 기반으로하는 검색 기반 알고리즘입니다. GA는 Evolutionary Computation으로 알려진 훨씬 더 큰 계산 분야의 하위 집합입니다.

GA는 미시간 대학의 John Holland와 그의 학생 및 동료, 특히 David E. Goldberg가 개발했습니다. 이후 다양한 최적화 문제에 대해 높은 수준의 성공을 거두었습니다.

GA에는 주어진 문제에 대한 가능한 솔루션 풀이 있습니다. 그런 다음 이러한 솔루션은 재조합과 돌연변이 (자연 유전학에서와 같이)를 거쳐 새로운 어린이를 생성하며이 과정은 여러 세대에 걸쳐 반복됩니다. 각 개인 (또는 후보 솔루션)에는 적합성 값 (목적 함수 값을 기반으로 함)이 할당되고 피팅 자 개인에게는 짝짓기 및 양보 할 더 높은 기회가 부여됩니다.fitter개인. 이것은 다윈주의 이론과 일치합니다.Survival of the Fittest.

따라서 evolving 중단 기준에 도달 할 때까지 세대에 걸쳐 더 나은 개인 또는 솔루션을 제공합니다.

유전 알고리즘은 본질적으로 충분히 무작위 화되어 있지만, 역사적 정보도 활용하기 때문에 무작위 로컬 검색 (우리는 무작위 솔루션을 시도하고 지금까지 최고를 추적하는 것)보다 훨씬 더 잘 수행합니다.

최적화 문제에 GA를 사용하는 방법?

최적화는 설계, 상황, 자원 및 시스템을 최대한 효과적으로 만드는 조치입니다. 다음 블록 다이어그램은 최적화 프로세스를 보여줍니다.

최적화 프로세스를위한 GA 메커니즘의 단계

다음은 문제 최적화에 사용될 때 GA 메커니즘의 일련의 단계입니다.

  • 1 단계-초기 모집단을 무작위로 생성합니다.

  • 2 단계-최적의 피트니스 값을 가진 초기 솔루션을 선택합니다.

  • 3 단계-돌연변이 및 교차 연산자를 사용하여 선택한 솔루션을 다시 결합합니다.

  • 4 단계-개체군에 자손을 삽입합니다.

  • 5 단계-이제 중지 조건이 충족되면 최적의 피트니스 값으로 솔루션을 반환합니다. 그렇지 않으면 2 단계로 이동합니다.

필요한 패키지 설치

Python에서 Genetic Algorithms를 사용하여 문제를 해결하기 위해 GA를위한 강력한 패키지를 사용할 것입니다. DEAP. 신속한 프로토 타이핑 및 아이디어 테스트를위한 새로운 진화 계산 프레임 워크 라이브러리입니다. 명령 프롬프트에서 다음 명령을 사용하여이 패키지를 설치할 수 있습니다.

pip install deap

사용하는 경우 anaconda 환경, 다음 명령을 사용하여 deap을 설치할 수 있습니다-

conda install -c conda-forge deap

유전 알고리즘을 사용하여 솔루션 구현

이 섹션에서는 유전 알고리즘을 사용한 솔루션 구현에 대해 설명합니다.

비트 패턴 생성

다음 예제는 15 개의 1을 포함하는 비트 문자열을 생성하는 방법을 보여줍니다. One Max 문제.

표시된대로 필요한 패키지를 가져옵니다.

import random
from deap import base, creator, tools

평가 기능을 정의합니다. 유전 알고리즘을 만드는 첫 번째 단계입니다.

def eval_func(individual):
   target_sum = 15
   return len(individual) - abs(sum(individual) - target_sum),

이제 올바른 매개 변수로 도구 상자를 만듭니다.

def create_toolbox(num_bits):
   creator.create("FitnessMax", base.Fitness, weights=(1.0,))
   creator.create("Individual", list, fitness=creator.FitnessMax)

도구 상자 초기화

toolbox = base.Toolbox()
toolbox.register("attr_bool", random.randint, 0, 1)
toolbox.register("individual", tools.initRepeat, creator.Individual,
   toolbox.attr_bool, num_bits)
toolbox.register("population", tools.initRepeat, list, toolbox.individual)

평가 연산자 등록-

toolbox.register("evaluate", eval_func)

이제 크로스 오버 연산자를 등록하십시오.

toolbox.register("mate", tools.cxTwoPoint)

돌연변이 연산자 등록-

toolbox.register("mutate", tools.mutFlipBit, indpb = 0.05)

번식 연산자 정의-

toolbox.register("select", tools.selTournament, tournsize = 3)
return toolbox
if __name__ == "__main__":
   num_bits = 45
   toolbox = create_toolbox(num_bits)
   random.seed(7)
   population = toolbox.population(n = 500)
   probab_crossing, probab_mutating = 0.5, 0.2
   num_generations = 10
   print('\nEvolution process starts')

전체 모집단 평가-

fitnesses = list(map(toolbox.evaluate, population))
for ind, fit in zip(population, fitnesses):
   ind.fitness.values = fit
print('\nEvaluated', len(population), 'individuals')

생성 및 세대를 통해 반복-

for g in range(num_generations):
   print("\n- Generation", g)

차세대 개인 선택-

offspring = toolbox.select(population, len(population))

이제 선택한 개인을 복제합니다.

offspring = list(map(toolbox.clone, offspring))

자손에 교차 및 돌연변이 적용-

for child1, child2 in zip(offspring[::2], offspring[1::2]):
   if random.random() < probab_crossing:
   toolbox.mate(child1, child2)

자녀의 체력 값 삭제

del child1.fitness.values
del child2.fitness.values

자, 변이를 적용하십시오-

for mutant in offspring:
   if random.random() < probab_mutating:
   toolbox.mutate(mutant)
   del mutant.fitness.values

적합하지 않은 개인을 평가하십시오-

invalid_ind = [ind for ind in offspring if not ind.fitness.valid]
fitnesses = map(toolbox.evaluate, invalid_ind)
for ind, fit in zip(invalid_ind, fitnesses):
   ind.fitness.values = fit
print('Evaluated', len(invalid_ind), 'individuals')

이제 인구를 차세대 개인으로 대체하십시오.

population[:] = offspring

현재 세대에 대한 통계를 인쇄-

fits = [ind.fitness.values[0] for ind in population]
length = len(population)
mean = sum(fits) / length
sum2 = sum(x*x for x in fits)
std = abs(sum2 / length - mean**2)**0.5
print('Min =', min(fits), ', Max =', max(fits))
print('Average =', round(mean, 2), ', Standard deviation =',
round(std, 2))
print("\n- Evolution ends")

최종 출력 인쇄-

best_ind = tools.selBest(population, 1)[0]
   print('\nBest individual:\n', best_ind)
   print('\nNumber of ones:', sum(best_ind))
Following would be the output:
Evolution process starts
Evaluated 500 individuals
- Generation 0
Evaluated 295 individuals
Min = 32.0 , Max = 45.0
Average = 40.29 , Standard deviation = 2.61
- Generation 1
Evaluated 292 individuals
Min = 34.0 , Max = 45.0
Average = 42.35 , Standard deviation = 1.91
- Generation 2
Evaluated 277 individuals
Min = 37.0 , Max = 45.0
Average = 43.39 , Standard deviation = 1.46
… … … …
- Generation 9
Evaluated 299 individuals
Min = 40.0 , Max = 45.0
Average = 44.12 , Standard deviation = 1.11
- Evolution ends
Best individual:
[0, 0, 0, 1, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 1, 0, 1, 
 1, 0, 0, 0, 1, 0, 0, 0, 1, 1, 0, 0, 0, 1, 0, 0, 0,
 1, 0, 0, 1, 1, 1, 0, 0, 1, 0, 1]
Number of ones: 15

기호 회귀 문제

유전 프로그래밍에서 가장 잘 알려진 문제 중 하나입니다. 모든 기호 회귀 문제는 임의의 데이터 분포를 사용하고 기호 공식을 사용하여 가장 정확한 데이터를 맞추려고합니다. 일반적으로 RMSE (Root Mean Square Error)와 같은 측정은 개인의 체력을 측정하는 데 사용됩니다. 이것은 고전적인 회귀 문제이며 여기에서 방정식을 사용합니다.5x3-6x2+8x=1. 위의 예에서 따라야하는 모든 단계를 따라야하지만, 평가를 시작할 수 있도록 개인을위한 구성 요소이기 때문에 기본 세트를 만드는 것이 주요 부분입니다. 여기서 우리는 고전적인 프리미티브 세트를 사용할 것입니다.

다음 Python 코드는 이것을 자세히 설명합니다.

import operator
import math
import random
import numpy as np
from deap import algorithms, base, creator, tools, gp
def division_operator(numerator, denominator):
   if denominator == 0:
      return 1
   return numerator / denominator
def eval_func(individual, points):
   func = toolbox.compile(expr=individual)
   return math.fsum(mse) / len(points),
def create_toolbox():
   pset = gp.PrimitiveSet("MAIN", 1)
   pset.addPrimitive(operator.add, 2)
   pset.addPrimitive(operator.sub, 2)
   pset.addPrimitive(operator.mul, 2)
   pset.addPrimitive(division_operator, 2)
   pset.addPrimitive(operator.neg, 1)
   pset.addPrimitive(math.cos, 1)
   pset.addPrimitive(math.sin, 1)
   pset.addEphemeralConstant("rand101", lambda: random.randint(-1,1))
   pset.renameArguments(ARG0 = 'x')
   creator.create("FitnessMin", base.Fitness, weights = (-1.0,))
   creator.create("Individual",gp.PrimitiveTree,fitness=creator.FitnessMin)
   toolbox = base.Toolbox()
   toolbox.register("expr", gp.genHalfAndHalf, pset=pset, min_=1, max_=2)
   toolbox.expr)
   toolbox.register("population",tools.initRepeat,list, toolbox.individual)
   toolbox.register("compile", gp.compile, pset = pset)
   toolbox.register("evaluate", eval_func, points = [x/10. for x in range(-10,10)])
   toolbox.register("select", tools.selTournament, tournsize = 3)
   toolbox.register("mate", gp.cxOnePoint)
   toolbox.register("expr_mut", gp.genFull, min_=0, max_=2)
   toolbox.register("mutate", gp.mutUniform, expr = toolbox.expr_mut, pset = pset)
   toolbox.decorate("mate", gp.staticLimit(key = operator.attrgetter("height"), max_value = 17))
   toolbox.decorate("mutate", gp.staticLimit(key = operator.attrgetter("height"), max_value = 17))
   return toolbox
if __name__ == "__main__":
   random.seed(7)
   toolbox = create_toolbox()
   population = toolbox.population(n = 450)
   hall_of_fame = tools.HallOfFame(1)
   stats_fit = tools.Statistics(lambda x: x.fitness.values)
   stats_size = tools.Statistics(len)
   mstats = tools.MultiStatistics(fitness=stats_fit, size = stats_size)
   mstats.register("avg", np.mean)
   mstats.register("std", np.std)
   mstats.register("min", np.min)
   mstats.register("max", np.max)
   probab_crossover = 0.4
   probab_mutate = 0.2
   number_gen = 10
   population, log = algorithms.eaSimple(population, toolbox,
      probab_crossover, probab_mutate, number_gen,
      stats = mstats, halloffame = hall_of_fame, verbose = True)

모든 기본 단계는 비트 패턴을 생성하는 동안 사용 된 것과 동일합니다. 이 프로그램은 10 개 생성 후 최소, 최대, 표준 편차 (표준 편차)로 출력을 제공합니다.