KukaGymEnv의 상태 기능은 무엇을 나타 냅니까?
Aug 18 2020
pybullet의 KukaGymEnv 에서 Hindsight Experience Replay (HER)로 증강 된 DDPG를 사용하려고합니다 .
목표 상태에 대한 특징 벡터를 공식화하려면 환경 상태의 특징이 무엇을 나타내는 지 알아야합니다. 정확히 말하면 KukaGymEnv의 일반적인 상태 벡터 numpy.ndarray
는 모양이 (9,)
.
이 8 가지 요소 각각은 무엇을 나타내며이 환경에 대한 목표 상태 벡터를 어떻게 공식화 할 수 있습니까? KukaGymEnv 의 소스 코드 를 살펴 보았지만 유용한 것을 이해할 수 없었습니다.
답변
1 16Aghnar Aug 18 2020 at 14:09
여기에 불완전한 답변이 있지만 도움이 될 수 있습니다.
함수가 상태를 읽습니다 getExtendedObservation()
. 이 함수는 두 가지를 만듭니다. 이 소스 코드getObservation()
에서 함수 를 호출하고 상태를 가져오고이 상태를 세 가지 구성 요소로 확장합니다.
그리퍼 공간에서 블록의 상대 x, y 위치 및 오일러 각도
그러나 반환 된 5 개의 첫 번째 구성 요소는 getObservation()
무엇입니까? 내가 읽은 것에서 위치가 있고 방향을 설명하는 오일러 각도가 있습니다. 그러나 그것은 6 + 3 = 9 피처를 만들 것이므로 2 개의 위치 만 있거나 2 개의 오일러 각도 만 있습니다. 당신은 나보다 kuka를 더 잘 알고 이것에 대한 답을 알 수 있습니다. :).
그래서 요약하면 :
state = [X, Y, (Z, ) , Alpha, Gamma, (Beta, ), gripX, gripY, gripAlpha]
(Z 또는 베타가 없음)