¿Qué representan las características de estado de KukaGymEnv?
Intento usar DDPG aumentado con Hindsight Experience Replay (HER) en KukaGymEnv de pybullet .
Para formular el vector de características para el estado objetivo, necesito saber qué representan las características del estado del entorno. Para ser precisos, un vector de estado típico de KukaGymEnv es un objeto de la numpy.ndarray
clase con forma de (9,)
.
¿Qué representa cada uno de estos 8 elementos y cómo puedo formular el vector de estado objetivo para este entorno? Intenté revisar el código fuente de KukaGymEnv, pero no pude entender nada útil.
Respuestas
Aquí hay una respuesta incompleta, pero puede ayudar.
Su estado es leído por la función getExtendedObservation()
. Esta función hace dos cosas: llama a la función getObservation()
desde este código fuente , obtiene un estado y extiende este estado con tres componentes:
posición relativa x, y y ángulo de euler del bloque en el espacio de agarre
Pero, ¿cuáles son los 5 primeros componentes devueltos por getObservation()
? Por lo que leí, hay posiciones, luego ángulos de Euler que describen la orientación. Pero eso haría que 6 + 3 = 9 características, por lo que solo hay 2 posiciones o solo 2 ángulos de Euler. Puede que conozcas a kuka mejor que yo y sepas la respuesta de esta :).
Así que para resumir :
state = [X, Y, (Z, ) , Alpha, Gamma, (Beta, ), gripX, gripY, gripAlpha]
(O Z o Beta están ausentes)