Cosa rappresentano le caratteristiche statali di KukaGymEnv?
Sto cercando di utilizzare DDPG aumentato con Hindsight Experience Replay (HER) su KukaGymEnv di pybullet .
Per formulare il vettore delle caratteristiche per lo stato obiettivo, ho bisogno di sapere cosa rappresentano le caratteristiche dello stato dell'ambiente. Per essere precisi, un tipico vettore di stato di KukaGymEnv è un oggetto della numpy.ndarray
classe con una forma di (9,)
.
Cosa rappresentano ciascuno di questi 8 elementi e come posso formulare il vettore dello stato obiettivo per questo ambiente? Ho provato a esaminare il codice sorgente di KukaGymEnv, ma non sono riuscito a capire nulla di utile.
Risposte
Ecco una risposta incompleta, ma può aiutare.
Il tuo stato viene letto dalla funzione getExtendedObservation()
. Questa funzione fa due cose: chiama la funzione getObservation()
da questo codice sorgente , ottiene uno stato ed estende questo stato con tre componenti:
posizione x,y relativa e angolo di eulero del blocco nello spazio della pinza
Ma quali sono i primi 5 componenti restituiti da getObservation()
? Da quello che ho letto, ci sono posizioni, poi angoli di eulero che descrivono l'orientamento. Ma questo farebbe 6 + 3 = 9 caratteristiche, quindi ci sono solo 2 posizioni o solo 2 angoli di Eulero. Potresti conoscere Kuka meglio di me e conoscere la risposta di questo :).
Quindi, riassumendo:
state = [X, Y, (Z, ) , Alpha, Gamma, (Beta, ), gripX, gripY, gripAlpha]
(Z o Beta sono assenti)