Cosa rappresentano le caratteristiche statali di KukaGymEnv?

Aug 18 2020

Sto cercando di utilizzare DDPG aumentato con Hindsight Experience Replay (HER) su KukaGymEnv di pybullet .

Per formulare il vettore delle caratteristiche per lo stato obiettivo, ho bisogno di sapere cosa rappresentano le caratteristiche dello stato dell'ambiente. Per essere precisi, un tipico vettore di stato di KukaGymEnv è un oggetto della numpy.ndarrayclasse con una forma di (9,).

Cosa rappresentano ciascuno di questi 8 elementi e come posso formulare il vettore dello stato obiettivo per questo ambiente? Ho provato a esaminare il codice sorgente di KukaGymEnv, ma non sono riuscito a capire nulla di utile.

Risposte

1 16Aghnar Aug 18 2020 at 14:09

Ecco una risposta incompleta, ma può aiutare.

Il tuo stato viene letto dalla funzione getExtendedObservation(). Questa funzione fa due cose: chiama la funzione getObservation()da questo codice sorgente , ottiene uno stato ed estende questo stato con tre componenti:

posizione x,y relativa e angolo di eulero del blocco nello spazio della pinza

Ma quali sono i primi 5 componenti restituiti da getObservation()? Da quello che ho letto, ci sono posizioni, poi angoli di eulero che descrivono l'orientamento. Ma questo farebbe 6 + 3 = 9 caratteristiche, quindi ci sono solo 2 posizioni o solo 2 angoli di Eulero. Potresti conoscere Kuka meglio di me e conoscere la risposta di questo :).

Quindi, riassumendo:

state = [X, Y, (Z, ) , Alpha, Gamma, (Beta, ), gripX, gripY, gripAlpha]

(Z o Beta sono assenti)