Como posso obter elementos da matriz 3D usando índices especificados em numpy?
- Eu tenho uma matriz 3D, no exemplo abaixo é uma matriz (5, 4, 2):
data_matrix
- Eu tenho uma outra matriz de índice de forma (5, 4) onde cada linha da matriz representa a localização do elemento:
indx_array
Não sei como posso obter o required_output
. Estou tentando organizar (1,2) elementos de cada linha com base noindx_array
Não quero usar loops for!
data_matrix = np.array([
[[0, 1], [2, 3], [4, 5], [6, 7]],
[[8, 9], [10, 11], [12, 13], [14, 15]],
[[16, 17], [18, 19], [20, 21], [22, 23]],
[[24, 25], [26, 27], [28, 29], [30, 31]],
[[32, 33], [34, 35], [36, 37], [38, 39]]
])
indx_array = np.array([[3,2,1,0], [0,1,2,3], [1,0,3,2], [0,3,1,2], [1,2,3,0]])
# I want following result:
required_output = [
[[6, 7], [4, 5], [2, 3], [0, 1]]
[[8, 9], [10, 11], [12, 13], [14, 15]]
[[18, 19], [16, 17], [22, 23], [20, 21]]
[[24, 25], [30, 31], [26, 27], [28, 29]]
[[34, 35], [36, 37], [38, 39], [32, 33]]
]
EDIT: Atualizado indx_array
para ilustrar melhor a situação.
Respostas
- Numpy: Indexação
- Numpy: indexação de matrizes multidimensionais
In [637]: data_matrix.shape
Out[637]: (5, 4, 2)
In [638]: indx_array.shape
Out[638]: (5, 4)
Você precisa de indexação avançada nas 2 primeiras dimensões. O primeiro array de dimensão precisa ser transmitido com o segundo (5,4). Para fazer isso eu faço um (5,1) arange
:
In [639]: data_matrix[np.arange(5)[:,None], indx_array]
Out[639]:
array([[[ 6, 7],
[ 4, 5],
[ 2, 3],
[ 0, 1]],
[[ 8, 9],
[10, 11],
[12, 13],
[14, 15]],
[[18, 19],
[16, 17],
[22, 23],
[20, 21]],
[[24, 25],
[30, 31],
[26, 27],
[28, 29]],
[[34, 35],
[36, 37],
[38, 39],
[32, 33]]])
Compare meu índice (5,1) com o aceito _x
(que é (5,4) desorganizado):
In [640]: np.arange(5)[:,None]
Out[640]:
array([[0],
[1],
[2],
[3],
[4]])
In [641]: _x = np.repeat(np.arange(indx_array.shape[0]),indx_array.shape[1])
In [643]: _x
Out[643]: array([0, 0, 0, 0, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 3, 4, 4, 4, 4])
Com transmissão _x
, não precisa repetir, (5,4); (5,1) é o suficiente.
A transmissão faz uma repetição virtual. Isso pode ser ilustrado com a broadcast_to
função:
In [648]: np.broadcast_to(np.arange(5)[:,None],(5,4))
Out[648]:
array([[0, 0, 0, 0],
[1, 1, 1, 1],
[2, 2, 2, 2],
[3, 3, 3, 3],
[4, 4, 4, 4]])
In [649]: _.strides
Out[649]: (8, 0)
É aquele 0
passo que se repete sem fazer cópias. as_strided
é a stride_tricks
função mais útil , especialmente ao fazer coisas como mover janelas. Normalmente, apenas deixamos a transmissão automática fazer o trabalho sem nos preocupar muito com o como.
Pode ser feito com um pouco de manipulação da matriz de índice.
import numpy as np
_x = np.repeat(np.arange(indx_array.shape[0]),indx_array.shape[1])
_y = indx_array.ravel()
output = data_matrix[_x, _y].reshape(data_matrix.shape)
o que resulta na matriz numpy esperada
array([[[ 6, 7],
[ 4, 5],
[ 2, 3],
[ 0, 1]],
[[ 8, 9],
[10, 11],
[12, 13],
[14, 15]],
[[18, 19],
[16, 17],
[22, 23],
[20, 21]],
[[24, 25],
[30, 31],
[26, 27],
[28, 29]],
[[34, 35],
[36, 37],
[38, 39],
[32, 33]]])