Numpy einsum calcola il prodotto esterno lungo l'asse
Ho due array numpy che contengono matrici compatibili e desidero calcolare il prodotto esterno saggio dell'elemento dell'utilizzo di numpy.einsum . Le forme degli array sarebbero:
A1 = (i,j,k)
A2 = (i,k,j)
Pertanto gli array contengono i
matrici di forma (k,j)
e (j,k)
rispettivamente.
Quindi dato A1
che conterrebbe le matrici A,B,C
e A2
conterrebbe le matrici D,E,F
, il risultato sarebbe:
A3 = (A(x)D,B(x)E,C(x)F)
Con (x)
essendo l'operatore prodotto esterno.
Ciò produrrebbe alla mia comprensione basata su questa risposta una matrice A3
della seguente forma:
A3 = (i,j*k,j*k)
Finora ho provato:
np.einsum("ijk, ilm -> ijklm", A1, A2)
Ma le forme risultanti non si adattano correttamente.
Come controllo di integrità sto testando questo:
A = np.asarray(([1,2],[3,4]))
B = np.asarray(([5,6],[7,8]))
AB_outer = np.outer(A,B)
A_vec = np.asarray((A,A))
B_vec = np.asarray((B,B))
# this line is not correct
AB_vec = np.einsum("ijk, ilm -> ijklm", A_vec,B_vec)
np.testing.assert_array_equal(AB_outer, AB_vec[0])
Questo attualmente genera un errore di asserzione poiché la mia notazione einsum non è corretta. Sono anche aperto a qualsiasi suggerimento che possa risolvere questo problema e sono più veloci o altrettanto veloci delle ninfe einsum.
Risposte
Possiamo estendere i fiocchi e lasciare broadcastingfare il lavoro per noi -
(A1[:,:,None,:,None]*A2[:,None,:,None,:]).swapaxes(2,3)
Esempio di corsa -
In [46]: A1 = np.random.rand(3,4,4)
...: A2 = np.random.rand(3,4,4)
In [47]: out = (A1[:,:,None,:,None]*A2[:,None,:,None,:]).swapaxes(2,3)
In [48]: np.allclose(np.multiply.outer(A1[0],A2[0]), out[0])
Out[48]: True
In [49]: np.allclose(np.multiply.outer(A1[1],A2[1]), out[1])
Out[49]: True
In [50]: np.allclose(np.multiply.outer(A1[2],A2[2]), out[2])
Out[50]: True
L'equivalente con np.einsumsarebbe -
np.einsum('ijk,ilm->ijklm',A1,A2)
Puoi calcolare il risultato eseguendo:
result = np.einsum('ijk,ikl->ijl', A1, A2)
Ho controllato il codice sopra sui seguenti dati di test:
A = np.arange(1, 13).reshape(3, -1)
B = np.arange(2, 14).reshape(3, -1)
C = np.arange(3, 15).reshape(3, -1)
D = np.arange(1, 13).reshape(4, -1)
E = np.arange(2, 14).reshape(4, -1)
F = np.arange(3, 15).reshape(4, -1)
A1 = np.array([A, B, C])
A2 = np.array([D, E, F])
Il risultato è:
array([[[ 70, 80, 90],
[158, 184, 210],
[246, 288, 330]],
[[106, 120, 134],
[210, 240, 270],
[314, 360, 406]],
[[150, 168, 186],
[270, 304, 338],
[390, 440, 490]]])
Ora calcola 3 "risultati parziali":
res_1 = A @ D
res_2 = B @ E
res_3 = C @ F
e controlla che siano uguali a sezioni consecutive del risultato.