どうすればscipyスパース行列をsympyスパース行列に効率的に変換できますか?

Aug 19 2020

次のプロパティを持つ行列Aがあります。

<1047x1047 sparse matrix of type '<class 'numpy.float64'>'
    with 888344 stored elements in Compressed Sparse Column format>

Aにはこのコンテンツがあります。

array([[ 1.00000000e+00, -5.85786642e-17, -3.97082034e-17, ...,
         0.00000000e+00,  0.00000000e+00,  0.00000000e+00],
       [ 6.82195979e-17,  1.00000000e+00, -4.11166786e-17, ...,
         0.00000000e+00,  0.00000000e+00,  0.00000000e+00],
       [-4.98202332e-17,  1.13957868e-17,  1.00000000e+00, ...,
         0.00000000e+00,  0.00000000e+00,  0.00000000e+00],
       ...,
       [ 4.56847824e-15,  1.32261454e-14, -7.22890998e-15, ...,
         1.00000000e+00,  0.00000000e+00,  0.00000000e+00],
       [-9.11597396e-15, -2.28796167e-14,  1.26624823e-14, ...,
         0.00000000e+00,  1.00000000e+00,  0.00000000e+00],
       [ 1.80765584e-14,  1.93779820e-14, -1.36520100e-14, ...,
         0.00000000e+00,  0.00000000e+00,  1.00000000e+00]])

今、私はこのscipyスパース行列からsympyスパース行列を作成しようとしています。

from sympy.matrices import SparseMatrix
A = SparseMatrix(A)

しかし、このエラーメッセージが表示されます。

ValueError: The truth value of an array with more than one element is ambiguous. Use a.any() or a.all().

この行列には論理エントリがないため、混乱しています。

助けてくれてありがとう!

回答

3 hpaulj Aug 19 2020 at 02:26

エラー

理解できないエラーが発生した場合は、少し時間をかけてトレースバックを確認してください。または、少なくともそれを私たちに見せてください!

In [288]: M = sparse.random(5,5,.2, 'csr')                                                           

In [289]: M                                                                                          
Out[289]: 
<5x5 sparse matrix of type '<class 'numpy.float64'>'
    with 5 stored elements in Compressed Sparse Row format>

In [290]: print(M)                                                                                   
  (1, 1)    0.17737340878962138
  (2, 2)    0.12362174819457106
  (2, 3)    0.24324155883057885
  (3, 0)    0.7666429046432961
  (3, 4)    0.21848551209470246

In [291]: SparseMatrix(M)                                                                            
---------------------------------------------------------------------------
ValueError                                Traceback (most recent call last)
<ipython-input-291-cca56ea35868> in <module>
----> 1 SparseMatrix(M)

/usr/local/lib/python3.6/dist-packages/sympy/matrices/sparse.py in __new__(cls, *args, **kwargs)
    206             else:
    207                 # handle full matrix forms with _handle_creation_inputs
--> 208                 r, c, _list = Matrix._handle_creation_inputs(*args)
    209                 self.rows = r
    210                 self.cols = c

/usr/local/lib/python3.6/dist-packages/sympy/matrices/matrices.py in _handle_creation_inputs(cls, *args, **kwargs)
   1070                             if 0 in row.shape:
   1071                                 continue
-> 1072                         elif not row:
   1073                             continue
   1074 

/usr/local/lib/python3.6/dist-packages/scipy/sparse/base.py in __bool__(self)
    281             return self.nnz != 0
    282         else:
--> 283             raise ValueError("The truth value of an array with more than one "
    284                              "element is ambiguous. Use a.any() or a.all().")
    285     __nonzero__ = __bool__

ValueError: The truth value of an array with more than one element is ambiguous. Use a.any() or a.all().

完全に理解するにはsympyコードを読む必要がありますが、ざっと見ただけで、入力を「完全なマトリックス」として処理しようとしていることを示し、行を調べます。エラーは、エントリに対して論理演算を実行した結果ではありませんが、sympyスパース行列に対して論理テストを実行しているためです。行が空かどうかを確認しようとしています(スキップできるように)。

SparseMatrixドキュメントは最も明確ではないかもしれませんが、ほとんどの例は、ポイントのdict、ALL値と形状のフラット配列、またはリストの不規則なリストのいずれかを示しています。行ごとに見て、マトリックスをそのように処理しようとしているのではないかと思います。

しかし、の行M自体はスパース行列です。

In [295]: [row for row in M]                                                                         
Out[295]: 
[<1x5 sparse matrix of type '<class 'numpy.float64'>'
    with 0 stored elements in Compressed Sparse Row format>,
 <1x5 sparse matrix of type '<class 'numpy.float64'>'
    with 1 stored elements in Compressed Sparse Row format>,
...]

そして、その行が空であるかどうかを確認しようとすると、not row次のエラーが発生します。

In [296]: not [row for row in M][0]                                                                  
...
ValueError: The truth value of an array with more than one element is ambiguous. Use a.any() or a.all().

したがって、明らかに行列をそのままSparseMatrix処理することはできませんscipy.sparse(少なくとも、csrまたはcsc形式ではなく、おそらく他の形式でもありません。さらにscipy.sparseSparseMatrixドキュメントのどこにも言及されていません!

密な配列から

スパース行列をその密な同等物に変換することは機能します:

In [297]: M.A                                                                                        
Out[297]: 
array([[0.        , 0.        , 0.        , 0.        , 0.        ],
       [0.        , 0.17737341, 0.        , 0.        , 0.        ],
       [0.        , 0.        , 0.12362175, 0.24324156, 0.        ],
       [0.7666429 , 0.        , 0.        , 0.        , 0.21848551],
       [0.        , 0.        , 0.        , 0.        , 0.        ]])

In [298]: SparseMatrix(M.A)                                                                          
Out[298]: 
⎡        0                  0                  0                  0                  0        ⎤
...⎦

またはリストのリスト:

 SparseMatrix(M.A.tolist()) 

dictから

このdok形式は、スパース行列をとして格納しdictます。

In [305]: dict(M.todok())                                                                            
Out[305]: 
{(3, 0): 0.7666429046432961,
 (1, 1): 0.17737340878962138,
 (2, 2): 0.12362174819457106,
 (2, 3): 0.24324155883057885,
 (3, 4): 0.21848551209470246}

これは入力として正常に機能します:

SparseMatrix(5,5,dict(M.todok()))

何が一番効率的かわかりません。一般的に、sympy私たち(または少なくとも私)と一緒に仕事をするときは、効率について心配する必要はありません。動作させるだけで十分です。効率はnumpy/scipy、配列が大きくなる可能性がある場合により重要であり、高速にコンパイルされたnumpyメソッドを使用すると、速度に大きな違いが生じます。

最後に-numpyそしてsympy統合されていません。これは、スパースバージョンにも当てはまります。sympyではなくPythonで構築されていnumpyます。したがって、リストとdictの形式での入力が最も理にかなっています。

1 CJR Aug 19 2020 at 01:24
from sympy.matrices import SparseMatrix
import scipy.sparse as sps

A = sps.random(100, 10, format="dok")
B = SparseMatrix(100, 10, dict(A.items()))

効率的な記憶構造が好きな人の観点からは、これは深淵を見つめるようなものです。しかし、それは機能します。

1 mathfux Aug 19 2020 at 02:12

これはエラーの簡略版です。

from scipy import sparse
row = np.array([0, 0, 1, 2, 2, 2])
col = np.array([0, 2, 2, 0, 1, 2])
data = np.array([1, 2, 3, 4, 5, 6])
A = sparse.csc_matrix((data, (row, col)), shape=(3, 3))

だから、A6つの要素を持つスパース行列は次のようになります。

<3x3 sparse matrix of type '<class 'numpy.intc'>'
    with 6 stored elements in Compressed Sparse Column format>

それを呼び出すSparseMatrix()と、あなたが持っているのと同じ種類のエラーが返されます。A最初にnumpy配列に変換することをお勧めします。

>>> SparseMatrix(A.todense())
Matrix([
[1, 0, 2],
[0, 0, 3],
[4, 5, 6]])