Pythonの場合TypeError:ハッシュ不可能なタイプ: 'numpy.ndarray'

Aug 19 2020

リコールを見つけようとしましたが、タイプエラーが発生します

import pandas as pd
y_test = {'o1':  [0,1,0,1],'o2': [1,1,0,1],'o3':[0,0,1,1]}
y_test = pd.DataFrame (y_test)
y_pred = {'o1':  [1,1,0,1],'o2': [1,0,0,1],'o3':[1,0,1,1]}
y_pred = pd.DataFrame (y_pred)
y_pred = y_pred.to_numpy()


def precision(y_test, y_pred):
    i = set(y_test).intersection(y_pred)
    len1 = len(y_pred)
    if len1 == 0:
        return 0
    else:
        return len(i) / len1

print("recall of Binary Relevance Classifier: " + str(precision(y_test, y_pred)))

このコードはエラーを示しました:実際、私は以下のマルチラベル分類エラーの詳細のリコールを見つけようとします

TypeError                                 Traceback (most recent call last)
<ipython-input-41-8f3ca706a8e6> in <module>
16         return len(i) / len1
17 
---> 18 print("recall of Binary Relevance Classifier: " + str(precision(y_test, y_pred)))
<ipython-input-41-8f3ca706a8e6> in precision(y_test, y_pred)
 9 
10 def precision(y_test, y_pred):
---> 11     i = set(y_test).intersection(y_pred)
 12     len1 = len(y_pred)
 13     if len1 == 0:

TypeError: unhashable type: 'numpy.ndarray'

回答

1 CarolynConway Aug 19 2020 at 20:14

y_test配列は2次元であるため、numpy配列をセットに変換することはできません(11行目)。

イテラブルをセットに変換するには、アイテムがすべてハッシュ可能である必要があります。数値はハッシュ可能であるため、1次元のnumpy配列の場合は問題ありません。

>>> array_1d = np.array([1, 2, 3])
>>> array_1d
array([1, 2, 3])
>>> set(array_1d)
{1, 2, 3}

ただし、2次元配列の場合、ネストされた配列自体はハッシュ可能ではないため、このエラーが発生します。

>>> array_2d = np.array([[1,2,3], [1,2,3], [1,2,3]])
>>> array_2d
array([[1, 2, 3],
       [1, 2, 3],
       [1, 2, 3]])
>>> set(array_2d)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: unhashable type: 'numpy.ndarray'