Message d'erreur : ValueError : trop de valeurs à décompresser dans la distribution de fréquence de NLTK

Aug 17 2020

Je reçois une erreur en tant que ValueError: trop de valeurs à décompresser (attendu 2) pour le code ci-dessous. Je ne sais pas si c'est à cause du trop grand nombre de noms.

from nltk.corpus import brown
import nltk

tagged_words = brown.tagged_words(categories='mystery')

for word, tag in tagged_words:
   if any(noun_tag in tag for noun_tag in ['NP', 'NN']):

       nouns=(word,tag)


for word, tag in nouns:
   nouns_freq =nltk.FreqDist(word)

Veuillez suggérer

Erreur:

Traceback (most recent call last):

File "C:\Users\\Word2Vec.py", line 12, in module


for word, tag in nouns:

ValueError: too many values to unpack (expected 2)

Réponses

1 thorntonc Aug 17 2020 at 07:27

Le code suivant vous donnera la fréquence des noms du genre mystère dans le corpus brun.

from nltk.corpus import brown
from nltk import FreqDist

tagged_words = brown.tagged_words(categories='mystery')

# get list of lowercased nouns    
nouns = [word[0].lower() for word in tagged_words if word[1] in ['NP', 'NN']]    
nouns_freq = FreqDist(nouns)