Scrapy - Definisci un oggetto
Descrizione
Gli elementi sono i contenitori utilizzati per raccogliere i dati che vengono scartati dai siti web. Devi avviare il tuo ragno definendo il tuo oggetto. Per definire gli elementi, modificaitems.py file trovato nella directory first_scrapy(directory personalizzata). Il file items.py ha il seguente aspetto:
import scrapy
class First_scrapyItem(scrapy.Item):
# define the fields for your item here like:
# name = scrapy.Field()
La classe MyItem eredita da Item contenente un numero di oggetti predefiniti che Scrapy ha già creato per noi. Ad esempio, se si desidera estrarre il nome, l'URL e la descrizione dai siti, è necessario definire i campi per ciascuno di questi tre attributi.
Quindi, aggiungiamo quegli oggetti che vogliamo raccogliere -
from scrapy.item import Item, Field
class First_scrapyItem(scrapy.Item):
name = scrapy.Field()
url = scrapy.Field()
desc = scrapy.Field()