스크래피-아이템
기술
Scrapy 프로세스는 스파이더를 사용하여 웹 페이지와 같은 소스에서 데이터를 추출하는 데 사용할 수 있습니다. 스크래피 사용Item 클래스는 스크랩 된 데이터를 수집하는 데 사용되는 객체의 출력을 생성합니다.
항목 신고
다음과 같이 필드 객체와 함께 클래스 정의 구문을 사용하여 항목을 선언 할 수 있습니다.
import scrapy
class MyProducts(scrapy.Item):
productName = Field()
productLink = Field()
imageURL = Field()
price = Field()
size = Field()
항목 필드
항목 필드는 각 필드에 대한 메타 데이터를 표시하는 데 사용됩니다. 필드 개체의 값에는 제한이 없으므로 액세스 가능한 메타 데이터 키는 메타 데이터의 참조 목록을 포함하지 않습니다. 필드 개체는 모든 필드 메타 데이터를 지정하는 데 사용되며 프로젝트의 요구 사항에 따라 다른 필드 키를 지정할 수 있습니다. 필드 개체는 Item.fields 속성을 사용하여 액세스 할 수 있습니다.
항목 작업
항목으로 작업 할 때 정의 할 수있는 몇 가지 공통 기능이 있습니다. 자세한 내용은이 링크를 클릭하십시오 .
항목 확장
항목은 원래 항목의 하위 클래스를 지정하여 확장 할 수 있습니다. 예를 들어-
class MyProductDetails(Product):
original_rate = scrapy.Field(serializer = str)
discount_rate = scrapy.Field()
다음 코드와 같이 값을 더 추가하거나 기존 값을 변경하여 기존 필드 메타 데이터를 사용하여 필드 메타 데이터를 확장 할 수 있습니다.
class MyProductPackage(Product):
name = scrapy.Field(Product.fields['name'], serializer = serializer_demo)
항목 개체
항목 객체는 주어진 인수에서 새로 초기화 된 항목을 제공하는 다음 클래스를 사용하여 지정할 수 있습니다.
class scrapy.item.Item([arg])
Item은 생성자의 복사본을 제공하고 필드의 항목에서 제공하는 추가 속성을 제공합니다.
필드 개체
Field 클래스가 추가 프로세스 또는 속성을 발행하지 않는 다음 클래스를 사용하여 필드 객체를 지정할 수 있습니다.
class scrapy.item.Field([arg])