Scrapy-예외
기술
불규칙한 이벤트를 예외라고합니다. Scrapy에서는 구성 누락, 항목 파이프 라인에서 항목 삭제 등과 같은 이유로 예외가 발생합니다. 다음은 Scrapy 및 해당 응용 프로그램에서 언급 된 예외 목록입니다.
DropItem
항목 파이프 라인은이 예외를 활용하여 모든 단계에서 항목 처리를 중지합니다. 다음과 같이 쓸 수 있습니다.
exception (scrapy.exceptions.DropItem)
CloseSpider
이 예외는 콜백 요청을 사용하여 스파이더를 중지하는 데 사용됩니다. 다음과 같이 쓸 수 있습니다.
exception (scrapy.exceptions.CloseSpider)(reason = 'cancelled')
닫는 이유를 지정하는 reason (str) 이라는 매개 변수가 포함되어 있습니다 .
예를 들어, 다음 코드는이 예외 사용법을 보여줍니다.
def parse_page(self, response):
if 'Bandwidth exceeded' in response.body:
raise CloseSpider('bandwidth_exceeded')
IgnoreRequest
이 예외는 스케줄러 또는 다운로더 미들웨어에서 요청을 무시하는 데 사용됩니다. 다음과 같이 쓸 수 있습니다.
exception (scrapy.exceptions.IgnoreRequest)
구성되지 않음
누락 된 구성 상황을 나타내며 구성 요소 생성자에서 발생해야합니다.
exception (scrapy.exceptions.NotConfigured)
다음 구성 요소가 비활성화 된 경우이 예외가 발생할 수 있습니다.
- Extensions
- 아이템 파이프 라인
- 다운로더 미들웨어
- 스파이더 미들웨어
지원되지 않음
이 예외는 기능이나 메서드가 지원되지 않을 때 발생합니다. 다음과 같이 쓸 수 있습니다.
exception (scrapy.exceptions.NotSupported)