Scrapy-Telnet 콘솔

기술

Telnet 콘솔은 Scrapy 프로세스 내에서 실행되는 Python 셸이며 Scrapy 실행 프로세스를 검사하고 제어하는 ​​데 사용됩니다.

Telnet 콘솔에 액세스

텔넷 콘솔은 다음 명령을 사용하여 액세스 할 수 있습니다.

telnet localhost 6023

기본적으로 텔넷 콘솔은 TCP 포트에 나열되어 있습니다. TELNETCONSOLE_PORT 설정.

변수

다음 표에 제공된 기본 변수 중 일부는 바로 가기로 사용됩니다.

Sr. 아니요 바로 가기 및 설명
1

crawler

이것은 Scrapy Crawler (scrapy.crawler.Crawler) 객체를 나타냅니다.

2

engine

이것은 Crawler.engine 속성을 참조합니다.

spider

이것은 활성화 된 거미를 나타냅니다.

4

slot

이것은 엔진 슬롯을 나타냅니다.

5

extensions

이것은 Extension Manager (Crawler.extensions) 속성을 나타냅니다.

6

stats

이것은 Stats Collector (Crawler.stats) 속성을 나타냅니다.

7

setting

이것은 Scrapy 설정 개체 (Crawler.settings) 속성을 참조합니다.

8

est

이것은 엔진 상태 보고서를 인쇄하는 것을 의미합니다.

9

prefs

디버깅을위한 메모리를 나타냅니다.

10

p

이것은 pprint.pprint 함수 에 대한 바로 가기를 나타냅니다 .

11

hpy

이것은 메모리 디버깅을 나타냅니다.

다음은 Telnet 콘솔을 사용한 몇 가지 예입니다.

Scrapy 엔진 일시 중지, 재개 및 중지

Scrapy 엔진을 일시 중지하려면 다음 명령을 사용하십시오.

telnet localhost 6023
>>> engine.pause()
>>>

Scrapy 엔진을 재개하려면 다음 명령을 사용하십시오-

telnet localhost 6023
>>> engine.unpause()
>>>

Scrapy 엔진을 중지하려면 다음 명령을 사용하십시오.

telnet localhost 6023
>>> engine.stop()
Connection closed by foreign host.

엔진 상태보기

Telnet 콘솔 사용 est() 다음 코드와 같이 Scrapy 엔진의 상태를 확인하는 방법-

telnet localhost 6023
>>> est()
Execution engine status

time()-engine.start_time                        : 8.62972998619
engine.has_capacity()                           : False
len(engine.downloader.active)                   : 16
engine.scraper.is_idle()                        : False
engine.spider.name                              : followall
engine.spider_is_idle(engine.spider)            : False
engine.slot.closing                             : False
len(engine.slot.inprogress)                     : 16
len(engine.slot.scheduler.dqs or [])            : 0
len(engine.slot.scheduler.mqs)                  : 92
len(engine.scraper.slot.queue)                  : 0
len(engine.scraper.slot.active)                 : 0
engine.scraper.slot.active_size                 : 0
engine.scraper.slot.itemproc_size               : 0
engine.scraper.slot.needs_backout()             : False

Telnet 콘솔 신호

텔넷 콘솔 신호를 사용하여 텔넷 로컬 네임 스페이스에서 변수를 추가, 업데이트 또는 삭제할 수 있습니다. 이 작업을 수행하려면 핸들러에 telnet_vars dict를 추가해야합니다.

scrapy.extensions.telnet.update_telnet_vars(telnet_vars)

매개 변수-

telnet_vars (dict)

여기서 dict는 텔넷 변수를 포함하는 사전입니다.

Telnet 설정

다음 표는 Telnet 콘솔의 동작을 제어하는 ​​설정을 보여줍니다-

Sr. 아니요 설정 및 설명 기본값
1

TELNETCONSOLE_PORT

이것은 텔넷 콘솔의 포트 범위를 나타냅니다. none으로 설정하면 포트가 동적으로 할당됩니다.

[6023, 6073]
2

TELNETCONSOLE_HOST

이것은 텔넷 콘솔이 수신해야하는 인터페이스를 나타냅니다.

'127.0.0.1'