स्क्रेपी - लॉगिंग
विवरण
Loggingघटनाओं पर नज़र रखने का मतलब है, जो अंतर्निहित लॉगिंग सिस्टम का उपयोग करता है और अनुप्रयोगों और पुस्तकालयों को लागू करने के लिए कार्यों और कक्षाओं को परिभाषित करता है। लॉगिंग एक रेडी-टू-यूज़ मटेरियल है, जो लॉगजींग सेटिंग्स में सूचीबद्ध स्क्रेपी सेटिंग्स के साथ काम कर सकता है।
स्क्रैपी कुछ डिफ़ॉल्ट सेटिंग्स सेट करेगा और कमांड चलाने के दौरान स्क्रैपी.टिल्स.लॉग.कॉन्फ़िगर_लॉगिंग () की मदद से उन सेटिंग्स को हैंडल करेगा।
लॉग स्तर
पायथन में, लॉग संदेश पर पांच अलग-अलग स्तर की गंभीरता होती है। निम्न सूची एक आरोही क्रम में मानक लॉग संदेश दिखाती है -
logging.DEBUG - डिबगिंग संदेशों के लिए (सबसे कम गंभीरता)
logging.INFO - सूचनात्मक संदेशों के लिए
logging.WARNING - चेतावनी संदेशों के लिए
logging.ERROR - नियमित त्रुटियों के लिए
logging.CRITICAL - गंभीर त्रुटियों के लिए (उच्चतम गंभीरता)
मैसेज कैसे लॉग करें
निम्न कोड का उपयोग कर एक संदेश लॉगिंग दिखाता है logging.info स्तर।
import logging
logging.info("This is an information")
उपर्युक्त लॉगिंग संदेश का उपयोग तर्क के रूप में किया जा सकता है logging.log निम्नानुसार दिखाया गया है -
import logging
logging.log(logging.INFO, "This is an information")
अब, आप लॉगिंग संदेश का उपयोग करने के लिए लॉगिंग सहायकों का उपयोग करके संदेश को संलग्न करने के लिए लॉगर्स का उपयोग भी कर सकते हैं:
import logging
logger = logging.getLogger()
logger.info("This is an information")
कई लॉगर हो सकते हैं और जिनके उपयोग के साथ उनके नाम प्राप्त करके उन तक पहुँचा जा सकता है logging.getLogger फ़ंक्शन निम्नानुसार दिखाया गया है।
import logging
logger = logging.getLogger('mycustomlogger')
logger.info("This is an information")
एक स्वनिर्धारित लकड़हारा __name__ चर का उपयोग करके किसी भी मॉड्यूल के लिए इस्तेमाल किया जा सकता है, जिसमें निम्नानुसार दिखाए गए मॉड्यूल पथ शामिल हैं -
import logging
logger = logging.getLogger(__name__)
logger.info("This is an information")
मकड़ियों से लॉगिंग
हर मकड़ी का उदाहरण है logger इसके भीतर और निम्नानुसार उपयोग किया जा सकता है -
import scrapy
class LogSpider(scrapy.Spider):
name = 'logspider'
start_urls = ['http://dmoz.com']
def parse(self, response):
self.logger.info('Parse function called on %s', response.url)
उपरोक्त कोड में, लकड़हारा स्पाइडर के नाम का उपयोग करके बनाया गया है, लेकिन आप पायथन द्वारा दिए गए किसी भी अनुकूलित लकड़हारा का उपयोग कर सकते हैं जैसा कि निम्नलिखित कोड में दिखाया गया है -
import logging
import scrapy
logger = logging.getLogger('customizedlogger')
class LogSpider(scrapy.Spider):
name = 'logspider'
start_urls = ['http://dmoz.com']
def parse(self, response):
logger.info('Parse function called on %s', response.url)
लॉगिंग कॉन्फ़िगरेशन
लोग अपने द्वारा भेजे गए संदेशों को प्रदर्शित नहीं कर पा रहे हैं। इसलिए उन्हें उन संदेशों को प्रदर्शित करने के लिए "हैंडलर" की आवश्यकता होती है और हैंडलर इन संदेशों को अपने संबंधित गंतव्यों जैसे फ़ाइल, ईमेल और मानक आउटपुट पर पुनर्निर्देशित करेंगे।
निम्नलिखित सेटिंग्स के आधार पर, स्क्रैपी लकड़हारे के लिए हैंडलर को कॉन्फ़िगर करेगा।
लॉगिंग सेटिंग्स
लॉगिंग को कॉन्फ़िगर करने के लिए निम्नलिखित सेटिंग्स का उपयोग किया जाता है -
LOG_FILE तथा LOG_ENABLED लॉग संदेशों के लिए गंतव्य तय करें।
जब आप सेट करते हैं LOG_ENCODING झूठे के लिए, यह लॉग आउटपुट संदेश प्रदर्शित नहीं करेगा।
LOG_LEVELसंदेश की गंभीरता क्रम निर्धारित करेगा; कम गंभीरता वाले उन संदेशों को फ़िल्टर किया जाएगा।
LOG_FORMAT तथा LOG_DATEFORMAT सभी संदेशों के लिए लेआउट निर्दिष्ट करने के लिए उपयोग किया जाता है।
जब आप सेट करते हैं LOG_STDOUT सच है, आपकी प्रक्रिया के सभी मानक आउटपुट और त्रुटि संदेश लॉग इन करने के लिए रीडायरेक्ट किए जाएंगे।
कमांड-लाइन विकल्प
निम्न तालिका में दिखाए गए अनुसार कमांड-लाइन तर्क पास करके स्क्रैप सेटिंग्स को ओवरराइड किया जा सकता है -
अनु क्रमांक | कमांड और विवरण |
---|---|
1 | --logfile FILE LOG_FILE को ओवरराइड करता है |
2 | --loglevel/-L LEVEL LOG_LEVEL को ओवरराइड करता है |
3 | --nolog गलत करने के लिए LOG_ENABLED सेट करता है |
scrapy.utils.log मॉड्यूल
इस फ़ंक्शन का उपयोग स्क्रेपी के लिए लॉगिंग डिफॉल्ट को आरंभ करने के लिए किया जा सकता है।
scrapy.utils.log.configure_logging(settings = None, install_root_handler = True)
अनु क्रमांक | पैरामीटर और विवरण |
---|---|
1 | settings (dict, None) यह रूट लकड़हारे के लिए हैंडलर बनाता और कॉन्फ़िगर करता है। डिफ़ॉल्ट रूप से, यह कोई भी नहीं है । |
2 | install_root_handler (bool) यह रूट लॉगिंग हैंडलर स्थापित करने के लिए निर्दिष्ट करता है। डिफ़ॉल्ट रूप से, यह सही है । |
उपरोक्त समारोह -
- पायथन मानक लॉगिंग के माध्यम से चेतावनी और मुड़ लॉग रूट।
- डिबग को स्क्रेपी और ईआरआरओआर स्तर को मुड़ लॉगर्स को सौंपता है।
- अगर लॉग_STDOUT सेटिंग सही है, तो रूट लॉग ऑन करने के लिए रूटआउट करता है।
डिफ़ॉल्ट विकल्पों का उपयोग करके ओवरराइड किया जा सकता है settingsबहस। जब सेटिंग्स निर्दिष्ट नहीं होती हैं, तो चूक का उपयोग किया जाता है। हैंडलर रूट लॉगर के लिए बनाया जा सकता है, जब install_root_handler सही पर सेट हो। यदि यह गलत पर सेट है, तो कोई लॉग आउटपुट सेट नहीं होगा। स्क्रेपी कमांड का उपयोग करते समय, कॉन्फ़िगर_लॉगिंग स्वचालित रूप से कहा जाएगा और यह कस्टम स्क्रिप्ट को चलाने के दौरान स्पष्ट रूप से चल सकता है।
लॉगिंग के आउटपुट को मैन्युअल रूप से कॉन्फ़िगर करने के लिए, आप उपयोग कर सकते हैं logging.basicConfig() निम्नानुसार दिखाया गया है -
import logging
from scrapy.utils.log import configure_logging
configure_logging(install_root_handler = False)
logging.basicConfig (
filename = 'logging.txt',
format = '%(levelname)s: %(your_message)s',
level = logging.INFO
)