स्क्रेपी - लॉगिंग

विवरण

Loggingघटनाओं पर नज़र रखने का मतलब है, जो अंतर्निहित लॉगिंग सिस्टम का उपयोग करता है और अनुप्रयोगों और पुस्तकालयों को लागू करने के लिए कार्यों और कक्षाओं को परिभाषित करता है। लॉगिंग एक रेडी-टू-यूज़ मटेरियल है, जो लॉगजींग सेटिंग्स में सूचीबद्ध स्क्रेपी सेटिंग्स के साथ काम कर सकता है।

स्क्रैपी कुछ डिफ़ॉल्ट सेटिंग्स सेट करेगा और कमांड चलाने के दौरान स्क्रैपी.टिल्स.लॉग.कॉन्फ़िगर_लॉगिंग () की मदद से उन सेटिंग्स को हैंडल करेगा।

लॉग स्तर

पायथन में, लॉग संदेश पर पांच अलग-अलग स्तर की गंभीरता होती है। निम्न सूची एक आरोही क्रम में मानक लॉग संदेश दिखाती है -

  • logging.DEBUG - डिबगिंग संदेशों के लिए (सबसे कम गंभीरता)

  • logging.INFO - सूचनात्मक संदेशों के लिए

  • logging.WARNING - चेतावनी संदेशों के लिए

  • logging.ERROR - नियमित त्रुटियों के लिए

  • logging.CRITICAL - गंभीर त्रुटियों के लिए (उच्चतम गंभीरता)

मैसेज कैसे लॉग करें

निम्न कोड का उपयोग कर एक संदेश लॉगिंग दिखाता है logging.info स्तर।

import logging 
logging.info("This is an information")

उपर्युक्त लॉगिंग संदेश का उपयोग तर्क के रूप में किया जा सकता है logging.log निम्नानुसार दिखाया गया है -

import logging 
logging.log(logging.INFO, "This is an information")

अब, आप लॉगिंग संदेश का उपयोग करने के लिए लॉगिंग सहायकों का उपयोग करके संदेश को संलग्न करने के लिए लॉगर्स का उपयोग भी कर सकते हैं:

import logging
logger = logging.getLogger()
logger.info("This is an information")

कई लॉगर हो सकते हैं और जिनके उपयोग के साथ उनके नाम प्राप्त करके उन तक पहुँचा जा सकता है logging.getLogger फ़ंक्शन निम्नानुसार दिखाया गया है।

import logging
logger = logging.getLogger('mycustomlogger')
logger.info("This is an information")

एक स्वनिर्धारित लकड़हारा __name__ चर का उपयोग करके किसी भी मॉड्यूल के लिए इस्तेमाल किया जा सकता है, जिसमें निम्नानुसार दिखाए गए मॉड्यूल पथ शामिल हैं -

import logging
logger = logging.getLogger(__name__)
logger.info("This is an information")

मकड़ियों से लॉगिंग

हर मकड़ी का उदाहरण है logger इसके भीतर और निम्नानुसार उपयोग किया जा सकता है -

import scrapy 

class LogSpider(scrapy.Spider):  
   name = 'logspider' 
   start_urls = ['http://dmoz.com']  
   def parse(self, response): 
      self.logger.info('Parse function called on %s', response.url)

उपरोक्त कोड में, लकड़हारा स्पाइडर के नाम का उपयोग करके बनाया गया है, लेकिन आप पायथन द्वारा दिए गए किसी भी अनुकूलित लकड़हारा का उपयोग कर सकते हैं जैसा कि निम्नलिखित कोड में दिखाया गया है -

import logging
import scrapy

logger = logging.getLogger('customizedlogger')
class LogSpider(scrapy.Spider):
   name = 'logspider'
   start_urls = ['http://dmoz.com']

   def parse(self, response):
      logger.info('Parse function called on %s', response.url)

लॉगिंग कॉन्फ़िगरेशन

लोग अपने द्वारा भेजे गए संदेशों को प्रदर्शित नहीं कर पा रहे हैं। इसलिए उन्हें उन संदेशों को प्रदर्शित करने के लिए "हैंडलर" की आवश्यकता होती है और हैंडलर इन संदेशों को अपने संबंधित गंतव्यों जैसे फ़ाइल, ईमेल और मानक आउटपुट पर पुनर्निर्देशित करेंगे।

निम्नलिखित सेटिंग्स के आधार पर, स्क्रैपी लकड़हारे के लिए हैंडलर को कॉन्फ़िगर करेगा।

लॉगिंग सेटिंग्स

लॉगिंग को कॉन्फ़िगर करने के लिए निम्नलिखित सेटिंग्स का उपयोग किया जाता है -

  • LOG_FILE तथा LOG_ENABLED लॉग संदेशों के लिए गंतव्य तय करें।

  • जब आप सेट करते हैं LOG_ENCODING झूठे के लिए, यह लॉग आउटपुट संदेश प्रदर्शित नहीं करेगा।

  • LOG_LEVELसंदेश की गंभीरता क्रम निर्धारित करेगा; कम गंभीरता वाले उन संदेशों को फ़िल्टर किया जाएगा।

  • LOG_FORMAT तथा LOG_DATEFORMAT सभी संदेशों के लिए लेआउट निर्दिष्ट करने के लिए उपयोग किया जाता है।

  • जब आप सेट करते हैं LOG_STDOUT सच है, आपकी प्रक्रिया के सभी मानक आउटपुट और त्रुटि संदेश लॉग इन करने के लिए रीडायरेक्ट किए जाएंगे।

कमांड-लाइन विकल्प

निम्न तालिका में दिखाए गए अनुसार कमांड-लाइन तर्क पास करके स्क्रैप सेटिंग्स को ओवरराइड किया जा सकता है -

अनु क्रमांक कमांड और विवरण
1

--logfile FILE

LOG_FILE को ओवरराइड करता है

2

--loglevel/-L LEVEL

LOG_LEVEL को ओवरराइड करता है

3

--nolog

गलत करने के लिए LOG_ENABLED सेट करता है

scrapy.utils.log मॉड्यूल

इस फ़ंक्शन का उपयोग स्क्रेपी के लिए लॉगिंग डिफॉल्ट को आरंभ करने के लिए किया जा सकता है।

scrapy.utils.log.configure_logging(settings = None, install_root_handler = True)

अनु क्रमांक पैरामीटर और विवरण
1

settings (dict, None)

यह रूट लकड़हारे के लिए हैंडलर बनाता और कॉन्फ़िगर करता है। डिफ़ॉल्ट रूप से, यह कोई भी नहीं है

2

install_root_handler (bool)

यह रूट लॉगिंग हैंडलर स्थापित करने के लिए निर्दिष्ट करता है। डिफ़ॉल्ट रूप से, यह सही है

उपरोक्त समारोह -

  • पायथन मानक लॉगिंग के माध्यम से चेतावनी और मुड़ लॉग रूट।
  • डिबग को स्क्रेपी और ईआरआरओआर स्तर को मुड़ लॉगर्स को सौंपता है।
  • अगर लॉग_STDOUT सेटिंग सही है, तो रूट लॉग ऑन करने के लिए रूटआउट करता है।

डिफ़ॉल्ट विकल्पों का उपयोग करके ओवरराइड किया जा सकता है settingsबहस। जब सेटिंग्स निर्दिष्ट नहीं होती हैं, तो चूक का उपयोग किया जाता है। हैंडलर रूट लॉगर के लिए बनाया जा सकता है, जब install_root_handler सही पर सेट हो। यदि यह गलत पर सेट है, तो कोई लॉग आउटपुट सेट नहीं होगा। स्क्रेपी कमांड का उपयोग करते समय, कॉन्फ़िगर_लॉगिंग स्वचालित रूप से कहा जाएगा और यह कस्टम स्क्रिप्ट को चलाने के दौरान स्पष्ट रूप से चल सकता है।

लॉगिंग के आउटपुट को मैन्युअल रूप से कॉन्फ़िगर करने के लिए, आप उपयोग कर सकते हैं logging.basicConfig() निम्नानुसार दिखाया गया है -

import logging 
from scrapy.utils.log import configure_logging  

configure_logging(install_root_handler = False) 
logging.basicConfig ( 
   filename = 'logging.txt', 
   format = '%(levelname)s: %(your_message)s', 
   level = logging.INFO 
)