MySQLi - डुप्लिकेट को संभालना

टेबल्स या परिणाम सेट में कभी-कभी डुप्लिकेट रिकॉर्ड होते हैं। कभी-कभी, इसकी अनुमति होती है लेकिन कभी-कभी डुप्लिकेट रिकॉर्ड को रोकने की आवश्यकता होती है। कभी-कभी, डुप्लिकेट रिकॉर्ड की पहचान करना और उन्हें तालिका से निकालना आवश्यक है। यह अध्याय वर्णन करेगा कि तालिका में होने वाले डुप्लिकेट रिकॉर्ड को कैसे रोका जाए और पहले से मौजूद डुप्लिकेट रिकॉर्ड को कैसे हटाया जाए।

तालिका में आवर्ती से डुप्लिकेट रोकना

आप एक का उपयोग कर सकते हैं PRIMARY KEY या UNIQUEडुप्लिकेट रिकॉर्ड को रोकने के लिए उपयुक्त फ़ील्ड वाली तालिका पर अनुक्रमणिका। आइए एक उदाहरण लेते हैं: निम्न तालिका में ऐसी कोई अनुक्रमणिका या प्राथमिक कुंजी नहीं है, इसलिए यह पहले_नाम और अंतिम_नाम के लिए डुप्लिकेट रिकॉर्ड की अनुमति देगी।

CREATE TABLE person_tbl (
   first_name CHAR(20),
   last_name CHAR(20),
   sex CHAR(10)
);

इस तालिका में एक ही पहले और अंतिम नाम मूल्यों के साथ कई रिकॉर्ड को रोकने के लिए, इसकी परिभाषा में एक प्राथमिक कुंजी जोड़ें। जब आप ऐसा करते हैं, तो अनुक्रमित स्तंभों को पूर्ण नहीं घोषित करना भी आवश्यक है, क्योंकि एक प्राथमिक कुंजी पूर्ण मानों की अनुमति नहीं देता है -

CREATE TABLE person_tbl (
   first_name CHAR(20) NOT NULL,
   last_name CHAR(20) NOT NULL,
   sex CHAR(10),
   PRIMARY KEY (last_name, first_name)
);

यदि आप तालिका में एक रिकॉर्ड सम्मिलित करते हैं जो स्तंभ या स्तंभों में एक मौजूदा रिकॉर्ड को डुप्लिकेट करता है जो सूचकांक को परिभाषित करता है, तो एक तालिका में एक अद्वितीय सूचकांक की उपस्थिति आमतौर पर एक त्रुटि का कारण बनती है।

उपयोग INSERT IGNORE बजाय INSERT। यदि कोई रिकॉर्ड मौजूदा रिकॉर्ड की नकल नहीं करता है, तो MySQLi इसे हमेशा की तरह सम्मिलित करता है। यदि रिकॉर्ड एक डुप्लिकेट है, तो IGNORE कीवर्ड MySQLi को त्रुटि उत्पन्न किए बिना इसे चुपचाप छोड़ने के लिए कहता है।

निम्नलिखित उदाहरण में त्रुटि नहीं है और एक ही समय में यह डुप्लिकेट रिकॉर्ड नहीं डालेगा।

mysql> INSERT IGNORE INTO person_tbl (last_name, first_name)
   -> VALUES( 'Jay', 'Thomas');
Query OK, 1 row affected (0.00 sec)
mysql> INSERT IGNORE INTO person_tbl (last_name, first_name)
   -> VALUES( 'Jay', 'Thomas');
Query OK, 0 rows affected (0.00 sec)

उपयोग REPLACEINSERT के बजाय। यदि रिकॉर्ड नया है, तो इसे INSERT के समान ही डाला गया है। यदि यह एक डुप्लिकेट है, तो नया रिकॉर्ड पुराने को बदल देता है -

mysql> REPLACE INTO person_tbl (last_name, first_name)
   -> VALUES( 'Ajay', 'Kumar');
Query OK, 1 row affected (0.00 sec)

mysql> REPLACE INTO person_tbl (last_name, first_name)
   -> VALUES( 'Ajay', 'Kumar');
Query OK, 2 rows affected (0.00 sec)

INSERT IGNORE और REPLACE को आपके द्वारा अपनाए जाने वाले डुप्लिकेट-हैंडलिंग व्यवहार के अनुसार चुना जाना चाहिए। INSERT IGNORE डुप्लीकेट रिकॉर्ड्स के एक सेट को पहले रखता है और बाकी को डिस्क्राइब करता है। REPLACE डुप्लिकेट के एक सेट के अंतिम को रखता है और किसी भी पहले वाले को मिटा देता है।

विशिष्टता को लागू करने का एक और तरीका एक तालिका में एक प्राथमिक कुंजी के बजाय एक अद्वितीय सूचकांक जोड़ना है।

CREATE TABLE person_tbl (
   first_name CHAR(20) NOT NULL,
   last_name CHAR(20) NOT NULL,
   sex CHAR(10)
   UNIQUE (last_name, first_name)
);

डुप्लिकेट की पहचान और पहचान करना

एक तालिका में first_name और last_name के साथ डुप्लिकेट रिकॉर्ड की गणना करने के लिए निम्नलिखित प्रश्न है।

mysql> SELECT COUNT(*) as repetitions, last_name, first_name
   -> FROM person_tbl
   -> GROUP BY last_name, first_name
   -> HAVING repetitions > 1;

यह क्वेरी person_tbl तालिका में सभी डुप्लिकेट रिकॉर्डों की सूची लौटाएगी। सामान्य तौर पर, डुप्लिकेट किए गए मानों के सेट की पहचान करने के लिए, निम्नलिखित करें -

  • निर्धारित करें कि कौन से कॉलम में ऐसे मान हैं जो डुप्लिकेट हो सकते हैं।

  • COUNT (*) के साथ कॉलम चयन सूची में उन कॉलमों को सूचीबद्ध करें।

  • समूह BY कॉलम में कॉलम को भी सूचीबद्ध करें।

  • एक HAVING क्लॉज जोड़ें जो एक से अधिक होने के लिए ग्रुप काउंट की आवश्यकता के द्वारा अद्वितीय मूल्यों को समाप्त करता है।

क्वेरी परिणाम से डुप्लिकेट को समाप्त करना:

आप उपयोग कर सकते हैं DISTINCT तालिका में उपलब्ध अद्वितीय रिकॉर्ड का पता लगाने के लिए सेलेक्ट स्टेटमेंट के साथ।

mysql> SELECT DISTINCT last_name, first_name
   -> FROM person_tbl
   -> ORDER BY last_name;

DISTINCT का एक विकल्प यह है कि आप जिन कॉलमों का चयन कर रहे हैं उनका नाम एक ग्रुप BY क्लॉज में जोड़ें। इसमें डुप्लिकेट को हटाने और निर्दिष्ट कॉलम में मूल्यों के केवल अद्वितीय संयोजनों का चयन करने का प्रभाव है -

mysql> SELECT last_name, first_name
   -> FROM person_tbl
   -> GROUP BY (last_name, first_name);

तालिका प्रतिस्थापन का उपयोग करके डुप्लिकेट को निकालना

यदि आपके पास किसी तालिका में डुप्लिकेट रिकॉर्ड हैं और आप उस तालिका से सभी डुप्लिकेट रिकॉर्ड निकालना चाहते हैं, तो यहां प्रक्रिया है -

mysql> CREATE TABLE tmp SELECT last_name, first_name, sex
   -> FROM person_tbl;
   -> GROUP BY (last_name, first_name);
mysql> DROP TABLE person_tbl;
mysql> ALTER TABLE tmp RENAME TO person_tbl;

किसी तालिका से डुप्लिकेट रिकॉर्ड को निकालने का एक आसान तरीका उस तालिका में एक INDEX या PRIMAY कुंजी जोड़ना है। यहां तक ​​कि अगर यह तालिका पहले से ही उपलब्ध है, तो आप डुप्लिकेट रिकॉर्ड को हटाने के लिए इस तकनीक का उपयोग कर सकते हैं और आप भविष्य में भी सुरक्षित रहेंगे।

mysql> ALTER IGNORE TABLE person_tbl 
   -> ADD PRIMARY KEY (last_name, first_name);