MySQL - डुप्लिकेट को संभालना

आम तौर पर, टेबल या परिणाम सेट में कभी-कभी डुप्लिकेट रिकॉर्ड होते हैं। अधिकांश बार इसकी अनुमति होती है लेकिन कभी-कभी डुप्लिकेट रिकॉर्ड को रोकने की आवश्यकता होती है। डुप्लिकेट रिकॉर्ड की पहचान करना और उन्हें तालिका से निकालना आवश्यक है। यह अध्याय वर्णन करेगा कि तालिका में डुप्लिकेट रिकॉर्ड की घटना को कैसे रोका जाए और पहले से मौजूद डुप्लिकेट रिकॉर्ड को कैसे हटाया जाए।

तालिका में आवर्ती से डुप्लिकेट रोकना

आप एक का उपयोग कर सकते हैं PRIMARY KEY या ए UNIQUE डुप्लिकेट रिकॉर्ड को रोकने के लिए उपयुक्त फ़ील्ड के साथ एक मेज पर सूचकांक।

हम एक उदाहरण लेते हैं - निम्न तालिका में ऐसी कोई सूची या प्राथमिक कुंजी नहीं है, इसलिए यह डुप्लिकेट रिकॉर्ड की अनुमति देगा first_name तथा last_name

CREATE TABLE person_tbl (
   first_name CHAR(20),
   last_name CHAR(20),
   sex CHAR(10)
);

इस तालिका में एक ही पहले और अंतिम नाम मूल्यों के साथ कई रिकॉर्ड को रोकने के लिए, एक जोड़ें PRIMARY KEYइसकी परिभाषा के लिए। जब आप ऐसा करते हैं, तो अनुक्रमित स्तंभों को घोषित करना भी आवश्यक हैNOT NULL, क्यों की PRIMARY KEY अनुमति नहीं देता है NULL मान -

CREATE TABLE person_tbl (
   first_name CHAR(20) NOT NULL,
   last_name CHAR(20) NOT NULL,
   sex CHAR(10),
   PRIMARY KEY (last_name, first_name)
);

यदि आप तालिका में एक रिकॉर्ड सम्मिलित करते हैं जो स्तंभ या स्तंभों में एक मौजूदा रिकॉर्ड को डुप्लिकेट करता है जो सूचकांक को परिभाषित करता है, तो एक तालिका में एक अद्वितीय सूचकांक की उपस्थिति आमतौर पर एक त्रुटि का कारण बनती है।

उपयोग INSERT IGNORE के बजाय आदेश INSERTआदेश। यदि कोई रिकॉर्ड मौजूदा रिकॉर्ड की नकल नहीं करता है, तो MySQL इसे हमेशा की तरह सम्मिलित करता है। यदि रिकॉर्ड डुप्लिकेट है, तोIGNORE कीवर्ड एक त्रुटि उत्पन्न किए बिना MySQL को इसे चुपचाप त्यागने के लिए कहता है।

निम्न उदाहरण त्रुटि नहीं करता है और साथ ही यह डुप्लिकेट रिकॉर्ड भी सम्मिलित नहीं करेगा।

mysql> INSERT IGNORE INTO person_tbl (last_name, first_name)
   -> VALUES( 'Jay', 'Thomas');
Query OK, 1 row affected (0.00 sec)

mysql> INSERT IGNORE INTO person_tbl (last_name, first_name)
   -> VALUES( 'Jay', 'Thomas');
Query OK, 0 rows affected (0.00 sec)

उपयोग REPLACEINSERT कमांड के बजाय कमांड। यदि रिकॉर्ड नया है, तो इसे INSERT के साथ ही डाला जाता है। यदि यह एक डुप्लिकेट है, तो नया रिकॉर्ड पुराने को बदल देता है।

mysql> REPLACE INTO person_tbl (last_name, first_name)
   -> VALUES( 'Ajay', 'Kumar');
Query OK, 1 row affected (0.00 sec)

mysql> REPLACE INTO person_tbl (last_name, first_name)
   -> VALUES( 'Ajay', 'Kumar');
Query OK, 2 rows affected (0.00 sec)

INSERT IGNORE और REPLACE कमांड को डुप्लिकेट-हैंडलिंग व्यवहार के अनुसार चुना जाना चाहिए जिसे आप प्रभावित करना चाहते हैं। INSERT IGNORE कमांड डुप्लिकेट किए गए रिकॉर्ड का पहला सेट रखता है और शेष को छोड़ देता है। REPLACE कमांड डुप्लिकेट का अंतिम सेट रखता है और पहले वाले को मिटा देता है।

विशिष्टता को लागू करने का एक और तरीका है, एक जोड़ना UNIQUE एक तालिका में एक प्राथमिक कुंजी के बजाय सूचकांक।

CREATE TABLE person_tbl (
   first_name CHAR(20) NOT NULL,
   last_name CHAR(20) NOT NULL,
   sex CHAR(10)
   UNIQUE (last_name, first_name)
);

डुप्लिकेट की पहचान और पहचान करना

एक तालिका में first_name और last_name के साथ डुप्लिकेट रिकॉर्ड की गणना करने के लिए निम्नलिखित प्रश्न है।

mysql> SELECT COUNT(*) as repetitions, last_name, first_name
   -> FROM person_tbl
   -> GROUP BY last_name, first_name
   -> HAVING repetitions > 1;

यह क्वेरी person_tbl तालिका में सभी डुप्लिकेट रिकॉर्ड की एक सूची लौटाएगी। सामान्य तौर पर, डुप्लिकेट किए गए मानों के सेट की पहचान करने के लिए, नीचे दिए गए चरणों का पालन करें।

  • निर्धारित करें कि कौन से कॉलम में ऐसे मान हैं जो डुप्लिकेट हो सकते हैं।

  • कॉलम चयन सूची में उन कॉलमों को सूचीबद्ध करें, जिनके साथ COUNT(*)

  • कॉलम को सूचीबद्ध करें GROUP BY साथ ही खंड।

  • एक जोड़ें HAVING समूह जो एक से अधिक होने के लिए समूह की आवश्यकता के द्वारा अद्वितीय मूल्यों को समाप्त करता है।

एक क्वेरी परिणाम से डुप्लिकेट को खत्म करना

आप उपयोग कर सकते हैं DISTINCT तालिका में उपलब्ध अद्वितीय अभिलेखों का पता लगाने के लिए SELECT कथन के साथ कमांड करें।

mysql> SELECT DISTINCT last_name, first_name
   -> FROM person_tbl
   -> ORDER BY last_name;

DISTINCT कमांड का एक विकल्प यह है कि आप जो कॉलम का चयन कर रहे हैं उसका नाम एक ग्रुप BY क्लॉज जोड़ें। इसमें डुप्लिकेट को हटाने और निर्दिष्ट कॉलम में मूल्यों के केवल अद्वितीय संयोजनों का चयन करने का प्रभाव है।

mysql> SELECT last_name, first_name
   -> FROM person_tbl
   -> GROUP BY (last_name, first_name);

तालिका प्रतिस्थापन का उपयोग करके डुप्लिकेट को निकालना

यदि आपके पास किसी तालिका में डुप्लिकेट रिकॉर्ड हैं और आप उस तालिका से सभी डुप्लिकेट रिकॉर्ड हटाना चाहते हैं, तो नीचे दी गई प्रक्रिया का पालन करें।

mysql> CREATE TABLE tmp SELECT last_name, first_name, sex
   -> FROM person_tbl;
   -> GROUP BY (last_name, first_name);

mysql> DROP TABLE person_tbl;
mysql> ALTER TABLE tmp RENAME TO person_tbl;

तालिका से डुप्लिकेट रिकॉर्ड को निकालने का एक आसान तरीका उस तालिका में एक INDEX या PRIMARY कुंजी जोड़ना है। यहां तक ​​कि अगर यह तालिका पहले से ही उपलब्ध है, तो आप डुप्लिकेट रिकॉर्ड को हटाने के लिए इस तकनीक का उपयोग कर सकते हैं और आप भविष्य में भी सुरक्षित रहेंगे।

mysql> ALTER IGNORE TABLE person_tbl
   -> ADD PRIMARY KEY (last_name, first_name);