Uniqueness
src : https://intodata.eu/exploring-the-core-dimensions-of-data-quality/
Uniqueness :
- Objects in a dataset should be unique occurrences to give an accurate insight during data analysis, as well as to provide the correct data to the user looking for specific information. Data deduplication is the process of removing or filtering out duplicate records and works mostly for identical records. But even if a record is not identical to any others, that does not guarantee uniqueness.
(ChatGPT)
- ในชุดข้อมูล (Dataset) วัตถุแต่ละรายการควรมีความเป็นเอกลักษณ์ เพื่อให้การวิเคราะห์ข้อมูลมีความแม่นยำ และเพื่อส่งมอบข้อมูลที่ถูกต้องให้กับผู้ใช้งานที่กำลังค้นหาข้อมูลเฉพาะ การลบข้อมูลซ้ำ (Data Deduplication) เป็นกระบวนการที่ใช้ลบหรือกรองระเบียนที่ซ้ำกันออก โดยมักใช้ได้ดีกับระเบียนที่เหมือนกันทุกประการ อย่างไรก็ตาม แม้ว่าระเบียนหนึ่งจะไม่เหมือนกับระเบียนอื่นอย่างชัดเจน ก็ไม่ได้หมายความว่าจะมีความเป็นเอกลักษณ์เสมอไป
(Gemini)
- วัตถุในชุดข้อมูลควรมีลักษณะเฉพาะตัว เพื่อให้การวิเคราะห์ข้อมูลมีความแม่นยำและสามารถนำเสนอข้อมูลที่ถูกต้องให้กับผู้ใช้งานที่ต้องการข้อมูลเฉพาะเจาะจง การลบข้อมูลซ้ำเป็นกระบวนการกำจัดหรือกรองข้อมูลที่ซ้ำกันออกไป โดยปกติจะใช้ได้ผลดีกับข้อมูลที่เหมือนกันทุกประการ แต่ถึงแม้ข้อมูลหนึ่งจะไม่เหมือนกับข้อมูลอื่นอย่างชัดเจน ก็ไม่ได้หมายความว่าข้อมูลนั้นจะไม่มีข้อมูลอื่นที่คล้ายคลึงกันอยู่เลย
Myself
- ข้อมูลในชุดข้อมูลนั้น ข้อมูลแต่ละรายการควรมีความเป็นเอกลักษณ์ เพื่อให้การนำข้อมูลมาวิเคราะนั้นมีความแม่นยำและสามารถนำเสนอข้อมูลที่ถูกต้องแก่ผู้ใช้งาน และลบข้อมูลที่มีการซ้ำกันออก เป็นการกรองข้อมูลที่มี
การซ้ำกันออก
Sample
- การใช้ Primary Key ใน Database
- การลบข้อมูลที่มีความซ้ำกันใน Database
- การใช้ ID ที่เป็นเอกลักษณ์ใน Database