什么是数据库中的数据清理?

即使在阅读维基百科上的数据清理之后,我仍然不清楚数据清理术语用于数据库时究竟是什么。

它是一个正式的工程负责人 ,有一个预先定义的方式来执行数据清理? 如果是这样,我应该研究的关键字是什么?

– 要么 –

简单地清理数据库中不一致的数据是一般还是松散的术语?

什么是数据清理?

在数据库上下文中,数据校正与模式一致,但在更高级别上是错误的,例如无效的信用卡号和SSN,重复的logging,格式不匹配等等。

这是一个普遍的,松散的术语,只能在特定的情况下获得具体的含义。

我创build了“数据清理”例程来定期检查和修复实时检查可能不太实际的数据库问题(例如,在input数据时检查是否有错误,不一致或重复)。 清理例程可以修复特定types的错误,例如检查邮政编码条目是否与城市/州相匹配,或者可能查找客户名称(重复客户)的变体,给定地址。

有时,当数据库不规范时(出于性能原因),清理例程可以在“非高峰”时间检查数据库,以确保数据保持一致。