
数值变量是反映数据质量属性的关键要素。数据质量指的是数据满足特定用户需求的能力,通常涉及一系列固有属性。这些属性包括:
1. 真实性:数据应准确无误地反映现实世界的实际情况。
2. 及时性:数据应是最新的,能够及时捕捉到发生变化的信息。
3. 相关性:数据应与用户的需求和关注点紧密相关。
为确保数据高质量,需从多个角度进行考量,包括组织的结构、战略目标、运营流程、项目管理、质量管理体系及相关方的需求。数据质量的需求可以从以下几个维度来定义:
1. 可得性:在需要数据时,能够轻松获取到。
2. 及时性:在需要时能够获取并及时更新的数据。
3. 完整性:数据是完整的,没有缺失重要部分。
4. 安全性:数据得到妥善保护,防止未授权访问和篡改。
5. 可理解性:数据容易被理解和解释。
6. 正确性:数据准确地反映了现实世界的状态。
数据质量管理涉及对数据生命周期中可能出现的质量问题进行全面的识别、评估、监控和预警。这是一系列的管理活动,旨在通过提升组织管理水平,进而提高数据的质量。