数据库归档

什么是数据库归档
数据库归档是指将不再活跃的数据迁移到不同的存储介质中以便长期保存。归档可以通过多种方式完成,其中包括像磁带这样的传统介质以及更现代的云存储平台。通过归档,公司可以释放服务器的负载,同时保持对历史记录的访问。在数据生命周期管理(DLM)战略中,数据库归档是很重要的一部分。
数据库归档的优点
归档可减轻服务器容量和I/O负担。它会将对整个历史数据的查询限制到少数极少数用户,而这些数据可能占用内存和磁盘空间。可以将这些数据存储到更便宜的、不那么容易遇到磁盘容量问题<的介质中(如磁带或云存储),可以安排在非工作时间作为后台处理。
另外,归档可以满足合规性要求。公司必须遵守各自的法规法律,尤其是保留策略。保存数据的期限可能会因不同行业而异,但有些国家要求保存至少10年的数据!归档将确保历史数据得到安全地保存,不易丢失。
如何归档数据库
有三种归档方式:手动、半自动和自动方式。
手动方式需要人工介入迁移数据。数据经过筛选,只保留过渡期较长、使用频次较低的数据。数据简单压缩后存储到磁带或云端,以备后续检索调用。这种方案的好处是完全可控,缺点则是人工参与,时间成本显然较高。
半自动方式则在手动方式的基础上加入了一定的脚本或者程序处理。这些程序能够从大量数据中直接筛选出需要归档的数据,然后执行归档操作。半自动方式省去了手工筛选数据的过程,降低了成本,但也有可能存在误操作、冗余归档等风险。
自动方式是应用程序设计的一个特性。通过在数据库框架中编程,对数据的访问记录和元数据简单监测和筛选,自动归档能够协助减少闲散资源和长时间操作的负荷。某些系统还可以有归档推荐功能来优化归档以及感知存储,或者提供更丰富的简报和报告以供审查使用。
何时归档数据库
数据库归档应该在信息的生命周期中的合适阶段完成。一些数据中心现在倾向于将归档作为基本的数据生命周期管理(DLM)形式,以便在数据被封存之前,确保应用数据的安全性。实现DLM的关键是,将归档纳入到信息生命周期管理计划中。数据的生命周期包括创立、保留、归档(和丢弃)日志和备份,因此归档应作为合规性和合适性评估的一部分工作在有效的时间层次内完成。
归档数据的保护
与日志或备份不同的是,归档数据必须长期保持得到安全地保存。归档的数据通常具有许多敏感性质,并被用作法律证据,在处理这些数据时应采取必要步骤以确保数据安全。通过文件级加密、调用具有访问控制的密钥安全服务器以及封存时强一致性校验保护数据的完整性,对流量实时监测以便预防外来入侵,这都是要注意的。如果升级磁带是将数据转移的一部分,并且归档需要验证数据完整性和确认存档已完成,则可能需要捕获和记录校验和和其他已实现的完整性验证。
归档应该与运营商的基本混合媒体和备份保持分离。这有助于确保安全性、完整性、隐私和可用性。

