尽管备份技术在近期取得了很大进步,但公司的IT人员仍是数据备份的外行,
居安思危 剖析五种迹象规避备份灾难
。不过当备份环境遭受灾难性的破坏时,人人(尤其是CIO)都想知道究竟是谁失职。为了保护你的数据——其实是保护你的工作,本文阐述了五种迹象,这些迹象可能表明你的备份环境将会在不久的将来引起广泛关注。硬件出现问题
如果你的资本支出(尤其是针对基于磁盘的备份产品)飞速增长,缓和了备份压力,但是别期望太高。由于磁带具有可移动性和连续性,使用比较麻烦,但这并不是你的备份环境产生问题的根本原因。我非常信任磁盘备份技术,但是我经常见到虚拟磁带库(VTL)没有完全取得成功。为什么?许多大规模VTL的实施动力来源于人们认为VTL能够解决所有的备份问题。而且,人们容易误认为磁盘肯定比磁带快速,从而部署了“第一代VTL”,使得本已复杂的问题(客户端性能、网络、备份服务器、软件部署等凡是你能说出来的问题)变得更加复杂。
是否拥有度量标准(metrics)?
如果你不能判断容量、增长、成功、失败或者性能,你就不了解备份环境的状况。在许多环境中,备份开始“熄灯”,我经常发现严重的备份故障率——每天 30%至60%,以及大量的容量问题。备份性能不佳,直接影响数据恢复能力;因此,如果你不能根据度量标准加以管理,最终将会在容量、性能、数据恢复等方面遭遇困难,
电脑资料
《居安思危 剖析五种迹象规避备份灾难》(http://meiwen.anslib.com)。离线介质管理(vaulting)不完整
为了维持日常备份,是否牺牲了离线介质管理?这种短期生存策略并不太坏,但是从长远角度看,当离线备份副本过期或不再相关时,就容易发生故障。大多数备份环境在灾难恢复(DR)情形中发挥初级和/或二级作用,为了发挥作用,必须将当前的备份数据副本复制到离线站点中。传统情况下,由离线磁带管理介质完成这个过程,备份程序需要每天“复制”一次。如果离线介质没有实现每天复制,就意味着你的处境危险;如果没有及时修复,你可能就会永久落后了。发生灾难时,人人都想知道为什么只能恢复两周以前的数据,这时所有的眼光都会落在你身上。
关键人员(linchpin)
大多数备份环境具有许多组成部分,是否有一个工程师真正理解备份环境呢?并非所有人都了解这些方法,因此,谁了解谁就能成功地使备份环境保持稳定和运作。市场对这些技能的需求很高,这位“关键人员”可能会离开,寻找更好的机会(如果这份工作没有迫使他离开)。如果重要资源流失,保证环境运行的专业知识也会随之流失。不用几个月,由于缺乏专业知识和策略,本来非常良好的备份环境就会恶化;如果“关键人员”离开,这种情况必然发生。
将备份看作实体(utility)
显然,这是一个哲学词汇,但是我确实看到许多支持世界级数据中心的备份基础架构非常陈旧。如果将备份以静态实体(如杀毒软件)的形式加以管理,你就可能遭遇失败。备份是动态的I/O机器,高度依赖性能、网络规模和状态、存储、服务器和软件组件。如果你回头看看整个数据中心,就会发现人们没有从I/O和架构依赖性等方面来比较应用程序。将备份方案视作核心基础架构方案予以管理,否则就得准备接受无止境的问题和被动操作。