专家回答“EMC存储产品升级与维护的最佳实践”精华整理
转载请在文首保留原文出处:EMC中文支持论坛https://community.emc.com/go/chinese
介绍
本文整理了专家回答“EMC存储产品升级与维护的最佳实践”精华问题。原帖地址:https://community.emc.com/thread/204770。
更多信息
问题一:
请问VNX在线做升级,有什么可能风险,有哪些注意事项?
回答:
通常来说客户对维护升级风险非常在意.任何操作都是有风险的,我们团队在流程上会把风险控制在最小。至于升级过程中出现的一些不可预期状况,这是非常少见。通常来说,整个流程下来升级会正常完成。我说下我们在流程上怎么控制风险的。
1、远程控制管理团队PCE会在和您安排升级的时候提前做一次预检,确保一切正常。需要注意的是,如发现问题我们会及时联 系您并进行专业处理或提交到相关团队进行处理。
2、我们会检查相关业务的兼容性及相关的已知问题。
3、升级当天,或提前24小四之内也会再作一次预检,确保一切正常。
4、升级开始时相关脚本也会做检测。
5、升级过程我们会一直监控。
6、升级结束后会做一次检测和之前的检测记录作对比,如果有问题会进行相关的处理。
需要特别注意的是File升级时Data Mover 相关的一些共享文件业务有3分钟左右影响(已知问题),Block 升级是没有服务中断。我们预检工程师都会把相关的问题风险提前通知您。
问题二:
有些客户为什么不愿意将设备升级到最新版本?
回答:
通常对客户来说, 升级维护是有风险的, 这是客观事实, 当然会是一些客户不愿意做维护的原因。当然会是一些客户不愿意做维护的原因。当然我们也希望可以能尽量主动找我们升级维护。每个新版本code出来都会解决一些发现的新问题。当然也有一些其它原因导致客户不希望升级维护。
坦率得说,任何维护都是有风险的, 我们会把一些潜在风险告知客户, 通过升级或相关维护来开避免一些不可预期的问题发生,从而管控风险或者降低风险。大部分客户是可以理解的。而且维保期内,这些服务不会而外收费。
问题三:
请问VNX在做性能分析时重点应该关注那些性能指标?对应的解决办法是什么?另外VPLEX单引擎能承受多大IOPS,如果后端存储闪盘较多,通过VPLEX做mirror,性能瓶颈是否会出在VPLEX上呢?
回答:
VNX在做性能分析时重点应该关注下列指标:
Utilization:使用率
Queue Length:请求队列长度
Response Time:物理响应时间
Total Bandwidth:总带宽
Total Throughput :总IO
Read/Write Bandwidth:读/写带宽
Read/Write Size:读/写块大小
Read/Write Throughput:读/写IO
Service Time:服务时间
结合客户的服务要求进行相应的优化,如果有相关要求,可以使用相关的EMC工具(Analyzer)进行分析,具体的优化方案要具体分析。但首先应该保证系统跑在最稳定最安全的版本。
VPLEX 单引擎试验数据能达到400000 IOPS, 一般我们很少能看到VPLEX 瓶颈问题。如VPLEX无法负荷IOPS了,首先会有CPU High的情况。 如果出现类似问题我们是要个案分析,也不只是简单增加引擎,如您所说的,闪盘较多的话,我们可能要考虑下latency的问题,由于闪盘的延迟本身可能比较低,而VPLEX会引入一个相对固定的延迟(1ms左右),这个1ms可能对不同的存储感觉是不一样的。
问题四:
客户有一台AX4的存储,现在要扩容6块1TB的硬盘。扩容AX4硬盘有何风险?是否有关于AX4扩容硬盘以及扩容DAE的相关操作文档?
回答:
扩展AX4存储的磁盘是没有风险的,加盘后重新划RG划LUN给前端用就可以了。据我了解AX老版本的CODE有些BUG,最好要先排除掉CODE的隐患,KB3112描述了这个问题https://support.emc.com/kb/3112。关于扩容Procedure或文档,可以通过EMC SolVe-Desktop工具生成相关文档。
问题五:
请问下Isilon升级是滚动升级还是批量升级呢?升级过程中对前端IO不会造成任何影响吧,Isilon允许整个cluster中有两个不同版本的node吗?
回答:
Isilon支持滚动和批量升级两种方式。
一般来说,批量升级支持任意当前版本升级到任意目标版本,但是也有例外,当前版本在6.5.5.x 或者之前的版本不能直接升级到7.2版本,中间需要临时升级到7.0或者7.1,然后再选择滚动或批量升级到目标版本7.2.
对于滚动升级,也不是所以版本都支持的,具体需要参考目标版本的release note, 请参考: https://support.emc.com/docu46145_Current-Isilon-Software-Releases.pdf
批量升级或重启所有node,所以IO 影响是肯定有的。
对于滚动升级,NFS 客户端只要是配置的默认的auto connect, 在当前升级的node 重启的时候,NFS 连接会自动转移到其他node;关于SMB 客户端,升级当前的连接会全部中断,客户端需要重新提交SMB 访问请求才能重新建立连接。虽然EMC现在不鼓励在Isilon 端配置SAN, 但是少数客户还是在Isilon 存储端配置了iSCSI, VMware datastore,这些数据也会在升级的过程中受影响。
最后,Isilon不允许cluster中存在两个版本的node,原因在于OneFS操作系统是用来统筹和管理整个cluster上的资源,不同的版本之间可能存在较大的差别。
参考
原帖地址:https://community.emc.com/thread/204770。
应用于
EMC存储产品升级与维护的最佳实践