将Lustre集群迁移到新订阅用户下

来自Lustre文件系统
跳转至: 导航搜索

下面这个示例是将AWS中现有的Lustre集群迁移到新的订阅用户或新的AMI下。同样的过程也可以用来将Lustre升级到新版本("滚动升级(rolling upgrade)")。

首先,我们将从MGS开始。

从EC2面板,点击"启动配置(Launch Configurations)"

图 1. EC2面板

在"启动配置(Launch Configurations)"页面,点击名称为"MGSLaunchConfig"的复选框,再点击"复制启动配置(Copy launch configuration)"

图 2. 启动配置界面

在"从...复制启动配置(Copy Launch Configuration from ...)"界面上,点击"编辑AMI(Edit AMI)"。

图 3. 从...复制启动配置界面

进入AMI选择界面后,搜索AMI,本例中我们使用"loci"关键词,然后点击"选择(Select)"

图 4. AMI选择界面

在下一个界面上选择"是(Yes)"以确认更改。

图 5. 选择界面

在下一个界面上点击"下一步:配置细节(Next: Configuration details)",这样可以保持EC2的类型不变。如果需要的话也可以改变其类型。

图 6. 配置细节界面

在下一个界面上点击"跳过审查(Skip to review)"。

图 7. 配置细节界面

在下一个界面上点击"创建启动配置(Create Launch configuration)"。

图 8. 创建启动配置

在下一个界面上点击"关闭(Close)",进入EC2面板,点击"自动扩展组(Auto Scaling Groups)"。

图 9. EC2面板

在"自动扩展组(Auto Scaling Groups)"界面选中名称为"MGSNodes"的复选框,点击编辑(Edit)按钮。

图 10. 自动扩展组界面

在下一个界面上,将"启动配置(Launch Configuration)"更改为刚刚创建的配置(如果您没有更改名称,通常是在相同的名称后加上'复制(copy)'作为新名称),然后点击"保存(Save)"

图 11. 自动扩展组界面

执行完以上步骤,则是向自动扩展组添加了一个新的启动配置。接下来我们需要做的是删除旧的发射配置。


在 "启动配置(Launch Configurations)"界面,点击旧的MGS启动配置的复选框(名称不是以"复制(copy)"结尾的那个配置),然后在"动作(Actions)"菜单中,点击"删除启动配置(Delete launch configuration)"

图 12. 启动配置界面

在下一个界面上确认删除。

此时,我们有相同的MGS"自动扩展组(Auto Scaling Groups)",只有新的Launch配置与新的AMI。要部署新的配置,我们需要终止MGS实例,以便可以用新的AMI启动新的实例从而自动扩展。

注意:这将导致Lustre文件系统暂时暂停(无法访问),直到新实例完全添加到群集为止。

从EC2面板中选择"实例(Instances)",然后点击名称为"mgs"的复选框,从"动作(Actions)"菜单中点击 "实例状态(Instance State)"→"终止(Terminate)"。

图 13. EC2面板

在下一个界面上确认"是,终止(Yes, Terminate)"。

一个新的实例运行起来大约需要2-5分钟。

图 14. 确认界面

EC2面板上会终止旧的mgs实例,并运行新的mgs实例。Lustre文件系统应该也可以运行。

以上是如何在MGS上升级/迁移到新的Lustre或AMI的示例。同样的过程适用于MDS和OSS(最好一次只用一台服务器)。