25.RoseMirror常见问题和解答

1
2
3
1.RoseMirror可以主备服务器同时运行应用软件么?

答:Rose是应用故障转移集群,配置到集群软件里的应用,同一时间只有活动主机是运行应用系统的,备机是停止状态,活动主机故障后,会自动切换到备机,备机自动拉起应用系统,备机转移成活动主机,解决业务不中断使用的需求场景。
1
2
3
4
5
6
7
8
9
10
2.Rose的注册码是永久使用的么?什么情况下会导致注册码不可用?不可用状态下,需要怎么处理?

答:Rose的注册码是一次激活永久使用的。但是如下情况导致注册码id变化后,就无法使用了:
1. 更换不同版本操作系统,如window 2012系统换成window 2016系统。
2. 重装相同版本操作系统,如window 2012系统故障,重新安装window 2012系统。
3. 更换网卡,如换网卡硬件,启动或者禁用网卡。
4. 更换主板。
5. 操作系统更新其他硬件驱动,更新系统补丁等。

如果主机ID号发生变化导致注册码失效无法使用,只能联系软件提供商沟通解决。
1
2
3
3.什么是活动虚拟ip地址?活动虚拟ip地址的作用是什么?
答:1.活动虚拟IP可以在主备机发生故障时迅速转移到其他健康的节点,确保应用服务通过虚拟ip地址可以快速恢复访问,减少停机时间。
2.主机A的ip地址是192.168.0.2,备机B的ip地址是192.168.0.3,活动虚拟ip地址是192.168.0.5,正常0.5地址在主机A上,当主机A出问题后,0.5地址自动迁移到备机B上,备机B转换成活动主机,业务依然可以通过0.5连上应用服务。
1
2
4.什么是带出?什么是带入?什么情况下使用带出和带入?
答:带出是指停止集群配置的资源服务,比如停掉活动虚拟ip资源,停掉数据同步镜像文件夹资源,停掉应用服务资源或者停掉脚本资源;带入是启动集群配置的资源,比如活动虚拟ip资源、数据同步镜像文件夹资源、应用服务资源或者脚本资源;带出的使用场景:比如需要修改数据同步文件夹资源,或者关机服务器,或者维护应用服务更新等;带入就是要启动集群配置的资源,和带出是相对的。
1
2
5.什么是故障转移切换?
答:服务器A和服务器B,正常活动主机是服务器A,当A出现系统故障,业务网络故障,或者应用服务故障时,集群检测到故障问题,自动切换到服务器B,服务器B转换为活动主机,自动启动服务器B上的活动虚拟ip地址资源,应用服务资源等。
1
2
3
6.集群会不会自动回切?
答:不会自动回切,避免故障机修复后,自动回切会导致应用中断,影响正常使用,建议是故障机修复后,维护好集群状态,合适时间内手动回切资源。
活动主机出故障后,自动切换到备机,此时备机转换成对外提供业务功能的活动主机,当故障机器修好后,因为修好的时间有可能是在业务不能停的时间段,所以不能设置回切功能,回切过程中业务会停止中断,正常情况如果需要转移到之前的故障机,可以等待可以停业务的时间段,人为手动切换即
1
2
3
4
5
6
7
8
9
7.修改ip地址段的方式方法?
答: 流程如下:
1. rose里带出集群。
2. 修改物理网卡ip地址。
3. rose里更新网卡信息或者重启rose服务。
4. 修改rose的心跳地址段和数据同步地址段。
5. 修改活动虚拟ip地址。
6. 带入。
7. 验证业务正常即可。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
8.集群软件配置的心跳ip有啥作用?
答:在集群软件中,心跳(Heartbeat)IP 地址通常用于集群节点之间的健康检查和状态监控。具体来说,心跳 IP 地址有以下几个主要作用:

1. 节点健康监测
心跳机制主要通过定期发送信号(即心跳包)来检查集群中各个节点的健康状态。每个节点都会向其他节点发送心跳信号,若某个节点在设定的时间内未能接收到该节点的心跳信号,通常会认为该节点出现故障,进而采取相应的容错措施(如迁移任务、重新选举主节点等)。

2. 故障检测与自动恢复
集群中的所有节点都会交换心跳信号,确保每个节点都处于正常工作状态。如果一个节点的心跳信号没有按时收到,其他节点会认定该节点发生了故障。根据集群的配置和管理策略,集群会进行自动的故障转移(Failover)或恢复操作,确保集群的服务不中断。例如,在高可用性集群中,如果主节点未能发送心跳信号,系统会将服务切换到备份节点,保证服务持续运行。

3. 集群内网络隔离检测
心跳信号还可以用于检查集群中是否存在网络隔离的情况。如果一个节点无法与集群中的其他节点交换心跳信号,可能意味着该节点与集群的其他部分发生了网络分割(即网络隔离)。这种情况通常需要手动干预或调整网络配置,确保集群的正常工作。

4. 主从节点切换和选举
在一些高可用性(HA)集群系统中,心跳机制用于检测主节点是否仍然有效。如果主节点未能及时发送心跳,集群中的其他节点会触发主节点选举机制,选出新的主节点,以继续提供服务。
1
2
9.心跳网线有没有什么要求?ip地址如何配置?
答: 心跳网线没有要求,普通网线即可,ip地址配置私有网络,能正常相互ping通即可,比如配置1.1.1.11和1.1.1.12,掩码255.255.255.0,不需要网关和DNS。
1
2
10.活动主机A故障,自动切换到B上,A修复后,不自动回切到A上?
答:正常,原因是A修复后,业务正繁忙时间段,如果自动回切到A上,业务会发生中断,后续rose版本去掉了自动回切功能。如果需要切换到A,可以选择合适时间段手动切换到A即可。
1
2
3
4
5
6
11.集群常见的切换方式有哪些?
答:如下:
1.断活动主机业务网络测试。
2.关机活动主机。
3.业务故障切换。
4.手动切换。
1
2
12.集群故障切换后,是否需要维护集群状态?什么情况下需要维护集群状态?
答:集群需要维护状态的,比如故障切换后,故障修复后,需要登录集群管控台查看集群状态是否正常,是否需要恢复数据同步,或者清除错误标记等。集群是否有故障或者警告标识等
1
2
13.rose集群软件,应用服务的故障切换时间是多长?
答: rose心跳检测时间是5s轮回查询状态,故障后,先释放活动主机资源,比如释放vip资源,停止应用服务,然后启动备机vip资源,启动应用服务资源,启动镜像资源,将备机转换成活动主机,整体切换时间取决于应用启停时间,比如oracle常规启停时间是1分钟左右,那集群软件故障切换时间大概是1分钟10秒左右。
1
2
3
4
5
6
7
8
14.Rose集群服务器修改网络ip地址的流程?
答: 参考流程如下:
流程:
1. 确定可以停业务,带出rose。
2.修改物理服务器IP地址。
3.调整集群心跳配置,业务网络配置。
4.带入。
5.验证业务。
1
2
15.关于集群环境ip地址的配置要求和建议?
答:两台服务器的第一个网口连接局域网交换机,配置交换机分配的ip地址,用于业务网络通讯使用;两台服务器第二个网口找根网线直连,配置集群心跳ip地址,心跳ip地址自定义即可,比如1.1.1.11和1.1.1.12,掩码255.255.255.0,不需要网关和DNS。
1
16.
1
17.

原文内容结束。




提供通用软件技术咨询,故障排查,解决方案,售后维保,技术顾问,软件技术支持兼职,软件功能定制开发,服务外包等服务:

服务类别:操作系统,数据库,虚拟化,集群,存储,备份,杀毒,运维,服务器,数据恢复等

数据库:Oracle, Mysql, Sqlserver, sybase,国产信创项目数据库全系列:达梦、人大金仓等等…

系统:Window,Linux, Aix,国产信创项目操作系统全系列:银河麒麟、欧拉等等…

集群:Rose, Safekit, Lifekeeper, Safekit, NEC, clusterware, 联鼎LanderVault ,atang…

杀毒:瑞星,卡巴,Symantec SEP,诺顿…

虚拟化:Vmware, Hyper-v, 超融合一体机…

备份:SymantecBE, NBU,Veeam…

运维: 服务器运维,通用软件运维,办公运维,监控平台搭建,运维系统构建等。

开发: 软件定制开发,服务外包等。

博客: softea.cn & 47.115.51.10
电话:18046508828(同微信)

信阳毛尖,自家茶园,好山好水好茶好客,有喜欢喝茶的朋友,欢迎联系,谢谢。

0%