CN103812674A - 一种服务器主备替换的方法 - Google Patents
一种服务器主备替换的方法 Download PDFInfo
- Publication number
- CN103812674A CN103812674A CN201210441454.3A CN201210441454A CN103812674A CN 103812674 A CN103812674 A CN 103812674A CN 201210441454 A CN201210441454 A CN 201210441454A CN 103812674 A CN103812674 A CN 103812674A
- Authority
- CN
- China
- Prior art keywords
- server
- archive sit
- file system
- shared
- file
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Hardware Redundancy (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提出一种服务器主备替换的方法,该方法为:采用一个共享文件系统,所述系统允许被创建的文件节点的个数等于集群中允许运行的主服务器的数量,集群中的每台主服务器均创建一个所述共享文件系统的文件节点,当有文件节点消失时,共享文件系统通知备用服务器创建该消失的文件节点,替换为新的主服务器。本发明可以保证集群服务器的整体运算能力,也不需要人工干预就可以完成服务器的主备替换。
Description
技术领域
本发明涉及通信领域,尤其涉及一种服务器主备替换的方法。
背景技术
目前的集群替换都是通过服务器热备份和冷备份实现的。热备份就是处理集群中,如果有某一台服务器出现问题,由其他启动的服务器直接接管。缺点是由于处理服务器数量降低,所以数据的处理能力下降。冷备份就是当某台服务器出现问题后停机,需要人员手工启动备份服务器。缺点是由于需要人工启动,时间和效果无法得到很好的保障。
发明内容
本发明的目的在于提供一种服务器主备替换的方法,一不影响整体集群的运算处理能力,二不需要人工处理,可以自己发现某个或某几个服务器出现问题自动切换。
本发明的基本思想是利用在共享文件系统创建文件节点的方式来控制服务器的主备替换,当集群中某个或某几个服务器意外停止,备份服务器组可以主动发现并自动及时替换。该方法具体为:采用一个共享文件系统,所述文件系统允许被创建的文件节点的个数等于集群中允许运行的主服务器的数量,首先集群中的每台主服务器均创建一个文件系统的文件节点。当发现有文件节点消失时,则说明该文件节点对应的主服务器出现了问题,这时共享文件系统将通知备用服务器组进行主备替换,某一个备用服务器将创建该消失的文件节点,其自身替换为新的主服务器。
上述方法中,主备服务器可以预先进行配置,当有主服务器停止运行时,可以固定指定某一个备份服务器去替换。然而,为了更好的实现容灾效果,本发明的服务器主备替换还可以进一步采用争抢的方式,具体为:
集群中的每台服务器启动后,相互争抢创建共享文件系统的文件节点,每台服务器只限创建一个文件节点,争抢到的成为主服务器,未能争抢到的成为备份服务器,并监听已创建的文件节点;当有文件节点消失时,共享文件系统通知监听过该消失的文件节点的服务器去争抢创建该消失的文件节点,最先争抢到的备份服务器成为新的主服务器。
服务器主备替换采用上述争抢过程后,服务器预先不分主备,由启动后的争抢结果决定,争抢到的为主服务器,未争抢到的为备份服务器,减少了整个集群的配置项。并且当有服务器停止运行时,没有固定指定哪个备份服务器去替换,而是所有备份服务器进行争抢,根据争抢结果,决定谁替换已经停止的服务器,这样就可以保证只要有备份服务器的存在就可以替换掉已经坏掉的主服务器。
优选的,上述共享文件系统可以为开源免费的zookeeper系统。
优选的,问题主服务器被修复启动后,将成为新的备份服务器,并监听已创建的文件节点。
综上所述,本发明的优点主要在于:1,解决了集群中某个服务器停止,服务器集群的整体的运算性能下降的问题。2,无需人工启动就可以完成服务器的主备替换。3,由于服务器主备替换是个争抢过程,减少了整个集群的配置项,保证只要有备份服务器的存在就可以替换掉已经坏掉的主服务器,提高了容灾效果。
附图说明
图1是本发明实施例的服务器的启动流程示意图;
图2是本发明实施例的服务器启动后的主备替换的流程图。
具体实施方式
下面结合附图,通过具体实施例对本发明做进一步详细说明。
本实施例假设在zookeeper共享文件系统中配置允许运行四个主服务器,即允许被创建四个文件节点。现有服务器1、服务器2、服务器3、服务器4、服务器5和服务器6同时启动,服务器启动时的流程如图1所示,该六个服务器分别读到共享文件系统上写有允许运行四台主服务器的配置信息,完成启动。
服务器启动后的主备替换的流程如图2所示,首先六台服务器将会争相去创建文件0001、0002、0003和文件0004(文件名为举例)。假如当服务器1、服务器3、服务器5和服务器6率先创建完这四个文件时,此时服务器2和服务器4因为文件锁的原因无法创建文件0001、文件0002、文件003和文件0004。这时服务器2和服务器4将沦为备用服务器,同时服务器2和服务器4将监听文件0001、文件0002、文件003和文件0004。
假设服务器6发生故障停止运行,则由于服务器6和zookeeper共享文件系统失去连接,心跳消失,服务器6所创建的文件0004将会被文件系统删除。此时共享文件系统便会通知监听文件0004的服务器2和服务器4,文件0004已经删除。这时服务器2和服务器4将会发起创建文件0004的过程。这时如果服务器2率先创建文件0004,未能争抢到的服务器4依然会成为备份服务器。而服务器2将会成为新的主服务器,成功接管原业务。如果服务器6被修复启动后也将成为备份服务器,并监听文件0001、文件0002、文件003和文件0004。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (4)
1.一种服务器主备替换的方法,其特征在于:
采用一个共享文件系统,所述系统允许被创建的文件节点的个数等于集群中允许运行的主服务器的数量,集群中的每台主服务器均创建一个所述共享文件系统的文件节点,当有文件节点消失时,共享文件系统通知备用服务器创建该消失的文件节点,替换为新的主服务器。
2.根据权利要求1的方法,其特征在于,服务器主备替换采用争抢的方式,具体为:
集群中的每台服务器启动后,相互争抢创建共享文件系统的文件节点,每台服务器只限创建一个文件节点,争抢到的成为主服务器,未能争抢到的成为备份服务器,并监听已创建的文件节点;
当有文件节点消失时,共享文件系统通知监听过该消失的文件节点的服务器去争抢创建该消失的文件节点,最先争抢到的备份服务器成为新的主服务器。
3.根据权利要求2的方法,其特征在于:所述共享文件系统为zookeeper系统。
4.权利要求2所述的方法,其特征在于:问题主服务器被修复启动后,将成为备份服务器,并监听已创建的文件节点。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210441454.3A CN103812674A (zh) | 2012-11-07 | 2012-11-07 | 一种服务器主备替换的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210441454.3A CN103812674A (zh) | 2012-11-07 | 2012-11-07 | 一种服务器主备替换的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103812674A true CN103812674A (zh) | 2014-05-21 |
Family
ID=50708918
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210441454.3A Pending CN103812674A (zh) | 2012-11-07 | 2012-11-07 | 一种服务器主备替换的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103812674A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104317803A (zh) * | 2014-09-23 | 2015-01-28 | 厦门美柚信息科技有限公司 | 数据库集群的数据存取结构和方法 |
CN105871806A (zh) * | 2015-12-11 | 2016-08-17 | 乐视云计算有限公司 | 流媒体文件切片的方法、装置及系统 |
CN106341366A (zh) * | 2015-07-06 | 2017-01-18 | 中兴通讯股份有限公司 | 一种多密钥服务器备份的方法及设备、密钥服务器 |
CN106357813A (zh) * | 2016-11-02 | 2017-01-25 | 龙存科技(北京)股份有限公司 | 一种应用于共享文件系统的任务再调度方法 |
CN106844111A (zh) * | 2016-12-26 | 2017-06-13 | 创新科存储技术(深圳)有限公司 | 云存储网络文件系统的访问方法 |
CN107203420A (zh) * | 2016-03-18 | 2017-09-26 | 北京京东尚科信息技术有限公司 | 任务调度实例的主从切换方法和装置 |
CN107404511A (zh) * | 2016-03-31 | 2017-11-28 | 阿里巴巴集团控股有限公司 | 集群中服务器的替换方法及设备 |
CN112256497A (zh) * | 2020-10-28 | 2021-01-22 | 重庆紫光华山智安科技有限公司 | 一种通用的高可用服务实现方法、系统、介质及终端 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1553716A (zh) * | 2003-06-04 | 2004-12-08 | 中兴通讯股份有限公司 | 移动通讯系统中使用共享内存的群集系统及其实现方法 |
CN101557315A (zh) * | 2009-05-15 | 2009-10-14 | 成都市华为赛门铁克科技有限公司 | 一种主备切换方法、装置及系统 |
CN101977124A (zh) * | 2010-11-05 | 2011-02-16 | 山东中创软件工程股份有限公司 | 基于ZooKeeper技术的业务集群方法及系统 |
-
2012
- 2012-11-07 CN CN201210441454.3A patent/CN103812674A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1553716A (zh) * | 2003-06-04 | 2004-12-08 | 中兴通讯股份有限公司 | 移动通讯系统中使用共享内存的群集系统及其实现方法 |
CN101557315A (zh) * | 2009-05-15 | 2009-10-14 | 成都市华为赛门铁克科技有限公司 | 一种主备切换方法、装置及系统 |
CN101977124A (zh) * | 2010-11-05 | 2011-02-16 | 山东中创软件工程股份有限公司 | 基于ZooKeeper技术的业务集群方法及系统 |
Non-Patent Citations (1)
Title |
---|
邓鹏等: "Namenode单点故障解决方案研究", 《计算机工程》 * |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104317803B (zh) * | 2014-09-23 | 2017-11-28 | 厦门美柚信息科技有限公司 | 数据库集群的数据存取系统和方法 |
CN104317803A (zh) * | 2014-09-23 | 2015-01-28 | 厦门美柚信息科技有限公司 | 数据库集群的数据存取结构和方法 |
CN106341366A (zh) * | 2015-07-06 | 2017-01-18 | 中兴通讯股份有限公司 | 一种多密钥服务器备份的方法及设备、密钥服务器 |
CN105871806A (zh) * | 2015-12-11 | 2016-08-17 | 乐视云计算有限公司 | 流媒体文件切片的方法、装置及系统 |
WO2017096839A1 (zh) * | 2015-12-11 | 2017-06-15 | 乐视控股(北京)有限公司 | 流媒体文件切片的方法、装置及系统 |
CN107203420A (zh) * | 2016-03-18 | 2017-09-26 | 北京京东尚科信息技术有限公司 | 任务调度实例的主从切换方法和装置 |
CN107404511B (zh) * | 2016-03-31 | 2020-11-06 | 阿里巴巴集团控股有限公司 | 集群中服务器的替换方法及设备 |
CN107404511A (zh) * | 2016-03-31 | 2017-11-28 | 阿里巴巴集团控股有限公司 | 集群中服务器的替换方法及设备 |
CN106357813A (zh) * | 2016-11-02 | 2017-01-25 | 龙存科技(北京)股份有限公司 | 一种应用于共享文件系统的任务再调度方法 |
CN106357813B (zh) * | 2016-11-02 | 2019-08-06 | 龙存科技(北京)股份有限公司 | 一种应用于共享文件系统的任务再调度方法 |
CN106844111A (zh) * | 2016-12-26 | 2017-06-13 | 创新科存储技术(深圳)有限公司 | 云存储网络文件系统的访问方法 |
CN106844111B (zh) * | 2016-12-26 | 2021-01-08 | 深圳创新科技术有限公司 | 云存储网络文件系统的访问方法 |
CN112256497A (zh) * | 2020-10-28 | 2021-01-22 | 重庆紫光华山智安科技有限公司 | 一种通用的高可用服务实现方法、系统、介质及终端 |
CN112256497B (zh) * | 2020-10-28 | 2023-05-12 | 重庆紫光华山智安科技有限公司 | 一种通用的高可用服务实现方法、系统、介质及终端 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103812674A (zh) | 一种服务器主备替换的方法 | |
US11360854B2 (en) | Storage cluster configuration change method, storage cluster, and computer system | |
CN101539873B (zh) | 数据恢复的方法、数据节点及分布式文件系统 | |
CN202798798U (zh) | 基于云计算技术的高可用系统 | |
CN105141456A (zh) | 一种高可用集群资源监控方法 | |
CN103647668A (zh) | 一种高可用集群内主机群体决策系统及切换方法 | |
JP5982842B2 (ja) | コンピュータ障害監視プログラム、方法、及び装置 | |
CN112463448B (zh) | 分布式集群数据库同步方法、装置、设备及存储介质 | |
CN102394914A (zh) | 集群脑裂处理方法和装置 | |
CN103345470A (zh) | 一种数据库容灾方法、系统及服务器 | |
CN101908980A (zh) | 一种网管升级的方法及系统 | |
CN104579791A (zh) | 一种实现k-db主备自动切换容灾集群的方法 | |
CN112181660A (zh) | 一种基于服务器集群的高可用方法 | |
CN106919473A (zh) | 一种数据灾备系统及业务处理方法 | |
CN105095008A (zh) | 一种适用于集群系统的分布式任务故障冗余方法 | |
CN108173971A (zh) | 一种基于主备切换的MooseFS高可用方法及系统 | |
CN105389231A (zh) | 一种数据库双机备份方法及系统 | |
CN113254275A (zh) | 一种基于分布式块设备的MySQL高可用架构方法 | |
JP6511739B2 (ja) | 冗長システムおよび冗長化方法 | |
CN104917827A (zh) | 一种实现oracle负载均衡集群的方法 | |
CN103441987A (zh) | 双机防火墙系统的管理方法和装置 | |
CN113438111A (zh) | 基于Raft分布式恢复RabbitMQ网络分区的方法及应用 | |
CN105893176B (zh) | 一种网络存储系统的管理方法和装置 | |
CN111309515B (zh) | 一种容灾控制方法、装置及系统 | |
CN106484807A (zh) | 构建自主可控数据库双活或多活集群架构的方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20140521 |
|
WD01 | Invention patent application deemed withdrawn after publication |