[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN113515316A - 一种新型边缘云操作系统 - Google Patents

一种新型边缘云操作系统 Download PDF

Info

Publication number
CN113515316A
CN113515316A CN202110876441.8A CN202110876441A CN113515316A CN 113515316 A CN113515316 A CN 113515316A CN 202110876441 A CN202110876441 A CN 202110876441A CN 113515316 A CN113515316 A CN 113515316A
Authority
CN
China
Prior art keywords
service
management module
operating system
management
edge cloud
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110876441.8A
Other languages
English (en)
Inventor
李东强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Gaowei Network Technology Co ltd
Original Assignee
Guangzhou Gaowei Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Gaowei Network Technology Co ltd filed Critical Guangzhou Gaowei Network Technology Co ltd
Priority to CN202110876441.8A priority Critical patent/CN113515316A/zh
Publication of CN113515316A publication Critical patent/CN113515316A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/4401Bootstrapping
    • G06F9/4406Loading of operating system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/4557Distribution of virtual machine instances; Migration and load balancing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45575Starting, stopping, suspending or resuming virtual machine instances

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Security & Cryptography (AREA)
  • Hardware Redundancy (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明涉及边缘云计算技术领域,具体为一种新型边缘云操作系统,包括配置管理模块、故障管理模块、主机管理模块、服务管理模块、软件管理服务模块和平台构架,该新型边缘云操作系统,轻量级部署,可以灵活部署在较为恶劣的环境,减少了传统云计算规模大,需要一个机房在放置大型设备等部署要求;由于体量的减轻还提高了系统的健壮性,当遇到服务器宕机时,系统可以在极短的时间内自动复原,重新投入服务;减少了未来可能出现的系统拓展带来的成本,拥有超低延时,并且提高了对高复杂度计算的能力。

Description

一种新型边缘云操作系统
技术领域
本发明涉及边缘云计算技术领域,具体为一种新型边缘云操作系统。
背景技术
众所周知,云OS,又称云操作系统、云计算操作系统、云计算中心操作系统,是以云计算、云存储技术作为支撑的操作系统,是云计算后台数据中心的整体管理运营系统(也有人认为云计算系统包括云终端操作系统,例如现在流行的各类手机操作系统,这与先行的单机操作系统区别不大,在此不做讨论),它是指构架于服务器、存储、网络等基础硬件资源和单机操作系统、中间件、数据库等基础软件之上的、管理海量的基础硬件、软件资源的云平台综合管理系统。
例如公开号为“CN102385523A”专利名称为:“一种云操作系统的驱动安装和管理方法”的专利,专利公开了“本发明公开一种云操作系统的驱动安装和管理方法,其特征在于,包括步骤:a)核心硬件驱动安装步骤、b)外部硬件驱动安装步骤、c)驱动加载步骤;其中外部硬件驱动安装步骤时客户终端的浏览器/客户端检测并发现新硬件,判断是否核心硬件,如果是则启动核心硬件驱动安装;否则浏览器/客户端通过互联网接入云操作系统并通过系统服务接口进行驱动安装协作请求,云操作系统检索自身功能驱动数据库找出与其对应的驱动程序引导文件,云操作系统的第二设备管理器读取该硬件驱动程序引导文件,把这个设备注册为特定的设备接口并建立符号链接,并将驱动程序拷贝到为用户端分配的系统目录,并写入该系统相关注册表信息然后才建立服务”。
现有的一种云操作系统的驱动安装和管理方法在使用中发现,其建构复杂度高,对部署环境要求大,对系统错误反应慢,运营成本和维护成本高,导致其使用局限性较高。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种适用于多种业务场景,可以灵活部署的轻量级边缘云操作系统,并且这个系统可以根据需要增删处理核心的数量,具有高可拓展性。
(二)技术方案
为实现上述目的,本发明提供如下技术方案:一种新型边缘云操作系统,包括配置管理模块、故障管理模块、主机管理模块、服务管理模块、软件管理服务模块和平台构架,所述平台构架包括云平台、控制节点、计算节点、存储节点、虚拟网元接口、运营支持系统和业务支持系统,所述云平台包括服务器、网络交换、物理存储、资源池和业务应用,所述服务器、网络交换和物理存储为所述云平台的底层,所述服务器、网络交换和物理存储分别与所述资源池进行双向信息交换,所述资源池与所述业务应用进行双向信息交换,所述运营支持系统和业务支持系统与所述控制节点交换数据,所述虚拟网元接口与所述计算节点交换计算结果,所述平台构架内设置有所述配置管理模块、故障管理模块、主机管理模块、服务管理模块和软件管理服务模块。
为了保证系统在重启后能够快速恢复到正常配置,本发明改进有,所述配置管理模块包括sysinv和controllerconfig/conputeconfig,sysinv提供整个软件的状态管理、系统配置的修改,controllerconfig/conputeconfig负责根据物理节点的角色设置系统配置。
为了方便统计报警次数和查看日志,本发明改进有,所述故障管理模块包括中心日志系统和报警系统,其他系统模块通过FM-API给fm-manager发送报警和日志信息。
为了进行协调控制,本发明改进有,所述主机管理模块包括rmon、pmon、hbs服务、hwmond服务和MTC服务,主机管理模块使用rmon监控中央处理器和内存的存量及用量监控,主机管理模块使用pmon管理基础进程,监控计算和块存储服务,主机管理模块使用hbs服务提供平台的心跳检测服务,主机管理模块使用hwmond服务对服务器BWC提供管理服务,主机管理模块使用MTC服务总管MTCE平台其他服务模块,对外提供接口。
无可避免通信断开和服务的脑裂,同时对服务的状态进行监控,本发明改进有,所述服务管理模块包括高可用控制器、高可靠消息服务和服务监控,所述高可用控制器为冗余模型采用1+1高可用双控制节点控制集群,主控制与备用控制节点实时通信,当主控制节点发生故障时,将自动触发HA进程,切换备用节点为主控制节点,所述可靠消息服务设置有多条独立通信路径,配置LAG保护链路的每条路径,使用HMAC SHA-512对消息进行身份验证,所述服务监控采用主动监控或被动监控。
为了方便升级,本发明改进有,所述软件管理服务模块设置有patch制作工具和patch的管理服务,所述软件管理服务模块支持热补丁和reboot required的补丁,更换内核补丁需要重启节点。
(三)有益效果
与现有技术相比,本发明提供了一种新型边缘云操作系统,具备以下有益效果:
该新型边缘云操作系统,与传统云计算平台相比,该系统提高了配置大量远端物理服务器的能力,拥有更广的监控面,提供了服务的高可用。
该新型边缘云操作系统,机管理可以在虚拟主机关机的情况下,根据集群状态、关键进程、资源的阀值、物理主机的故障等使用不同的调度策略来进行对主机的自动重启。
该新型边缘云操作系统,相比于传统云计算平台通过增加计算节点的机器数来应对增加的任务,该系统设计上倾向于减少服务器,增加层和系统功能的丰富度,来灵活应对各种任务。
该新型边缘云操作系统,轻量级部署,可以灵活部署在较为恶劣的环境,减少了传统云计算规模大,需要一个机房在放置大型设备等部署要求;由于体量的减轻还提高了系统的健壮性,当遇到服务器宕机时,系统可以在极短的时间内自动复原,重新投入服务;减少了未来可能出现的系统拓展带来的成本。
该新型边缘云操作系统,拥有超低延时,并且提高了对高复杂度计算的能力。
附图说明
图1为本发明边缘云操作系统架构图;
图2为本发明配置管理服务的原理图;
图3为本发明故障管理的原理图;
图4为本发明主机管理服务的的原理图;
图5为本发明服务管理的原理图;
图6为本发明软件管理的原理图;
图7为传统云平台架构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1-7,一种新型边缘云操作系统,包括配置管理模块、故障管理模块、主机管理模块、服务管理模块、软件管理服务模块和平台构架,所述平台构架包括云平台、控制节点、计算节点、存储节点、虚拟网元接口、运营支持系统和业务支持系统,所述云平台包括服务器、网络交换、物理存储、资源池和业务应用,所述服务器、网络交换和物理存储为所述云平台的底层,所述服务器、网络交换和物理存储分别与所述资源池进行双向信息交换,所述资源池与所述业务应用进行双向信息交换,所述运营支持系统和业务支持系统与所述控制节点交换数据,所述虚拟网元接口与所述计算节点交换计算结果,所述平台构架内设置有所述配置管理模块、故障管理模块、主机管理模块、服务管理模块和软件管理服务模块。
本实施例中,所述配置管理负责进行各组件的安装配置,每次启动,系统存量服务和控制器配置服务以及计算配置器服务都会被重新执行,保证系统在重启后能快速恢复到正常配置,所述配置管理模块包括sysinv和controllerconfig/conputeconfig,sysinv提供整个软件的状态管理、系统配置的修改,controllerconfig/conputeconfig负责根据物理节点的角色设置系统配置。
本实施例中,故障管理的中心日志系统可收集系统内所有节点的日志信息,故障管理的报警系统接收所有节点角色的报警信息,故障管理可以统计报警次数和查看日志,同时包括了中心云和边缘云的物理和虚拟资源,所述故障管理模块包括中心日志系统和报警系统,其他系统模块通过FM-API给fm-manager发送报警和日志信息。
本实施例中,主机管理服务与其他管理服务与监控模块之间的协作关系,主机管理可对硬件资源进行监控,并从资源编排服务、服务管理、配置管理收集和同步虚拟机报警、关键进程和H/W故障;主机管理可以在虚拟主机关机的情况下,根据集群状态、关键进程、资源的阀值、物理主机的故障等使用不同的调度策略来进行对主机的自动重启,所述主机管理模块包括rmon、pmon、hbs服务、hwmond服务和MTC服务,主机管理模块使用rmon监控中央处理器和内存的存量及用量监控,主机管理模块使用pmon管理基础进程,监控计算和块存储服务,主机管理模块使用hbs服务提供平台的心跳检测服务,主机管理模块使用hwmond服务对服务器BWC提供管理服务,主机管理模块使用MTC服务总管MTCE平台其他服务模块,对外提供接口。
本实施例中,服务管理使用了多路通道来避免通信的断开和服务的脑裂问题,并对服务的状态进行监控,所述服务管理模块包括高可用控制器、高可靠消息服务和服务监控,所述高可用控制器为冗余模型采用1+1高可用双控制节点控制集群,主控制与备用控制节点实时通信,当主控制节点发生故障时,将自动触发HA进程,切换备用节点为主控制节点,可以拓展为N+M或N个控制节点,其高可靠消息服务可使用最多三个独立通信路径以避免通信的脑裂问题,配置LAG保护链路的每条路径,使用HMAC SHA-512对消息进行身份验证,所述服务监控采用主动监控或被动监控。
本实施例中,软件管理提供了对升级时虚拟机关机问题的生命周期管理机制。当需要热迁移时,自动把需要更新的主机上的资源转移到可用主机上,并在更新完成后自动将资源分配到更新完成的主机上,所述软件管理服务模块设置有patch制作工具和patch的管理服务,所述软件管理服务模块支持热补丁和reboot required的补丁,更换内核补丁需要重启节点,通过虚拟机的实时迁移服务,在管理节点安装reboot补丁时保障业务不中断。
综上所述,该新型边缘云操作系统,降低传统云操作系统的体量,主机管理和软件管理根据业务需求,通过灵活部署的轻量级边缘云操作系统,删减非必要组件,定制业务轻量级业务模板,建构简易化,由配置管理、服务管理和软件管理服务,生成和发放标准化轻量级业务模板,达到业务环境云操作系统统一化管理,远程配置和监控,通过应用的生命周期管理,实现边缘IaaS、边缘CaaS及MEP的接入和管理,从虚拟化基础设施管理器接收资源故障报告和性能测量数据,负责告警、日志和监控管理,实现远程配置和监控,降低运营成本和维护成本,通过维护系统的整体视图和编排,对包括部署的边缘主机、可用资源、可用服务以及网络拓扑运维和运营,降低中心和边缘端的人工操作复杂度。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (6)

1.一种新型边缘云操作系统,包括配置管理模块、故障管理模块、主机管理模块、服务管理模块、软件管理服务模块和平台构架,其特征在于:所述平台构架包括云平台、控制节点、计算节点、存储节点、虚拟网元接口、运营支持系统和业务支持系统,所述云平台包括服务器、网络交换、物理存储、资源池和业务应用,所述服务器、网络交换和物理存储为所述云平台的底层,所述服务器、网络交换和物理存储分别与所述资源池进行双向信息交换,所述资源池与所述业务应用进行双向信息交换,所述运营支持系统和业务支持系统与所述控制节点交换数据,所述虚拟网元接口与所述计算节点交换计算结果,所述平台构架内设置有所述配置管理模块、故障管理模块、主机管理模块、服务管理模块和软件管理服务模块。
2.根据权利要求1所述的一种新型边缘云操作系统,其特征在于:所述配置管理模块包括sysinv和controllerconfig/conputeconfig,sysinv提供整个软件的状态管理、系统配置的修改,controllerconfig/conputeconfig负责根据物理节点的角色设置系统配置。
3.根据权利要求1所述的一种新型边缘云操作系统,其特征在于:所述故障管理模块包括中心日志系统和报警系统,其他系统模块通过FM-API给fm-manager发送报警和日志信息。
4.根据权利要求1所述的一种新型边缘云操作系统,其特征在于:所述主机管理模块包括rmon、pmon、hbs服务、hwmond服务和MTC服务,主机管理模块使用rmon监控中央处理器和内存的存量及用量监控,主机管理模块使用pmon管理基础进程,监控计算和块存储服务,主机管理模块使用hbs服务提供平台的心跳检测服务,主机管理模块使用hwmond服务对服务器BWC提供管理服务,主机管理模块使用MTC服务总管MTCE平台其他服务模块,对外提供接口。
5.根据权利要求1所述的一种新型边缘云操作系统,其特征在于:所述服务管理模块包括高可用控制器、高可靠消息服务和服务监控,所述高可用控制器为冗余模型采用1+1高可用双控制节点控制集群,主控制与备用控制节点实时通信,当主控制节点发生故障时,将自动触发HA进程,切换备用节点为主控制节点,所述可靠消息服务设置有多条独立通信路径,配置LAG保护链路的每条路径,使用HMAC SHA-512对消息进行身份验证,所述服务监控采用主动监控或被动监控。
6.根据权利要求1所述的一种新型边缘云操作系统,其特征在于:所述软件管理服务模块设置有patch制作工具和patch的管理服务,所述软件管理服务模块支持热补丁和rebootrequired的补丁,更换内核补丁需要重启节点。
CN202110876441.8A 2021-07-29 2021-07-29 一种新型边缘云操作系统 Pending CN113515316A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110876441.8A CN113515316A (zh) 2021-07-29 2021-07-29 一种新型边缘云操作系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110876441.8A CN113515316A (zh) 2021-07-29 2021-07-29 一种新型边缘云操作系统

Publications (1)

Publication Number Publication Date
CN113515316A true CN113515316A (zh) 2021-10-19

Family

ID=78067786

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110876441.8A Pending CN113515316A (zh) 2021-07-29 2021-07-29 一种新型边缘云操作系统

Country Status (1)

Country Link
CN (1) CN113515316A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110677288A (zh) * 2019-09-25 2020-01-10 浙江九州云信息科技有限公司 一种通用于多场景部署的边缘计算系统及方法
CN114466029A (zh) * 2022-03-10 2022-05-10 浪潮云信息技术股份公司 一种边缘云计算场景中的云边协同系统及方法
CN114567648A (zh) * 2022-03-24 2022-05-31 阿里巴巴(中国)有限公司 分布式云系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110677288A (zh) * 2019-09-25 2020-01-10 浙江九州云信息科技有限公司 一种通用于多场景部署的边缘计算系统及方法
CN114466029A (zh) * 2022-03-10 2022-05-10 浪潮云信息技术股份公司 一种边缘云计算场景中的云边协同系统及方法
CN114567648A (zh) * 2022-03-24 2022-05-31 阿里巴巴(中国)有限公司 分布式云系统

Similar Documents

Publication Publication Date Title
EP3694148B1 (en) Configuration modification method for storage cluster, storage cluster and computer system
CN112667362B (zh) Kubernetes上部署Kubernetes虚拟机集群的方法与系统
CN113515316A (zh) 一种新型边缘云操作系统
US20050005200A1 (en) Method and apparatus for executing applications on a distributed computer system
CN109656742B (zh) 一种节点异常处理方法、装置及存储介质
CN113067850B (zh) 一种多云场景下的集群编排系统
CN109347681A (zh) 分布式系统中的自更新功能
CN112799786A (zh) 微服务实例的退出方法、装置、设备及存储介质
CN104717077B (zh) 一种管理数据中心的方法、装置及系统
CN114064414A (zh) 一种高可用的集群状态监控方法及系统
CN108347339B (zh) 一种业务恢复方法及装置
CN114116912A (zh) 一种基于Keepalived实现数据库高可用的方法
CN111984274A (zh) 一种一键自动化部署etcd集群的方法及装置
CN115292408A (zh) MySQL数据库的主从同步方法、装置、设备及介质
CN113835834A (zh) 一种基于k8s容器集群计算节点的扩容方法及系统
CN111917588A (zh) 边缘设备管理方法、装置、边缘网关设备和存储介质
CN101686261A (zh) 一种基于rac的冗余服务器系统
JP2012014674A (ja) 仮想環境における故障復旧方法及びサーバ及びプログラム
CN110677288A (zh) 一种通用于多场景部署的边缘计算系统及方法
CN111355605A (zh) 一种云平台的虚拟机故障恢复方法及服务器
CN116414915A (zh) 分布式数据库集群的管控方法、装置和数据库管控平台
CN114553686B (zh) 一种主备流量切换的方法、系统、设备和存储介质
CN117215717A (zh) MySQL数据库容器化集群管理平台及电子设备
CN111966469B (zh) 一种集群虚拟机高可用方法及系统
CN117201278A (zh) 一种实现信创环境云原生应用主备容灾高可用场景的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20211019