首页 · 快讯 · 正文

2022爱分析· IT运维厂商全景报告

2022爱分析· IT运维厂商全景报告

报告编委

张 扬 爱分析 联合创始人&首席分析师

姜明星 爱分析 高级分析师

王 鹏 爱分析 分析师

1. 研究范围定义

研究范围

IT运维指的是企业IT 部门采用相关的方法、手段、技术、制度、流程和文档等,并借助各类运维工具,对IT软硬件运行环境、业务系统、运维流程、运维人员等进行综合管理。

爱分析基于对国内IT相关部门和数字化服务厂商的调研,按照服务管理、云管理平台、智能运维、运维管理、监控、可观测性平台对IT运维市场进行划分。

基于对IT运维发展趋势的分析,本次报告遴选三个市场进行重点研究:

首先,随着企业数字化转型的快速发展,IT系统数量快速增长,此外,云原生架构的应用导致系统复杂度越来越高,传统运维方式已经无法满足企业的需求,因此,借助AI技术能力实现运维智能化,提高运维效率和运维质量,成为IT运维的必然趋势。

其次,云原生下的业务系统由单体应用过渡到微服务模式,单个应用被拆分成多个黑盒的、虚拟的微服务,而且各微服务调用关系异常复杂,企业难以全面掌握业务整体运行状态,故障排除难度剧增。为了保证某些重点业务系统的稳定性,企业需要实时掌握从服务请求到IT基础设施端到端的调用链路,以及各调用节点的运行状态,因此,可观测性变得日益重要。

再者,随着企业上云、用云速度的不断加快,以及云应用程度的深化,企业在多云管理和运维方面面临挑战,企业需要借助云管理平台,提高多云资源统一管理能力,提高云资源交付效率,提升云资源使用效率,降低云成本。

综上所述,本次报告重点遴选出智能运维AIOps、可观测性平台和云管理平台CMP三个市场进行重点研究,并通过对各特定市场的需求定义和代表厂商的能力解读,为各行业企业IT运维规划与厂商选型提供参考。

图 1: IT运维市场全景地图

2022爱分析· IT运维厂商全景报告

厂商入选标准

本次入选报告的厂商需同时符合以下条件:

  • 厂商的产品服务满足市场定义的厂商能力要求;
  • 近一年厂商具备一定数量以上的付费客户(参考第3章各市场定义部分);
  • 近一年厂商在特定市场的收入达到指标要求(参考第3章各市场定义部分)。

2. 厂商全景地图

爱分析基于对甲方企业和典型厂商的调研以及桌面研究,遴选出在IT运维市场中具备成熟的产品或解决方案的入选厂商。

2022爱分析· IT运维厂商全景报告

3.市场定义与厂商评估

爱分析对本次IT运维项目重点研究的特定市场定义如下。同时,针对参与此次报告的部分代表厂商,爱分析撰写了厂商能力评估。

3.1 智能运维AIOps

定义:

智能运维AIOps指的是利用机器学习等人工智能技术,通过对海量的运维数据进行分析挖掘,实现监控、告警、根因定位、自动化运维等IT运维流程的自动化和智能化,提高运维效率和运维质量,为业务稳定运行提供保障。

终端用户:

IT运维部门

核心需求:

随着企业的IT架构向云原生转变,系统复杂度越来越高,数据量快速增长,数据治理和故障定位难度随之增大,企业需要提高运维效率和运维质量。此外,企业信息系统规模不断扩大,IT运维对象快速增长,企业需要投入大量人力保障业务系统的稳定运行,运维成本不断增长。核心需求主要包括:

  • 对运维数据进行统一治理,提高数据使用价值。随着企业系统数量的快速增长和系统复杂度的提高,运维数据量快速增长,作为监控告警、根因定位分析的重要基础,运维数据已经成为企业的重要资产。然而,由于缺乏统一的数据标准,不同运维数据难以有效融合,企业无法对数据进行有效使用。因此,企业需要对运维数据进行统一治理,提高数据使用价值,为智能运维应用奠定数据基础。
  • 借助AI能力,提高运维智能化水平。随着IT架构向云原生演变,企业应用系统也由单体应用向微服务转变,系统变得越来越复杂,数据量也快速增长,告警分析、根因定位难度加大。面对以上挑战,通过专家进行告警分析和故障定位,效率越来越低,且专家已有的经验很难对新出现的故障做出有效的判断,运维质量难以保障。鉴于此,企业需要借助机器学习算法和AI能力,对运维数据进行智能化分析,对海量告警进行智能降噪,快速进行根因定位,提高运维效率与质量。
  • 提高IT运维自动化能力,降低运维成本。随着业务规模的增长,企业IT系统规模随之增大,并且对系统的稳定性要求越来越高,为此,企业需要投入更多的人力对主机、应用系统、容器等庞杂的IT资源进行管理,运维成本居高不下。企业需要借助AI技术,对IT资源进行自动化、智能化管理,降低人工依赖度,控制运维成本。

厂商能力要求:

厂商能够提供AIOps相关产品或解决方案,具体能力如下:

  • 具备数据治理能力。厂商能够支持多种数据采集方式,能够采集企业的各类运维数据;具备多种常见数据格式的解析规则,能够对非结构化数据进行解析。在此基础上,对数据进行统一融合、清洗等,为企业提供全面的、高质量的运维数据资产。
  • 具备智能化能力。首先,厂商能够应用大数据和人工智能技术,对数据进行智能化治理和分析,为智能运维应用提供支撑。其次,厂商需要具备智能告警、智能日志分析等智能运维应用,能够为客户提供成熟的产品或解决方案。
  • 具备自动化运维能力。在基础架构层面,能够将运维工作中的日常巡检、补丁管理、资源创建等进行自动化处理;在应用层面,能够根据系统运行情况进行自动扩容、自动部署、自动更新;此外,当发生故障时,系统能够进行自动化响应,自动恢复故障。通过对IT基础架构、业务应用日常任务以及运维的自动化处理,减少人工投入,降低运维成本。

入选标准:

1. 符合智能运维AIOps的厂商能力要求;

2. 最近一年在该市场服务客户数10家以上;

3. 最近一年在该市场收入1000万元以上。

代表厂商评估:

(注:以下代表厂商评估均按厂商简称首字音序排序)

2022爱分析· IT运维厂商全景报告

鼎茂科技

厂商介绍:

鼎茂科技是一家数智运营科技企业,以平台+算法为核心科技,面向混合云环境,自研数智运营平台和AIOps系列智能应用,帮助客户实现闭环性精准运维和实时的决策支撑。业务覆盖金融、制造、医疗等多个行业。

产品服务介绍:

鼎茂科技在AIOps领域聚焦数智平台和场景化智能应用。数智平台层面,鼎茂的ARCANA PaaS产品具备数据收集与存储、数据分析与治理、原子化AI算法算子、可编排运行引擎、可视化组件框架等运维基础能力。场景化智能应用包括智能日志分析管理、全域智能运维,以及异常检测、智能告警、根因分析、容量预测等智能运维标准场景产品。

厂商评估:

鼎茂科技的ARCANA PaaS数智平台具备AI全流程驱动能力,在数据实时采集和治理方面特点突出,在日志分析、信创适配方面也具有一定优势。

ARCANA PaaS数智平台数据实时采集能力强。针对目前主流监控平台、日志平台及大量物理设备,ARCANA PaaS数智平台直接通过旁路通道采集数据,取代数据库API接口方式,避免了数据从机器设备流入数据库的延迟问题,确保数据的高时效性。例如,在使用Zabbix监控工具时,该平台借助Zabbix的Real Time Exporter,在jack-server收到数据后直接将数据取走,保障数据低延时。

ARCANA PaaS数智平台兼容性强,在AI加持下,具有较强的数据治理能力。首先,ARCANA PaaS的兼容使平台能够与企业已有各类监控体系快速融合;其次,ARCANA PaaS具备数据治理全流程的智能化能力,能够在复杂的IT环境中将算法所需的数据进行清洗、匹配,基于机器学习能力进行数据治理,并通过算法不断学习、演进,形成智能化的数据治理能力。同时,ARCANA PaaS也能够对日志、指标、调用链、CMDB等数据进行相互关联,解决运维数据相互割裂的状态,为上层应用提供支撑。

日志作为AIOps应用的一个重要数据源,鼎茂科技具备独特的日志管理和分析能力,依托ARCAN PaaS建立并独立运行的日志与审计平台,以NLP技术为基础,基于构建的AI模型,通过模式发现、关联性分析、因果分析、异常特征分析,对日志中的罕见文本、特征发生显著变化的文本以及文本间的相关性进行监测,实现日志模式异常检测,快速实现故障定位。此外,该平台在日志管理的全生命周期各个环节均运用AI技术进行智能、自动的分析治理,能够提升日志管理的效率和准确性。

在AI技术的研发和应用上,ARCANA PaaS采用独特的原子化AI算法服务引擎,将鼎茂科技在多领域的先进算法以原子化、可编排的方式集成,实现快速有效的场景分析应用。算法引擎采用微服务架构,面向智能服务接口,通过service gateway解耦业务需求和算法原子能力,实现AI算法原子化设计。利用service mesh架构和gRPC接口框架,支持多种数据源使用同步和异步等多种调用方式实现智能化服务。

鼎茂科技产品信创适配范围较广。鼎茂科技与信创部分技术厂商进行了数十项适配认证,通过信创适配,有利于提高国产化软件方面运维效率和运维质量,为客户国产化软硬件替代提供助力。

典型客户:

建设银行、交通银行、富国基金、威马汽车、大华医院

2022爱分析· IT运维厂商全景报告

LinkedSee灵犀

厂商介绍:

LinkedSee灵犀2015年成立于北京,是一家致力于为企业提供云计算和大数据的智能IT运维产品和解决方案的服务商,以满足客户不断增长的规模需求和IT架构迭代需求。灵犀业务已覆盖金融、互联网、运营商、能源、政府等多个行业。

产品服务介绍:

LinkedSee灵犀全栈智能运维平台包括数据源、数据平台、算法平台和应用场景四层架构。数据源方面,平台内置70多种自主采集和系统接入模版,运维数据来源丰富;数据平台方面,能够提供流式数据治理服务;算法平台方面,平台内置多种算法,能够适配不同应用场景;应用场景方面,平台具有指标预警、故障预测、运维审计、画像分析等智能应用,能够满足客户多样化运维需求。

厂商评估:

LinkedSee灵犀全栈智能运维平台具备较强的综合能力,在智能合规运维、智能硬件监控方面具备独特优势。

灵犀将运维数据和AI算法置于同等重要位置,并支持丰富的智能运维场景,全栈智能运维平台综合能力较强。首先,灵犀的运维数据中台采取高可用分布式架构,可以实现大规模批量数据的处理,每天可以处理几十TB的增量运维数据。其次,全栈智能运维平台内置了近30种算法,包括指标异常检测、告警收敛聚类、日志异常检测、行为序列、关键词图排序等算法,通过对各类算法进行组合,可以满足用户不同应用场景的需求。通过将运维数据和算法结合,构建各类AIOps场景,目前已经支持落地指标异常检测、日志异常检测、多重故障溯源、故障根因分析、堡垒机异常检测等15+个智能运维场景,在智能日志预警分析、指标预警分析、故障根因定位等方面具有优势。

基于独特的行为审计、脚本检测、AI画像能力,灵犀可以帮助企业提高运维安全性及合规性。首先,针对企业运维人员的各类操作,全栈智能运维平台通过行为审计算法,将所有运维操作留痕,并对留痕数据进行分析,自动判断是否存在恶意操作行为,有助于提升企业运维安全性及合规性。

其次,全栈智能运维平台内置命令拼写错误、命令序列错误、首尾命令错误等多种错误模式检测,在运维人员进行关键操作前,基于层次聚类+异常检测算法,能够判断预设的操作命令拼写是否错误、命令是否符合逻辑等,可以避免因人工审核可能出现的识别漏查而造成重大失误。

此外,全栈智能运维平台具备AI行为画像能力,通过算法对内部运维人员在各个系统产生的操作数据进行分析,形成行为画像,并根据特征进行分群。在此基础之上,灵犀为每个群体建立行为时间分布基线和行为序列基线,并对运维人员当下行为进行监测,快速发现异常行为,提高不合规行为管理效率。

例如,灵犀协助某银行构建运维行为画像分析体系,基于AI模型自动建立110664个异常检测点,其中 309个异常检测点发现异常,发现异常行为89条,涉及人员62人,核实确认异常行为12个,帮助该企业提升内部不合规行为管理效率。

灵犀具备较细颗粒度的硬件监控能力,故障预测成功率较高。首先,灵犀科技的LinkedMonitor x86产品通过IPMI、smbios、cpu原生接口、硬盘/raid原生接口和sysfs,确定可以抓取几百项数据,可以实现更细粒度的硬件监控,全面掌握硬件运行状态。其次,通过监控数据分析,该产品能够在超大数据中心场景下,实现对硬盘故障的预测,提前24小时故障预测成功率高达95%,故障修复成功率60%,提升了企业业务容错率。

典型客户:

中信银行、华夏银行、民生银行、国泰君安证券、中信建投

2022爱分析· IT运维厂商全景报告

擎创科技

厂商介绍:

擎创科技2016年成立于上海,是一家智能运维AIOps落地解决方案供应商。擎创科技专注于以AI赋能运维管理,激活运维数据智慧,助力客户数字化转型。其客户群已覆盖银行、保险、证券、制造、能源及交通运输等多个行业。

产品服务介绍:

擎创科技的夏洛克AIOps智慧运营平台包括运维数据采集、数字运维中台、应用层、运营决策中心。数据采集层通过代理、数据湖、API形式接入海量异构数据;数字运维中台提供数据治理、流批一体数据处理、AI能力平台服务;应用层提供日志解析、告警辨析、指标解析等智能运维应用;运营决策中心实现对系统运行状态的洞察,为业务决策提供支撑。

厂商评估:

擎创科技主打“中台+场景”的AIOps一体化能力,在数字运维中台能力、告警降噪、日志分析、容量预测等方面具备优势。

数字运维中台具有实时数据处理能力,内置多种算法模型,产品易用性强。首先,数字运维中台能够基于一套标准的数据算法描述规范,将各平台的数据加载到该中台,实现跨平台统一的数据治理,为智能运维应用提供全面高质量的数据资产。其次,该中台具备较强的流式处理引擎,支持PB级数据的实时处理和图形化数据流编排。此外,AI平台内置十多种自主研发的算法模型,可以进行交互式算法调优、结果评估、模型管理,提升不同场景下对算法建模调参的便利度,有利于缺乏AI经验的运维人员便捷使用。例如,擎创科技为国内某大型银行搭建的运维大数据平台,实现了自动排查和处理故障隐患,该平台通过智能算法,比传统监控平均发现问题的时间提前约15分钟。

基于机器学习能力,擎创在告警降噪和关联分析方面具备竞争力。擎创夏洛克告警辨析中心以机器学习算法为驱动,对海量的告警事件进行降噪和关联分析,辅助根因定位。该平台通过识别算法甄别告警内容相关性、时序相关性和拓扑相关性事件,将重复性告警与相似告警进行自动化抑制,也能够基于告警“熵值”算法,实现告警动态的优先级推荐,提升偶发性、级别低但重要的告警级别,将未发生生产事故的重复告警做降级处理。例如,擎创科技为某国有大行搭建智能运维平台,通过对相似告警进行自动化抑制,每天的告警数量降至不足原来阈值告警的1/10,误告率显著下降。

日志方面具备多样化开箱即用模板及智能分析能力。首先,日志精析中心提供常见场景的应用包,并定期发布新应用包,通过应用包简化配置及分析过程,提高应用场景的配置效率,达到开箱即用的效果。其次,日志速析专家将海量的日志聚类到肉眼可读的数量,通过对日志的实时指标提取,指标的聚合计算等不同维度的分析,智能识别日志发生规律,分析日志异常并进行智能告警,用户无需解析日志结构也可以发现故障、定位根因。

容量异常预测准确度较高。擎创科技采用趋势预测算法对容量利用率指标进行自动化监测,并基于对企业历史数据增长情况的分析,自动预测磁盘利用情况,可以提前3-4周对容量异常进行准确的预报。

典型客户:

中国银联、浦发银行、国家开发银行、上汽大众、交通银行

3.2 可观测性平台

定义:

可观测性平台是指面向云原生环境下应用系统的运维需求,对应用请求的调用链进行追踪,并对各调用节点进行精准监控,实现请求所调用的各层级软硬件资源运行状态的可观测,及时发现甚至提前预判异常,快速完成根因定位,保障系统稳定运行。

终端用户:

IT部门

核心需求:

微服务架构下,系统调用关系变得极为复杂,企业很难全面掌握业务系统的整体运行状态。此外,微服务架构和容器化的部署方式,使得系统环境动态性增强,再加上快速增长的数据量,系统故障定位难度加剧。具体需求为:

  • 打通端到端的全链路数据,清晰展现IT资源调用情况。与单体架构和分布式架构相比,微服务的服务拆分粒度很小,每个服务都对应唯一的业务能力,单个业务应用往往需要调用多个微服务,微服务之间也会相互调用,这就导致系统调用关系极为复杂,企业很难掌握业务系统的整体运行状态。因此,企业需要围绕重点业务场景,对用户请求的调用链进行追踪,清晰展现业务系统各请求IT资源调用情况。
  • 对各调用节点进行监控,快速进行根因定位。微服务模式下,系统环境动态性增强,每个服务实例存在的周期极短,出现问题时现场往往已经破坏,难以进行分析;此外,随着系统复杂度的提升,运维数量也呈TB级增长,也对根因定位带来很大挑战。传统模式下,运维人员需要对全部的IT系统进行运维管理,而不是针对特定应用系统进行全面监控,所以很难对单个应用系统的故障进行快速、精准定位。因此,企业需要实时掌握请求所调用的各层级资源运行情况,快速进行故障定位,保障重点业务的稳定性。

厂商能力要求:

厂商需能够提供可观测性平台相关产品或解决方案,具体能力如下:

  • 具备端到端的数据打通能力。厂商能够基于某个具体的业务应用场景,利用各类技术手段,实现从用户请求到IT基础设施端到端调用链数据的打通,对各用户请求的调用关系进行清晰展现。
  • 能够对各调用节点进行监控,快速实现根因定位。厂商能够围绕具体的业务场景,构建分析模型,通过对调用链数据、指标数据、日志数据等运维数据的综合分析,清晰展现调用链各节点的运行状态。当业务系统发生故障时,能够迅速进行根因定位,提高故障修复效率,保障业务系统稳定运行。

入选标准:

1. 符合可观测性平台的厂商能力要求;

2. 在该市场累计服务客户数3家以上;

3. 最近一年在该市场收入300万元以上。

代表厂商评估:

(注:以下代表厂商评估均按厂商简称首字音序排序)

2022爱分析· IT运维厂商全景报告

日志易

厂商介绍:

日志易是一家专注于机器大数据平台、服务和解决方案的供应商,通过一站式解决机器数据采集、治理、应用,帮助企业实现监控告警、可观测性、关联分析等智能运维应用,提升企业IT运维效率。日志易业务覆盖金融、运营商、电力、能源等多个行业。

产品服务介绍:

观察易是一款日志易基于自身平台特色推出的业务深度全景可观测性产品。观察易通过对业务、服务、设备、指标四层维度数据分析,帮助企业了解应用系统真实运行状态,并通过加强日志、链路、指标数据的关联分析,快速发现问题,提高故障定位效率,缩短问题解决时间,保障业务系统的有效运行。

厂商评估:

业务可观测性方面,观察易产品在端到端的运维数据打通方面具有显著特点。支撑可观测性的基础运维能力方面,观察易具有较强的数据采集、治理和分析能力,能够为可观测性提供重要支撑,提高故障分析、根因定位效率。具有如下优势:

业务可观测性方面,首先,观察易通过附加属性标签实现端到端数据打通,方式独具特色。观察易重点围绕交易类、查询类等场景,基于运维数据分析需要,构建数据模型,将用户查询ID、交易类型、交易渠道等业务属性标签,以及机器版本环境、调用链等属性标签,自动附加在业务流程的日志上面,打通端到端的运维数据,实现对交易业务全流程的可观测性。

其次,对于企业暂时无法直接采集到的指标,观察易基于调用链数据、业务指标数据,通过统计分析的方式,进行二次处理,实现数据的采集。此外,基于既定的业务场景,观察易提前构建好数据分析模型,并基于此,对接入的数据进行实时清洗和分析,及时发现问题,快速进行根因定位,促进运维效率的提升。

打通端到端的数据后,观察易不仅可以横向查看每个应用服务与其它服务之间的关联关系,还可以纵向查看应用服务与基础设施组件之间的关联关系,且故障调查路径中涉及的所有服务、组件、基础设施等通过上下文信息实现关联,保证整个调查流程的无缝衔接。

支撑可观测性的基础运维能力方面,首先,观察易数据采集范围广,数据治理和分析能力强。观察易可配置的数据来源包含文件和目录、Syslog、脚本获取、性能数据、数据库数据、Beats、Packetbeat、S3、Kafka等,能够针对多类安全产品、操作系统、数据库、中间件及业务系统等的指标、日志、调用链数据进行采集,采集范围较广,能够为企业运维可观测性提供海量数据源。观察易对PB级日志、指标、调用链在内的各类时间序列机器数据进行智能运维算法分析,实现运维系统可观测性。

其次,观察易基于统一的数据模型构建拓扑图,通过智能运维算法在拓扑图上找出根因,自动将相同根因产生的告警合并成一个,自动分析出故障原因和影响范围,帮助用户快速定位故障根因。

典型客户:

广发银行、北京银行、宁波银行、山东城商行联盟、亿联银行

3.3 云管理平台CMP

定义:

云管理平台CMP是用于解决企业多云异构资源统一管理的产品,支撑云资源高效交付、自动化运维、云成本控制等,核心能力包括云自动化管理、统一监控告警、费用分析优化等。

终端用户:

IT部门、业务部门

核心需求:

随着越来越多的业务负载迁至云端,企业使用的公有云、私有云越来越多,由于云平台来自不同的厂商,需要分别进行操作管理,导致交付效率低、运维管理成本高。企业需要对多个云平台进行统一管理,提高云资源管理能力和运维效率。核心需求主要包括:

  • 对公有云、私有云、混合云等资源进行统一管理。传统方式下,企业对不同云平台分别进行管理,一方面,在使用不同云平台上的产品或进行跨平台云资源配置时,需要进行多平台切换,无法统一展示各云平台的使用情况,导致云资源利用不均衡。另一方面,企业IT人员需要在不同云平台上分别进行相同的操作,重复操作增加了管理人员的负担。因此,企业需要对多云资源进行统一管理,提高管理能力和管理效率。
  • 提升云平台统一监控告警能力。首先,由于各个云平台相互独立,各类IT资源也相互割裂,企业想要查看各资源运行状态时,需要通过API分别调取各云平台的监控数据,需要较多的人力投入。此外,由于告警数据分散在不同平台,需要分别对告警信息进行处理,分别派发工单,效率较低。因此,企业需要构建统一监控告警平台,统一监控各云平台的运行状态,对各类告警数据进行统一管理,发生故障时,统一派发工单,提高运维效率。
  • 实现云资源的高效交付,提高IT需求响应敏捷性。随着云平台的大规模应用,云资源的交付效率直接影响系统交付效率。原有状态下,业务部门通过线上系统申请云资源,然后由IT部门进行人工操作交付,交付时间难以有效保证。因此,企业需要实现IT资源申请和交付的自动化,提高IT需求响应效率。
  • 提升云资源费用管理能力,有效降低云成本。随着企业系统云化程度的不断加深,企业面临的云环境越来越复杂,云资源费用管理难度加大,存在资源浪费和成本不透明等问题。因此,企业需要构建统一的费用分析体系,提高云资源使用效率,优化云成本。

厂商能力要求:

厂商能够提供云管理平台CMP相关产品或解决方案,具体能力如下:

  • 能够对接各种混合IT基础设施,实现多种云资源的统一管理。产品能够兼容企业现有的和新增的主流公有云、私有云、容器云等资源,比如OpenStack、VMware、华为云、腾讯云、阿里云等,实现多源异构资源统一纳管,提升云资源管理和使用效率。
  • 能够对各云平台的IT资源进行统一监控告警。首先,平台需要支持自定义任意云资源的拓展,能够对各类云平台进行统一监控。其次,具备丰富的API接口,能够从第三方监控工具采集监控数据,并进行统一展示。此外,产品能够灵活配置告警规则,具备多种告警模式,提升告警的精准性,告警触发后,能够第一时间通知到指定用户。
  • 具备IT资源高效交付能力。厂商能够提供面向业务部门的云资源申请和交付的管理系统,既要支持单台资源的自助申请,又要支持单台资源结合中间件、多台资源编排等复杂场景,业务部门提交云资源申请后,即可实现自动化交付,提高交付效率。
  • 具备多云费用统一管理能力。首先,产品能够支持自定义各类云资源资费规则,对企业各云平台的费用进行计量,并能够分摊到使用部门。其次,厂商能够实时检测资源使用情况,定期清理闲置资源和不合理的资源配置,提升资源使用效率。

入选标准:

1. 符合云管理平台CMP的厂商能力要求;

2. 近一年在该市场服务客户数5家以上;

3.近一年该市场相关服务收入规模在500万元以上。

2022爱分析· IT运维厂商全景报告

骞云科技

厂商介绍:

骞云科技2016年成立于上海,是一家致力于构建AI赋能的面向多云和DevOps的超级自动化运维体系,帮助客户构建数字化企业的云原生管理平台服务商。骞云科技业务已覆盖国内及海外政务、能源、金融、制造、运营商、互联网等行业。

产品服务介绍:

骞云科技拥有自主研发的超自动化云应用管理运维平台,平台涵盖六大云原生管理产品,分别为云自动化管理平台、云持续交付平台、云监控告警平台、云费用分析平台、云堡垒机、云ITSM平台。通过面向云原生的六大产品和多种应用场景解决方案,统一管理异构的私有云、公有云、边缘云上各种服务(IaaS,PaaS,Serverless),帮助企业实现超自动化IT资源统一管理,构建多云超自动化运维管理体系。

厂商评估:

骞云科技的标准化SaaS产品SmartCMP为客户提供了多种新型云运维管理能力,其中可视化蓝图编排引擎和费用优化引擎具有优势,能够有效提升企业的IT自动化敏捷性和费用管理能力。

云管理平台的可视化蓝图编排引擎,能够提供面向应用的自动化交付功能,支持面向多节点应用、微服务编排以及多云的混合编排,可以更好地支持现代多云应用架构。在云管理平台上,利用图建模界面,用户可以基于不同场景的需求,通过拖拉拽的方式,对各类组件进行可视化编排,将各组件之间的连接关系、包含关系等描述出来,即可快速设计出基于OASIS国际标准的TOSCA应用蓝图,高效完成复杂多节点应用建模,在此基础上,通过一键申请,即可快速自动化完成部署。该引擎可以最大限度减少手工操作和跨部门的工单流转,大幅提高IT需求响应速度,交付时间可以从N天缩短到分钟级,IT部门敏捷性有效提升。

云费用分析平台能够帮助企业实现云成本的计费和追踪,基于平台内置的费用优化引擎,能够更好地帮助企业节约云成本。一方面,平台支持自定义云资源计费规则,能够提供所有云环境的详细费用报告,通过平台清晰展现可视化、多维度的费用分析结果,能够精确跟踪每一笔成本。同时,基于费用明细归属能力,结合企业多层次组织架构,平台可以将云成本分摊到相应的部门、项目、成本中心和人员。通过明细费用归属,企业能够了解各个公有云的费用分摊状况,并可以根据不同的部门权限,对费用分析和预测进行可视化展现。

另一方面,平台内置的费用优化引擎,自带几十种费用和合规策略,能够基于策略规则,分析并发现各种不符合费用优化策略和安全规范的情况,并通过图表形式直观地展示策略的执行结果。对于发现的违规情况,可以通过策略匹配自动优化,也可以基于内置工单系统和知识库,提高手工配置优化效率。通过费用优化策略,平台可以发现闲置资源、不合理配置的资源,节约企业云开支;通过合规优化策略,可以检查云资源的非法配置。

以快消、制造行业客户等为例,许多客户同时使用多个国内、国际公有云,由于缺乏跨云综合分析、统一展示的能力,大量重复性运维工作需要人工完成,面临运维效率低下、云费用账单统计分析困难等问题。通过骞云的云原生自动化管理平台,企业实现了云资源的统一管理,交付效率大幅提升,从以天为单位提高到以分钟为单位;通过云费用分析平台,企业实现了多维度公有云费用的统计和分析,各级人员可以清晰了解费用使用情况,提高了云成本自动化、精细化管理能力。

典型客户:

太古可口可乐、时代中国、Metlife、兴业证券、沙特阿拉伯政务云

2022爱分析· IT运维厂商全景报告

新钛云服

厂商介绍:

新钛云服是一家为企业提供端到端的云和安全管理服务与云管理平台的厂商。新钛云服秉持“以专业成就每一位客户”的使命,通过提供云和安全管理服务、TiOps混合云管理平台两大业务模式,致力于帮助企业更好地构建、管理、运维IT基础设施和应用,构建信息系统安全与合规管理体系,为企业实施云战略保驾护航,支撑业务实现数字化转型。新钛云服业务覆盖能源、制造、零售、金融、互联网等行业。

产品服务介绍:

新钛云服TiOps混合云管理平台(简称TiOps云管平台),能够帮助企业实现异构IT基础设施统一管理和IT能力服务化,包含ITSM、ITOM、安全基线与费用管理四大场景。其中,ITSM能够提升IT部门的服务能力、服务效率和服务质量;ITOM能够实现自动化运维管理与基于数据的运营管理;安全基线有助于提升企业安全合规水平;费用管理能够提升企业云资源费用闭环管理能力。

厂商评估:

新钛云服具有较强的综合能力,TiOps云管平台综合了混合云统一纳管、自动化运维、安全运维和成本管理四方面能力,能够帮助企业解决综合性管理挑战。具体体现在以下方面:

混合云统一纳管方面,TiOps云管平台支持对接各家公有云(包括但不限于阿里云、腾讯云、华为云、AWS、Azure)和主流私有云(包括但不限于OpenStack、VMWare),同时支持对接云原生Kubernetes容器集群以及传统的裸金属服务器。对接的资源种类丰富,除了常见的IaaS资源,还支持主流PaaS产品的对接和管理。

自动化运维方面,TiOps云管平台能够对运维脚本进行统一纳管,系统兼容性强。首先,企业的不同运维人员往往有自己维护的一系列脚本,导致标准不一、管理分散问题。针对该问题,TiOps云管平台将各运维团队或个人使用的脚本在云平台里进行统一纳管,提高脚本的复用率;同时脚本的版本管理机制有利于脚本的不断演进和迭代完善。其次,该平台Ansible脚本模型处理能力突出,能够兼容客户已有的主机组和Playbook,可以复用客户在Ansible下所积累和沉淀的能力,降低平台的使用门槛。此外,该平台支持在主机上部署Agent,也支持Linux SSH、Windows远程管理(WinRM)等方式,满足客户多样化需求。

安全运维方面,TiOps云管平台内置云堡垒机,能够向用户提供安全、可靠的访问云资源的能力。所有的运维操作在平台里均有相应的权限管控,只能登录授权的机器,并对操作时间与操作流程严格限制,可以有效解决IT部门的误操作或恶意操作带来的安全风险。此外,云堡垒机能够兼容MySQL、SQL Server等数据库。用户通过平台去访问后端数据库,能够实现数据库访问的安全审计。同时,TiOps云管平台具备安全基线检查能力,能够通过扫描发现主机配置方面存在的安全问题,取代人工执行脚本或手工检查,提升云平台安全性。

成本管理方面,通过费用核算和主机资源监控实现成本控制。TiOps云管平台将整个平台的资源和人基于业务树形式按层级结构分配,能够将费用核算到具体业务上,并支持可视化展示。通过成本可视化,促进业务部门提高费用控制意识,合理评估申请使用云资源,实现成本的有效控制。此外,TiOps云管平台能够对主机的使用率进行监控,将利用率持续低于预期值的主机进行优化,提高资源利用效率,减少浪费,降低成本。

比如,新钛云服协助某大型游戏公司搭建运维平台,实现对谷歌云、华为云、UCloud三家公有云的统一纳管,持续定期扫描所有纳管主机资源,并上报长期低负载的主机,帮助客户节约成本。通过对多云的统一管理,能够根据业务波动对云资源进行扩容和减配,降低20%的运营成本。

典型客户:

lululemon、佳化化学、金赛药业、绝味食品、中船嘉年华

2022爱分析· IT运维厂商全景报告

云联壹云

厂商介绍:

云联壹云是一家致力于多云混合云场景下解决企业云资源管理痛点的独立软件开发商(ISV)和服务商,提供一键部署的产品化软件解决方案,是“产品化融合云”理念的首倡者,是开源项目“云原生多云混合云管理平台Cloudpods”的发起者。云联壹云业务已覆盖人工智能、金融、教育、交通、房地产、政府、运营商、IT等行业。

产品服务介绍:

云联壹云多云混合云管理平台是一个综合IT基础设施资源运维管理平台。针对企业在多云混合云场景下IT建设、运维、运营过程中的痛点,云联壹云建立云原生、轻量可扩展的技术架构,统一管控企业无论本地机房还是公有云的计算、存储和网络资源及服务,提供面向多云异构环境的资源管控,费用优化,认证安全和监控运维功能,提升企业IT管理效率和运营能力。

厂商评估:

云联壹云在提升云资源管理效率方面具有优势,产品核心代码开源,通过开源社区贡献以及开源用户的反馈,使得核心功能具有较高稳定性和易用性,具备面向丰富场景的功能特性。开源开放特性使其易于二次开发迭代和集成。同时,产品还具有一定的信创适配能力,满足企业信创需求。

云联壹云基于“融合云”的理念,通过虚拟映射的方式,对异构云资源进行资源模型和操作的统一,将“多云”融合为“一云”,降低多云混合云场景的复杂度,提升资源管理效率。

首先,云联壹云重点围绕IT基础设施,采用统一的资源数据模型,通过编码的方式,将各云平台模型图谱里的每个组件、每个资源映射到云联壹云平台,并针对不同云平台产品功能和术语的差异化问题,通过虚拟映射的方式进行一致性处理。通过虚拟映射,对公有云、私有云等各类云资源进行抽象和封装,实现对多云资源的统一管理。

其次,云联壹云会对各类云资源API进行统一对接,然后对企业提供统一的API以及统一融合的UI控制台。用户无需与每个使用的云资源API进行对接,仅需要与云联壹云API进行一次对接,即可实现对各类云资源的申请和使用,在很大程度上提升了资源对接效率。同时,云联壹云会持续跟踪各云平台API变化情况,并对平台进行更新迭代,用户无需自行跟踪维护,即可获取各个云上相关更新,大大减低了运营管理成本。

另外,云联壹云自带本地虚拟化和裸金属能力,并且保持和各云平台一致的数据模型和API,使得一个平台同时管理本地和云上资源,实现“融合一云”的效果。

例如,云联壹云协助某保险集团纳管多云资源,统一了该企业在各个云平台的资源交付、企业资源交付效率提升了5倍,运维效率提升了3倍,CMDB资源对接从需要每个云逐个对接简化为只需要对接壹云。

云联壹云是基于自有技术体系构建的云管理平台,产品的核心代码开源,提供开放API。企业可以基于API或开源代码,对产品进行集成和二次开发,并跟随社区版本持续进行迭代优化,不断提升云管能力。

云联壹云产品具备一定的信创适配能力,能够兼容国产信创硬件和软件体系。硬件方面,云联壹云在私有云和裸金属方面具备同时管理x86和arm服务器能力,全面支持国产化硬件,比如,能够适配鲲鹏、飞腾、海光、兆芯等CPU产品;软件方面,云联壹云已取得多个操作系统的兼容认证,如银河麒麟、中科方德、欧拉、统信(UOS)等。通过信创适配,能够为企业软硬件国产化替代提供助力,提升系统在信创环境下的运行效率。

典型客户:

泰康保险集团、TCL、神州数码、明略科技、九州证券

4、入选厂商列表

2022爱分析· IT运维厂商全景报告