TB-ITSME综合运维管理平台产品
一、产品功能
(1)产品架构
开放式架构,采用Clickhouse、Kafka、flink、Redis等组件,整体软件架构分为采集层、处理层、应用层,并适配国产硬件和操作系统,包括基于龙芯、飞腾、鲲鹏、中标麒麟、银河麒麟、UOS、深度LINUX等国产硬件和操作系统。运行更高效安全、报警更快速准确。系统主要由数据采集、储存和分析、B/S可视化人机界面模块组成,并提供多种扩展组件,数据存储充分利用缓存中间件、时序数据库等,确保数据的高安全。
(2)网络线路监控
系统通过PING(ICMP)类型监测器,对DDN、VPN等网络线路的通断、丢包和延时进行监控,检测间隔最低可支持到秒级,并提供详尽的延时和丢包历史曲线。支持Cisco和华为等设备的RemotePing。
(3)设备监控
全面综合监控网络设备、服务器、数据库、应用系统、安全设备、虚拟化、存储、无线、机房3D、动环、视频等;跨厂商跨型号,不受限制
监控主要内容包括:监控操作系统、集群、节点、核心服务和组件等状态信息在统一界面展示,并支持一键导出。核心服务包括资源发现服务、采集服务、资产服务、认证和通知服务、web前端管理服务,组件包括数据库、处理引擎、消息中间件等
网络设备监控:查看路由器、交换机、安全设备前面板图,面板图直接查看IP表、VLAN/ARP表、MAC地址表、接口表、路由表等,在面板图上可直接对设备接口进行开关操作。
服务中间件监控:支持对于Tomcat、IIS、Nginx、Apache等中间件进行实时监控,包括当前版本、实时会话数、最大会话数、实时连接数、最大连接数、每秒请求数、每秒处理性能等。
机房3D:支持与第三方动环设备对接,实现3D机房可视化,支持对供配电设施、暖通和制冷设施、安防和消防设施、消防系统等信号接入及状态展示。
服务器硬件状态监控和管理
对主板带外管理接口支持IPMI或SNMP协议的服务器,不需依赖操作系统,实现对硬件运行状态进行监控和管理。在对硬件状态监控的支持上在国内处于领先的地位。
目前大部分厂家的服务器,如HP、IBM、DELL和国内联想、浪潮、华为等众多的品牌服务器主板管理接口都支持IPMI或SNMP协议。
IBM服务器通过IMM接口、HP服务器通过ILO接口或SIM AGENT程序、 DELL服务器通过IDRAC接口或OMSA都可深入监控服务器硬件运行状态。
监控和管理主要内容包括:
1、风扇转速和状态、机箱内部和CPU温度、电源电压和状态、电流状态、物理磁盘状态、模块的状态、CPU状态、内存状态、主板状态、电源状态。
2、远程开机或重启服务器。(授权情况下)
3、定时关机或重启服务器。(授权情况下)
4、可实现对服务器的统一IPKVM远程管理。
(4)业务视图监控
业务视图监控是用户从业务划分的角度出发,提供对与业务系统相关的 IT 资源,包括服务器资源、网络资源、存储资源、应用软件资源等,在一个视图页进行监控和查看,当业务出现故障时,可以快速定位相关故障环节,实现面向业务应用的监测和管理。
(5)IP地址管理功能
智能发现、分析网络中存在的 IP地址相关数据,轻松、准确掌握 IP资产信息,出现非法IP或MAC能及时报警,实现 IP-MAC-PORT集中管理,主要功能:
1、支持手动IP地址录入或自动化IP网段发现,包括禁PING设备的在线全自动发现;
2、内网IP管理的统计与实时状态展示
3、IP全生命周期(规划、使用、回收)
4、清晰展示IP-MAC-PORT设备的上下联关系
5、自动扫描,出现非法IP、MAC即时告警。
6、自动汇聚网段,方便管理
7、IP地址段属性可灵活扩展,用于标识不同网段
(6)自动备份与恢复
可以自定义时间周期自动定期备份目标设备的配置,比如自动定期备份CISCO、华为、H3C、锐捷等设备的配置,当目标设备出现故障或配置被修改后,可以根据以前备份的配置进行恢复。
配置备份可按用户指定的时间策略进行自动备份,其中时间策略可按照日、周、月灵活定义,如:每天的几时几分进行备份。
可以对备份下来的配置进行内容对比,当配置有变更则可进行提示。
支持数据的手动、定时备份以及数据异地备份,系统出现迁移或故障,支持备份数据一键上传,实现备份数据导入,恢复业务正常开展,同时,可支持对备份数据空间进行手动清理或定时清理,避免大量无用数据残留。
(7)网络拓扑管理
系统提供自动拓扑、自由定义拓扑和导入visio生成的详细拓扑图或者真实的机房、机柜照片等。可进行无限的拓扑图分层。 支持自定义拓扑样式,所有设备拓扑图标可一键切换,拓扑样式风格一键替换。
提供自动网络拓扑管理。通过SNMP、ICMP、CDP、STP、FDB、LLDP等多种协议进行网络拓扑进行自动发现,可设置发现IP区间和屏蔽IP区间,设置发现的线程数量以控制发现的速度,自动分析出网络拓朴结构,真实反映整个网络状态、链路实时流量情况,设备或链路通过设备图标和链路的颜色变化代表各种运行状态。
(8)监控告警中心
提供应用和资源监控视图,支持分角色分权管理
灵活易用的仪表盘,内置模版,自定义快速生成监控视图
支持Powershell、Shell、SQL、SNMP等脚本自定义扩展指标
实现国产设备、容器和传统架构集中监控,持续监测云、混合云、容器、虚拟主机、网络、服务器、存储等资源的运行状态
支持基于阈值、基线、函数等多种告警方式,基于函数告警方式有如下几种:
① 判断设备当前指标满足所设阈值的次数
② 判断设备当前指标连续多次满足所设阈值
③ 判断设备读取多次指标,最后一次读取指标满足所设阈值
④ 判断设备读取多次指标,最后一次读取指标与倒数第二次读取指标是否相同
⑤ 判断设备周期内指标环比增长、环比下降满足阈值的次数
⑥ 使用函数运算发判断设备指标,运算符包括(>、<、>=、<=、==、!=、包含、in、区间)
通过告警抑制、告警屏蔽等算法,对告警事件进行统一处置
支持对接第三方监控系统,如Zabbix/Prometheus/阿里/腾讯等
出现异常问题可及时产生告警通知,支持邮件、短信、电话、微信、企业微信等事件通知方式
提供多种事件联动场景,如关联拓扑影响、指标视图、即时远程连接、运维脚本和故障自愈等
故障自愈,系统服务或组件异常,系统在周期内自动执行服务重启,使得系统服务快速恢复,保障平台稳定运行
日志告警支持提取syslog日志中的内容,支持正则匹配和直接选择syslog部分字段等内容,自动生成提取规则,降低运维人员工作量。
告警规则可关联知识库中心,能基于资源和知识库中心适配该资源类型范围,非关键字匹配。告警条件可关联多个分析规则,文案以及自动识别可灵活组合。
(9)自动化运维中心
提供配置脚本保管库,内置丰富配置脚本,支持自定义上传或在线编写
支持主流IT对象健康巡检,内置丰富巡检扫描包,一键生成专业报告
提供系统补丁安装工具,一键批量自动化完成高危漏洞修复
支持与配置管理、监控告警、服务流程等模块联动,实现复杂的运维场景
系统发送的所有通知均包括发送时间、发送方式、通知内容、接收人、是否发送成功、发送错误原因等,便于管理人员对所有内容的统一管理。
(10)报表功能
内置强大的报表功能,能够基于设备资源、告警、接口流量、设备存活率、设备性能、线路等进行灵活的自定义报表。自动生成日报、周报、月报、年报、或指定时间段的历史报表,并可定时自动发送报表邮件。系统可生成任意时间范围的可用性分析表、故障趋势图、饼状图、历史曲线图、故障日志和告警记录日志。同时支持以平均值、最大值、最小值等不同的方式统计。
(11)分布式部署
对于多级网络,可在中心和各级机房单独部署独立的监控系统,各自管理。同时可将下级系统产生的故障信息上报到上级系统,实现大规模或超大规模的监测,轻松超越10000个以上参数的监控,并最低支持10秒以下的数据采集间隔。实现集中监控和预警。
(12)知识库中心
使用标签对文章进行灵活分类
支持模糊匹配,快速检索文章标题、文章内容等关键字信息
与IT服务台联动,用户在提单过程可快速查阅相关类型的文章
通过Markdown编辑器、嵌入页面、插入图片等方式,套用已有模版,快速生成文章
(12)工作服务中心
构建基于ITIL流程的IT服务管理平台,有序执行事件管理、问题管理、变更管理、配置管理等,还能自动将系统告警转为工单并指派给相关的人员。个性化定制自动业务处理流程,帮助提高IT服务团队的生产效率,改善最终用户的满意度。
二、硬件规格
型号 |
QTSM1000 |
QTSM2000 |
QTSM3000 |
|
功能描述 |
串接网关设备,支持 Portal 重定向和流量统计 |
|||
性能描述 |
同时在线数 |
10000 - 20000 |
20000 - 50000 |
≥ 50000 |
数据吞吐量 |
20G |
40G |
100G |
|
IPv4/v6 双栈 |
标配 |
标配 |
标配 |
|
认证处理能力 |
≥6000个/秒 |
|||
包处理能力 |
7200 万 PPS 转发 |
|||
开户用户数 |
≥100 万 |
|||
网络端口(标准版) |
千兆电口(个) |
3 |
||
千兆光口(个) |
2 |
2 |
2 |
|
10G 光口(个) |
2 |
4 |
6 |
|
40G 光口(个) |
- |
2 |
4 |
|
I/O |
USB |
外置:2 x USB 接口 内置:1 x USB 插针 |
||
串口 |
1 x RJ45 (COM1) 1 x 内置 5x2 插针 (COM2) |
|||
设备高度 |
2 U |
|||
电源 |
双电 |