根据****目前的IT环境现状及需求,需要部署一套网管系统并制定一套专用于****的网络监控及管理方案来解决当前存在的问题,本技术方案以Netbase作为网管平台,并结合****内部应用及业务系统提供接口对Netbase进行有针对性配置,将Netbase与现有系统、短信平台相链接,统一监控界面,并实现统一的自动监控、深层检测、自动告警等功能,彻底解决现有的IT管理问题。
1.1 普通监控点监控
Netbase的监控模板,目前包含的设备从底层环境到业务应用,基本覆盖了目前市场中主流的设备及系统,主要涉及的通用监控项目包括:
底层环境 - 电源系统、空调自控系统;
网络 –路由器、交换机、防火墙、IPS设备;
服务器 -微软的Windows , Linux , Unix系统,惠普, NetApp,戴尔;
应用系统―Process(程序),Port,网络应用服务, Web服务,数据库,中间件,商业企业应用方案;
虚拟化 -完整虚拟机虚拟化基础架构( VI3 )管理, XenSource监测;
1.1.1网络设备的监控项目:
CPU监控
监控CPU的利用率,反应出CPU的工作状况:
内存监控
监控内存的利用率,反应出内存的的利用状况:
接口状态
通过接口包的数量:
通过接口错误包的数量:
VPN隧道状况:
接入层交换机只需监控其up、down状态,我们可以通过Netbase首页拓扑图直接查看这些接入层交换机的状态。效果图如下
流量分析
Netbase的流量分析模块,可以扑获CISCO NetFlow, sFlow 和其他的flow 技术,如:JFlow,NetStream,以及AppFlow, 通过这些方式可以监控整个网络的健康情况。.
通过流量分析模块,我们可以知道,在哪个主机上,什么业务应用、什么协议。。等等,对于网络带宽的使用具体是多少。
通过自定义NetFlow的报告,我们可以设定过滤规则(包含和排除特定的项目)来输出我们想要的数据,同时也可以通过保存和重设条件来得到不同的输出,因为数据其实已经保存在我们的数据库。
设定的过滤项目主要包括: 端口范围,应用类型及IP地址
Tos 或者 DSCP值,自动化机制,TCP Flag等等
主要的特点包括:
7*24小时不间断收集流量、协议信息; 多种流量分析报表格式;
以TOP N的方式展现:应用、会话、Flow、协议、域名、国家、子网等等; 任何保存的报告模式都可以设定报警规则;
内网报告及报警设定可以以下列方式设置:SYN, NULL, FIN, XMAS Scans,
RST/ACK 蠕虫,P2P,ICMP 不可达,非法地址,可排除的内网地址等等。
1.1.2服务器监控 CPU监控
监控CPU的利用率,反应出CPU的工作状况:
内存监控
监控内存的利用率,反应出内存的的利用状况:
磁盘容量
监控文件系统的容量以及利用率情况
可以针对磁盘空间等进行监控,从而让用户对主机相对比较脆弱的磁盘系统进行可靠的监控。
网络接口流量监控
网络接口流量,反应网络线路的状况:
进程监控
对进程的监控,可以直接反应进程的可用性:
进程监控
对进程的监控,可以直接反应进程的可用性:
1.1.3数据库监控
数据库数据表字段监控
Netbase通过ODBC的方式链接办公网内对应数据库应用(需要开通对应库的select查询权限),从而执行对应数据表的查询。链接参数设置如下
对应数据库字段查询需要预先设置相应监控项目,方式如下
监控项目由odbc命令路径、链接配置相关选项组成。
数据库性能监控
通过加载Netbase 已有的数据库监控模板(需要开通wmi权限)来实现数据库链接数、查询速率、磁盘IO、数据库空间剩余等性能点进行监控并生成性能效果图。
数据库命中率:
数据库的IO:
用户登陆数:
1.1.4监控网站响应
通过对****网站(http://www.ejingtai.com)页面的抓取速度及时反应网站的服务状态:
1.1.5中间件等应用程序监控
Netbase可以方便调用jdbc、xml等常见应用程序连接程序,并能够结合http、tcp等
方式很好实现java类中间件监控,尤其对于局自主开发程序,Netbase能够提供多种接口与其对接,方便提取监控数据,其中weblogic的数据调用比较简单,有snmp相应MIB库资源。
Oracle weblogic 监控
1、JDBC连接池(JDBC连接池监控主要包括:响应连接数、连接总数、最高可用数、等待连接数等)
2、Java虚拟机(Java虚拟机监控主要包括:当前JVM堆栈中空闲内存数,当前JVM堆栈中内存数)
3、高速缓存(高速缓存监控主要包括:cacheMonitor当前大小、cacheMonitor当前总计数、cacheMonitor插入数)
4、执行队列(执行队列监控主要包括:队列中当前空闲线程数、队列线程、队列中挂起的请求数、服务请求总数)
1.2 非标准监控点(对维护、管理比较重要)
Netbase针对用户的具体监控需要,定制了一些相对比较重要,同时不是通过标准的snmp或WMI等通用监控采集手段获得的监控点,以下通过几个事例加以说明
3.2.1 F5 的性能及状态监控(RADWARE相似,更简单)
由于F5的是采用位的OIDs以及未采用公有标准的OID,很多厂家的产品都无法对其进行准确的监控(例如:Solarwinds Orion、IBM Tivoli等)。Netbase有一个很大的特点就是能对未知的设备进行监控,即使是没有现成的模板也可以通过自定义监控点来创建新的监控项目。
F5可用性及状态的监控 接口的可用性及状态:
进程状态:
磁盘利用率:
F5流量监控
可以看到每个接口的流量:
通过接口包的数量:
通过接口错误包的数量:
HA的状态:
F5的当前会话状况:
F5 OS的负载情况:
1.2.2 EXCHANGE 性能监控
对exchange邮件系统队列、mailbox容量发送邮件速率及链接数等性能进行监控,连接到服务器的用户数量:
监控点分别为:最大用户数、登陆用户数、活动用户数,每个监控点都可以设定阀值及相关告警规则。
邮箱传递性能:
Exchange 性能监控预计效果图
监控点分别为:
RPC平均延时、地址表队列长度、邮件递送用时、邮件分发率等等,相关详细内容可以查看附表
1.2.3 ORACLE 数据库监控
通过加载netbase 已有的Oracle监控模板来实现oracle 数据库链接数、查询速率、磁盘IO、数据库空间剩余等性能点进行监控并生成性能效果图。Oracle 详细性能监控点说明请见附表。
Oracle 数据库磁盘IO,CPU利用率效果图
共享池、链接数等监控点效果图
系统相关负载截图
1.2.4 MSSQL-SERVER数据库监控
1、Disk进行读写(I/O)操作的次数
2、用户连接数
3、SQL Server 内存使用量的信息
4、SQL Server 执行的单个锁请求的信息
5、数据库与日志文件大小
6、高速缓存命中次数和查找次数的比率
1.2.5 IBM WEBSPHERE SERVER 监控
1. 线程池的监控(线程池监控主要包括:创建线程总数、活动线程数、和池中线程平均数)
2. JDBC连接池的监控(JDBC连接池的监控包括:创建连接数、关闭连接数、空闲连接
数、连接池大小、等待连接的并发线程数、分配的连接总数等)
3.Java虚拟机CPU使用情况:
4.java虚拟机内存使用情况(包括:总的内存、空闲内存、已用内存等)
3.2.6 TOMCAT
Java虚拟机(java虚拟机监控主要包括:JVM空闲内存、jvm最大内存、jvm内存总数)
线程信息(线程监控主要包括:当前线程数、线程列表、当前竞争线程)
请求基本信息(错误数、最大请求时间、请求进程时间 请求数、请求收发等)
1.2.7 JBOSS
Java虚拟机(JVM空闲内存、最大内存、内存总数)
线程(当前线程数、最大节余线程、线程池等)
请求(错误数、最大请求时间、请求进程时间 请求数、请求收发等)
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- igbc.cn 版权所有 湘ICP备2023023988号-5
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务