采用AWS SLA与使用第三方监控系统的一个优势是AWS SLA内置在整个AWS PaaS内核之中,这保障了指标数据采集的质量
和时效性
。
为了最大限度的降低对AWS PaaS的性能影响,我们只定义了必要关键指标,对收集和处理程序进行优化(如数据收集和处理采用唯一的独立线程,而不采用线程池或线程重开)。收集器:
Pull
(主动监控)Push
(被动收集)对指标数据收集类型为Pull的指标提供特定的采集器。当未开启SLA服务时,这些采集器不会工作。特征是,间隔一段时间,采集一次。主要应用在计算资源和池资源类的指标数据采集,如CPU、内存、连接池。
采集间隔越小越敏锐,同时也会增大更多的性能开销。该指标被定义在aws-sla.xml
文件的pullCollectionInterval项
(默认10秒)。
%AWS-HOME%/bin/conf/aws-sla.xml
建议采集间隔在10-200秒。如果采集间隔大于300秒,会造成5分钟数据不准确;如果采集间隔大于3600秒,会造成1小时数据分布不准确;
对指标数据收集类型为Push的指标提供特定的收集器。当未开启SLA服务时,这些收集器不会工作。特征是,发生一次收集一次。