Monitoring 识别应用程序中的低性能

我们正在构建一个高性能的web应用程序 不幸的是,有时性能会意外下降,我们希望能够对此进行监控,以便在问题发生时能够主动修复,而不是等待用户报告问题 到目前为止,我们正在为服务器内存使用率、CPU使用率和收集数据库统计数据等指标设置系统监视器 虽然它们显示了系统的整体健康状况,但当某个特定用户的会话速度较慢时,它们对我们没有帮助。我们已经在C#应用程序中实现了跟踪,这在确定数据是罪魁祸首的问题时特别有用,但出于性能原因,跟踪在默认情况下将关闭,只有在尝试修复问题时才启用 所以我的问题是,我们是否

Monitoring icinga/nagios--主机拒绝nrpe_检查连接

我对icinga很陌生,所以可能这只是一个我不明白的小问题 我配置了一个nrpe_check命令来监视主机上的磁盘。这很有效: nagios@icinga-server: /usr/lib/nagios/plugins/check_nrpe -H host.mydom.com -c check_smart_attributes OK (sda) |sda_Media_Wearout_Indicator=097;16;6 如您所见,nrpe连接正在工作,并且脚本返回正确的数据 但在icinga网

Monitoring 如何在不安装Sensu服务器的情况下安装Sensu客户端?

我正在尝试在没有服务器的情况下安装Sensu客户端 根据报告: Sensu Core软件包安装多个进程,包括Sensu server、Sensu api和Sensu client 但是,在添加存储库之后,我只能找到Engagatesensu包,无法找到或安装sensu客户端 我注意到这是不可能的,但那是2年前的事了,所以事情可能已经改变了 不必安装Redis、RabbitMQ和Sensu server就可以安装Sensu server吗?Sensu软件包将安装Sensu server、Sensu

Shinken Monitoring-如何在一天中的特定时间在主机上配置服务检查

我们正在使用Shinken Framework来监控我们的服务器,因为我得到了这样一个场景:我想每天凌晨1点执行一次服务检查,我如何配置它 使用检查间隔或时间段可以实现这一点吗?您需要设置检查间隔和检查周期 例如,我们每天早上9点使用check来检查系统更新。只需根据您的需要更改时间和服务即可 define timeperiod { timeperiod_name morning_check alias mo

Monitoring Prometheus僵尸进程的度量名称和登录的用户数

我需要写普罗米修斯警报,以找出僵尸进程和总用户登录。但我找不到上述两个警报的相关指标 此外,如果特定的矩阵不可用,那么有没有办法用go/shell/python编写自己的代码并添加到node\u exporter?您的两个选项是通过编写或添加度量到node\u exporter 对于登录用户或僵尸进程等指标,我认为后一种方法是有意义的,您可以找到一个例子 因此,例如,要添加登录用户的数量,可以创建一个运行的cronjob echo users\u logged\u in$(who | wc-l)

Monitoring 在Datadog SLO小部件中使用模板变量

我有一个数据挖掘仪表板来监视特定的服务。为了对其他服务使用相同的仪表板,我添加了两个模板变量来更改仪表板中的查询。但是,我不能在Datadog SLO小部件的查询部分使用这些变量 以下带有变量的查询适用于其他类型的小部件,但不适用于SLO小部件 sum:aws.applicationelb.httpcode_target_2xx{$environment,$service}.as_count() SLO小部件中是否也有使用变量的方法,或者因为它是beta版或其他版本而不可能使用?目前看来不可行

Monitoring 同一主机上的两个JMX接口:如何复制JMX项?

在主机上,有两个Java应用程序正在运行,公开JMX数据(应用程序1:JBoss Wildfly.App2:ApacheTomcat) 我在Zabbix服务器的主机配置中设置了两个JMX接口。现在,我想创建一些项目来获取JVM数据?e、 g: jmx["java.lang:type=ClassLoading",LoadedClassCount] 我无法使用同一密钥创建两个项目。如何绕过此控件?简短回答:没有解决方案 长答覆: 为什么你可能不想这么做 由于存在错误,Zabbix无法正确处理同一类

Monitoring 使用Prometheus&;将秒转换为HH:MM:SS;格拉凡纳

我试图将系统正常运行时间显示为DD-HH-MM-SS格式,使用通用代码并不成问题,但我仅使用Prometheus(PromQL)和Grafana,以下是PromQL查询: time()-process\u start\u time\u seconds{instance=“instance”,job=“job”} 我实现了我想要的基本输出,它向我展示了过程的生命周期。上面查询的输出以秒为单位给出时间(例如68003),并将其转换为更大的时间单位(分钟、小时等),但其形式为十进制: 小数点后的89

Monitoring 是否有工具可以查看SD卡还剩下多少写操作?

有没有能够从SD卡读取元信息的工具? 与smartctl对普通硬盘驱动器的功能类似 故事: 我为公共网络构建了一个路由器,它将所有日志信息和数据库存储在SD卡上。一年后,SD卡停止工作。 我想它写了太多的东西,然后就去世了。现在我想替换它,并构建一个工具,在卡死之前提醒我,。不。有限的写入次数不是恶意制造商内置的计数器,而是一种故障模式。不幸的是,除了统计数据外,没有可靠的方法来判断该组件何时会损坏,例如,该制造商生产的该型号通常会持续10^x的写入时间。好吧,我已经了解到卡确实会磨损调平/块重

Monitoring Cacti-升级到0.8.8a后,Windows服务器上的硬盘空间没有图形显示

我已经将仙人掌从0.8.7g升级到了0.8.8a。(我们使用的是轮询器,而不是脊椎) 我遵循了这里的升级说明- 仙人掌服务器;Linux RedHat服务器RHEL4连接到mysql 不使用自定义脚本基本上是内置服务器(索引)脚本 windows或linux设备上的硬盘驱动器使用率(hdtotal/hdfreespace)没有显示出来 Windows服务器将仅绘制网络统计数据,而不是hd/cpu 我已确认服务器脚本目录中的OID是正确的。在这里完成了故障排除步骤- Linux服务器可以记录和显示

Monitoring Centreon/Icinga:服务指挥部

我想知道是否有可能识别命令是如何与Centreon中的任何服务组合的?例如,哪些服务包含“检查正常运行时间”命令 也许使用一些sql魔法查询是可能的,但我从来没有这样做过 尽管您的问题让我想起了本周的icinga2 api开发,其中实现了对象的依赖项跟踪,但如果有人在运行时删除checkcommand,这一点很重要,因为许多主机/服务都依赖它。默认情况下,api将拒绝删除,但级联删除将导致删除整个依赖关系树 这种开发的一个副作用是在这些对象的状态查询中输出这些对象依赖项 查看此处的屏幕截图: 现

Monitoring Bluemix:如何长期监控和记录应用程序可用性

是否有人有在数周到数月内监控和记录Bluemix可用性的经验 我最初的计划是使用监控和分析服务向我的电子邮件发送事件通知,我可以收集和处理这些通知。然而,据我所知,事件通知仅在情况不好时(例如,当应用程序关闭或性能不足时)发送,而不是在应用程序恢复正常时发送。这足以记录应用程序停止运行的天数,但理想情况下,我希望使用更精细的粒度,即确切的停止时间 有了这些信息,我想去做一个每月Bluemix可用性的图表。是否有其他选项可用于实现此目的?如果您想要生成报告,您可以创建一个特定的应用程序(监控应用程

Monitoring ambari使用nagios吗

我是ambari的新手,所以我正在读一些关于它的文章 在这些文章中,有人说: ambari仪表板用于提供Ganglia和Nagios发布的信息 所以我想知道ambari是否使用或基于Nagios来监控它的服务,如果没有,是否可以使用Nagios来监控ambari及其服务 Nagios和Ganglia被用作独立服务,为Ambari 1.7.0及以下版本提供信息。自版本2.0以来,Ambari开始使用自己的监控服务Ambari Metrics和Ambari Alerts。用神经节支持Nagios的行

Monitoring 需要用于存储和跟踪应用程序指标的体系结构

与许多现代应用程序一样,我在当前应用程序中有几个移动部件: 网络服务 各种队列 各种工作进程 等等 为了正确管理我的应用程序,我希望跟踪各种与应用程序相关的任意指标,例如: 一段时间内的平均队列长度 平均队列处理时间和/或最大处理时间 每单位时间内处理的项目数,或每单位时间内处理的X类项目数,例如,最后一分钟、小时、天的数量 等等 我很难找到一个逻辑模型,然后是一个实际的实现。我正在努力解决的一些问题: 这些计算是如何进行的?通过与我测量的相同的过程?通过一个单独的过程 这些计算是什么

Monitoring Nsclient:如何在Nagios上显示Windows HDD运行状况

我想监控windows服务器的硬盘运行状况,为此我安装了Smarttools(smartmontools-6.1-2.win32 setup.exe) 我的问题是,如何通过nrpe或其他方式在Nagios服务器上显示命令输出 一些信息:Nagios-Core-3.5,smartmontools-6.1-2 windows计算机上的命令输出: c:>smartctl.exe/dev/sda-l自检 smartctl 6.1 2013-03-16 r3800 [i686-w64-mingw32-xp

Monitoring kindle作为服务器监控屏幕

我看到有人用kindle显示服务器负载/状态 这些都是文本,比如页面响应时间和当前活跃用户的# 我应该如何在kindle上创建这样的显示器呢?kindle使用了Android(Fire OS)的风格,因此有了一个开始……不熟悉kindle,但听起来像1)获取数据2)创建PDF 3)将其发送到Displayah,所以如果它是@LucasCrawford所说的,那就更好了。对于android:1)获取数据2)将数据发送至显示器(某种kindle专用方式)

Monitoring 使用microsoft visio ping

我需要使用visio来监控与某些路由器和服务器的通信。 我看到了一些关于这方面的信息,但我不知道该怎么办。 你们知道怎么做吗 谢谢尝试使用此加载项 我只是看了有关它的视频,但不使用 欢迎来到stackoverflow。请在发布这类糟糕的东西之前阅读这篇文章-我希望我能对此做些什么。。。

Monitoring 无法在Cloudera Manager上监视impala查询

我安装了一个新的cloudera群集,版本为CM-6.3.1和CDH-6.3.2,现在面临着以前cloudera发行版从未遇到过的问题 Cloudera管理服务(包括Cloudera服务监视器)、Impala(启用哨兵)和所有其他相关流程都工作正常。单个用户能够使用LDAP进行身份验证,并可以查询他们被授权访问的表 问题是,发送和执行到impala守护进程的查询不会出现在Cloudera Manager的impala查询选项卡中,我检查了下面链接中讨论的内容 /var/log/cloudera

Monitoring monitxmpp通知

有没有办法告诉Monit发送XMPP通知以及警报电子邮件?我不知道Monit,但是如果您可以指定任意命令,您可以设置一个python脚本,通过DBus将消息发送到Pidgin或Finch。Pidgin/Finch应该已经运行并已连接 下面是一个示例脚本: #!/usr/bin/env python import dbus, gobject, dbus.glib import sys bus = dbus.SessionBus() obj = bus.get_object("im.pidgin

Monitoring 将AppFabric问题捕获到SCOM中

安装app fabric management module以与systems center operations management(SCOM)一起使用后,它只监视app fabric产品本身,而不监视我们部署到它的应用程序,这些应用程序托管在app fabric内部 例如,当WF实例出现故障或/或实例挂起时,或者当WCF调用中的错误数达到限制值时,我们需要得到通知 我们如何在SCOM中设置此监视任务?这些是您从SCOM中的AppFabric管理包获得的结果?这些是您从SCOM中的AppFa

Monitoring 如何在Zabbix中根据日志条目的计数创建带有calucated字段的图形?

我有一个用于监视致命错误的项目设置,我想添加另一个项目,以便它计算致命错误的计数并绘制它们的图形 使用此键: 日志[“/d2/httpd/logs/myDomain-error\u log”,“PHP致命”,“UTF-8”,100] 它正确地获取了我想要的数据,但是它不会将其绘制成图,我想我必须计算条目数并将格式作为整数,但这不起作用: 计数(log[“/d2/httpd/logs/myDomain-error\u log”,“PHP致命”,“UTF-8”,100],60) 你知道我的钥匙应该是

Monitoring Icinga2检查内存插件不存在';不接受参数

​你好, 我使用以下插件在Icinga 2中创建了一个自定义命令: ​ check\u命令 } 服务 但是,插件无法检查内存,并在Icinga Web 2界面中提供以下输出: ​插件输出 ***您必须定义警告和严重级别! \恩切克_​记忆。​pl v1。​0-Nagios插件\n\n用法:​\n支票_​记忆。​pl-\n检查_​记忆。​pl绝对不提供任何暗示或明确的保证\n此程序是根据IT许可证的条款授权的(有关详细信息,请查看源代码) 请您帮忙,这个检查有什么问题吗?像这样给出,您的命令将在运

Monitoring 统计数据窗口中的峰值,kapacitor

我想在5分钟的时间内计算磁盘使用的峰值。 我不熟悉tick脚本和kapacitor。这是示例代码。问题是我只想在活动窗口中计数(而不是发出的2分钟窗口,即使它有一些数据点) Q: 如何计算5分钟内的峰值光盘使用量 A: 当您指定period=5m和every=2m时,Kapacitor将缓冲5分钟的点数据,并尝试每2分钟将其写入管道 因此,如果stream任务持续10m,您会发现您的勾号脚本将总共执行5次 对于每个执行窗口,数据集将由较旧数据的3m和较新数据的2m组成。本质上,它们是重叠的,这是

Monitoring MIB上的SNMP操作

您好,我正在创建一个MIB,我有一个带有文件属性的表。我有名字,文件类型。等以及一个DateAndTime对象,用于表示创建文件的时间。 为了删除所述表的元素,一列必须为RowStatus类型 现在我的问题是,如果我想获取过去12小时内创建的所有文件,snmp代理将使用什么命令序列来选择这些文件? 据我所知,无法在表中的时间段属性内选择数据。我发现在SNMP中无法像在sql查询中那样选择带有时间戳的数据 在表格中,您必须读取所有数据,如果需要,只需选择在您要查找的时间范围内开始的行

Monitoring 如何使用telegraf监控远程系统指标?

对于如何构建telegraf+InfluxDB+Grafana堆栈以监控一组机器,我将不胜感激 我的情景 我已经成功地将堆栈telegraf+InfluxDB+Grafana安装在我将调用监控实例的机器中 我的系统是一个API,由一台运行nodejs的机器和一个postgres实例组成 我可以使用telegraf postgres输入插件和我的应用程序从我的Postgresql数据库中收集指标。我正在公开telegraf使用prometheus输入插件提取的普罗米修斯格式的一些指标 我的疑问 监

Monitoring 是否有一个应用程序可以监视.exe的网络和API使用情况?

是否有一个应用程序可以监视.exe的网络和API使用情况 我正在寻找一款可以监控以下内容的应用程序: -网络流量和/或只是HTTP流量 -Windows API调用 对于delphi exe,我没有它的源代码 任何建议 谢谢。监控网络流量的工具。它允许您根据需要分析以太网级别或HTTP级别的流量 对于监视API调用,确实存在,但它不是免费的,而且我没有使用它的经验。然而,由于所有API函数都来自某个DLL,所以您也可以使用一个工具来监视对DLL的调用;有更多关于这个主题的信息。是监控网络流量的工

Monitoring zabbix rc版本

我最近开始使用Zabbix 2.0.7版,几乎没有遇到什么问题 1) 在Zabbix页面上(例如:),我看到Zabbix说 “此版本不供生产使用。它是一个候选版本!” 如果发布候选不能用于生产发布,那么发布候选的含义是什么。可能是我不理解这里的Zabbix术语 2) 嗯。由于Zabbix禁止我使用其2.0.7 rc1版本,我安装了2.0.7,在我的Zabbix页面上,我看到了以下错误,尽管所有触发器等都被捕获得非常好 我做错了什么。我从zabbix下载站点获取了所有RPM&没有更改一行代码 Co

Monitoring Hp Loadrunner/virtual user generator web单击和脚本替代方案

不确定我问的是不是在正确的地方,如果不是,对不起 目前,我们通过HP Virtual User generator创建脚本,使用web点击和脚本协议来监控我们的web应用程序,我们使用它是因为在监控时需要执行JavaScript。我们将这些脚本导入HP sitescope,以便在它们关闭时收到警报 问题是升级到loadrunner 12.01后,他们删除了web单击和脚本协议。我已经运行了ProtocolAdvisor,它建议使用Truclient ajax-IE协议。我用它录制了一个脚本,效果

Monitoring 如何停止集合递归??重新启动?

我目前正在使用collectl监控我的系统使用情况。 同时,我有一个shell脚本,可以跟踪这个脚本并记录输出 collectl >> test.file while true; do tail test.file; done 但似乎collectl在每22行输出和输出中重新启动(我可能错了) 这条线 所以,我想知道是否有一种方法可以停止collectl来生成这些行并持续地输入值?我查看了/etc/init.d/collectl,但无法修改任何内容 谢谢是的,您可以禁用标题或只打

Monitoring statsd客户端和statsd守护进程之间有什么区别?

我有一个应用程序,我希望以图形方式监视它 我正在使用StatsD客户端。我正在使用作为后端。我对基本工作流程有一个问题: 我们使用StatsD客户端以便在应用程序中包含度量。然后以UDP数据包的形式发送这些度量(通常)。Graphite(特别是在Graphite中)捕获这些数据包并将其作为时间序列数据存储在数据库中 那么,守护进程的角色到底是什么?我只使用StatsD客户端和Graphite编写了一个工作应用程序。我在哪里错过了StatsD守护程序的使用?有同样的问题,所以我将在这里回答它,即使

Monitoring 如何在netdata中的不同图表上设置不同的分辨率?

我已经设置了一个netdata服务器来监视应用程序指标,并希望使用statsd来收集指标数据。经过几天的研究,我仍然不知道如何在不同的图表上设置不同的分辨率。 例如,我想显示每小时的总销售额,但是请求每分钟计数。netdata似乎每一秒钟只刷新一次图表(全局设置为“每更新一次”)。那么,如何让netdata刷新每小时的总销售图表(较低的分辨率),以及每分钟的总请求计数?或者我只是误解了netdata/statsd? 提前谢谢

Monitoring linux inotify-确定触发事件的用户

我试图找出如何确定在使用inotify监视某些文件时触发特定事件的用户。这可能吗?inotify_事件结构是否有类似的内容?inotify_事件没有相应的字段。由于inotify是异步的,因此您也无法捕获该行为中的用户 您考虑过fuse文件系统吗?我认为(GPL2+)符合要求

Monitoring Zabbix:可以监视任意字符串变量吗?

我们正在使用Zabbix进行服务监控 配置了一些基本的监视。 我想将我的服务的版本字符串的时间线与此监视一起设置。这将使我有机会看到升级到此版本改变了总体错误计数 可能吗 是的,这是可能的 您可以使用Zabbix_server.conf(即代理配置文件)中的“UserParameter”字段,将任意数据从Zabbix代理传递到Zabbix服务器 一般语法为: UserParameter=节[id],命令 例如,假设您希望监视登录的用户数。您可以使用: UserParameter=sys[num_

Monitoring 服务器监控和警报软件?

每个人都使用什么软件来监控硬件?我知道nagios和cacti,但是有人使用其他软件吗?非常有用。有点像仙人掌或仙人掌,但更赏心悦目。仅限Windows,而不是免费的(甚至不像“免费啤酒”中那样) 我同时使用了和。我喜欢munin,因为它简单灵活。也相当不错,至少可以与Nagios和Cacti相比。相当不错,如果你有大量的服务器,需要进行非常全面的监控。我的公司刚刚开始使用Nagios主要是为了跟踪正常运行时间。您会寻找其他解决方案的困难是什么?是规模还是缺少监控功能?如果您不想自己运行监控服务

Monitoring 获取统计监视数据时显示错误

我在Apigee试用第一个教程。当我进入第5步:监视API的性能时,我遇到了几个错误“获取统计数据时出错”。。。以及当我将环境从prod更改为test以查看流量时出现的相关错误。 请帮忙 我的api在测试中运行良好 提前谢谢 问候,, 里特维克 更新:问题已经自行解决。我什么也没做。所以我不知道发生了什么。 其他详细信息:以下是我遵循的教程步骤: “现在您已经部署了API并发出了请求,您可以使用数据图表查看指标。 首先,查看所有API的性能。在管理UI中,单击API。如果API平台页面未打开,请

Monitoring “个人/限制性”;仪表板“;为Icinga经典

我是一名学生,有一篇学士学位论文,我的任务之一是建立一个解决方案,让本地学校的系统管理员能够监控他们的相关服务和主机 假设有一家公司在一个城市里开办了许多当地学校。该公司的系统管理员对每台服务器/主机都不感兴趣,他们完全可以监控所有Icinga主机和服务,但学校的系统管理员和IT服务也希望Icinga监控。他们不能配置主机,只能对他们正在使用的主机进行全面监控 有没有一个解决方案,一个针对许多个人用户的受限/个人监控插件 提前谢谢 您需要在cgi.cfg中输入,其中user_viewer是一个用

Monitoring 为Check#MK'安装本地支票;s代理人

我正在尝试为安装了OMD的计算机上的Check_MK实例编写本地检查。我在这台机器上没有管理员权限,因此我作为OMD站点工作,如下所示: sudo omd su $MY_SITE 而且,像我的标准用户一样,站点用户也没有管理员权限 在中,我发现我有两种选择: 编辑/usr/bin/check_mk_agent,以我拥有的权限或 在/usr/lib/check\u mk\u agent/plugins/中创建脚本,这也是不可能的,因为此文件夹只能写入根目录 当我运行cmk--path时,我看到在

Monitoring Geneos工具

是否有一种方法可以从GeneosGUI动态地将值传递给shell脚本。我的要求是,任何文件中都不应该存储密码。用户将从geneos gui运行脚本,并通过gui将密码动态传递给脚本。没有将动态值传递给geneos活动控制台的选项。我们可以选择存储加密密码。当我们在environments类别下创建一个新变量并在options字段下选择“std encoded password”时,此选项可用。这样,密码将被加密,任何其他用户都看不到密码。是-您可以使用Geneos命令执行此操作。为了供您参考,我

Monitoring Prometheus AlertManager-根据路由向不同的客户端发送警报

我有两个服务A和B,我想监控它们。此外,我在AlertManager配置文件中有两个不同的通知通道X和Y,形式为receivers 如果服务A停止,我想发送通知X,如果服务B停止,我想发送通知Y。如何在我的配置中实现这一点 我的AlertManager YAML文件是: route: receiver: X receivers: - name: X email_configs: - name: Y email_configs: 和警报。规则文件是: groups

Monitoring 如何监控Nagios?

我已经实现了Nagios。但我喜欢监视Nagios本身。我不想让另一个nagios来监视这个nagios。欢迎任何建议。您可以尝试为您的nagios设置一些简单的hearbeat监控。。只是为了确保您的nagios已启动,并在nagios服务器本身未运行时收到通知 安装Nagios插件并启用本地主机的配置 按照nagios安装的任何文档进行操作都会对您有所帮助。一个自己做一些事情的程序必须是人工智能。所以从技术上来说这是不可能的。您可以通过nagios本地主机进行检查,但如果出现任何问题,您将不

Monitoring 数据狗-eBPF ip源

我们通过安装在linux服务器中的Datadog代理使用eBPF 更准确地说,我们使用nprobe在Linux服务器中收集“NetFlow数据”,然后Datadog通过eBPF在仪表板上演示这些流 但是,我们遇到了一个问题,因为IP源始终保持不变。 实际上是Linux服务器接收“Netflow数据”的IP地址。 这是不正常的,因为Netflow基于一对唯一的ip.source/ip.destination eBPF似乎将linux NIC上接收的流量作为源/参考 有没有办法改变这种行为 这听起来

Monitoring 使用RHQ 4.7监视和控制ActiveMQ

我试图监视和控制一个基于ActiveMQ的应用程序,以及一些JBossAS7应用程序。我已经下载了RHQ 4.7,但找不到任何ActiveMQ插件支持。在搜索时,我遇到了,但是这个插件似乎正在工作中,并且也找到了这个条目 请告诉我,是否有任何插件可用于使用RHQ管理ActiveMQ? 如果没有,请您指导我开发一个ActiveMQ插件RHQ团队不维护ActiveMQ插件。FuseSource团队可能有一个。通过IRC或邮件列表与他们聊天: 关于启动新插件,您可以阅读wiki文档: 最好的选择是在

Monitoring 太阳风:自定义警报?

(事实上,我甚至不知道在几个小时后如何正确提问,所以如果我不太清楚,请原谅。) 如何在SolarWinds中设置自定义警报? 例如: 将新监控器添加到现有节点(例如,检查特殊格式的URL的有效性和内容) 为该监视器分配一个自定义警报,使其不会在通常可访问的仪表板中记录或显示任何内容,但在触发警报时会向我发送电子邮件 我们的目标是在现有的SW(SolarWinds)平台上“沙箱”我的实验和测试,这样他们就不会打扰除我之外的任何人,特别是我对SW非常陌生,可能会做一些愚蠢或危险的事情。可能吗 (以下

Monitoring 删除普罗米修斯的标签

我正在调查我们公司使用普罗米修斯收集库伯内特斯实验数据的情况。我们计划使用标签来标记云/集群中特定实验的名称。这意味着我们将生成大量的标签,随着时间的推移,这些标签将占用存储空间。当相关的时间序列过期时,标签是否也会被删除 tldr从操作角度来看,普罗米修斯不区分时间序列名称和标签;通过删除实验数据,可以有效地恢复创建的标签 以下内容仅与普罗米修斯相关>=2.0 普罗米修斯为度量名称、标签和标签值的每个唯一组合存储一个时间序列。因此,my_metric{my_tag=“a”},my_metric

Monitoring 如何在dynatrace上监视KeyClope

我试图在dynatrace上监视Key斗篷,但我只看到流程指标 是否有一种方法可以查看有关会话、连接用户的指标 dynatrace上现有的KeyClope插件 如果您想监视KeyClope,您将只将其视为一个进程,而不是事务级别 支持的技术可在此处查看: 如果有收集额外参数的选项,则始终可以创建自定义OneAgent扩展。目前没有可用的插件。您将能够定义您希望在UI中看到的指标:如果您希望监视KeyClope,您将仅将其视为一个流程,而不是事务级别 支持的技术可在此处查看: 如果有收集额外参数

Monitoring Geneos服务器停机采样器

我们需要使用geneos测量unix服务器一个月的停机时间。我们研究了geneos中可用的一些插件,但没有找到 要求geneos sampler应添加unix服务器在一个月内停机的总时间,并显示结果。提前感谢。没有用于检查服务器停机时间的采样器 考虑到您有一个能够生成所需输出的脚本(用bash/perl或任何其他语言编写),您可以在Geneos的“toolkit”插件中使用这样的脚本 请记住,脚本应该生成逗号分隔的值,作为输出以及标题(title)记录。我将使用“Gateway probeDat

Monitoring 获取服务级别性能指标的任何API

我们想知道是否有办法从Kubernetes服务获取服务级别监控参数,如(每秒请求数、延迟/请求等)?。 我知道如果Kubernetes服务是使用LoadBalancer类型创建的,那么我们可以利用云提供商接口来实现这些指标;但是,我想知道是否有任何规定可以在服务级别或容器级别获得上述指标,而不需要任何延迟。目前还没有。这是正在跟踪中。正如在本期中所指出的,iptables的使用使得这一点变得非常重要

Monitoring 按当前时间范围中的最低值偏移graphite度量

我有Grafana和Graphite metrics。我有一个图表显示ActiveMQ中某个特定队列的排队计数。问题是,EnqueueCount显示了自队列创建以来的所有值,因此当我将Grafana中的时间范围缩小到“今天到目前为止”时,图表如下所示: 我希望它只显示当前期间的值-我希望图表始终从0开始。在这种情况下,我想用-2来抵消它。有一个offset函数,但是它只是常量,而我需要类似于“按时间段中的最低值进行偏移”的东西 我浏览了一遍,但找不到任何可以让我这样做的函数 有什么办法可以做到

Monitoring 如何在网络级别检测所有保留的虚拟路由器id?

我们有不同的机器,上面有keepalived实例,我正在寻找一种方法来检查(在网络段级别)所有的虚拟路由器id。(以避免重复。) So 1工具,用于在网络上侦听并打印虚拟路由器id。 善良的RGD, Luc在网络级别上,您可能希望收听多播广播,以捕捉保持连接的服务器之间的对话。示例(可在上找到): 这样,您可以找到虚拟路由器id(vrid)和相应的保留服务器(10.10.10.134和10.10.10.135) 但这并不是一种检测所有保留安装/虚拟路由器的防弹方法。Keepalived还可以通过

Monitoring monit中进程组的滚动重新启动

有人对我如何使用monit实现流程组的滚动重启有什么建议吗 提前感谢,, fturtle我不确定您所说的是哪台服务器。但我可以为您提供一个支持滚动重启的thin示例。(选项逐个:true) 所以对于monit你可以用 source /path/to/scripts/rvm rvm use your_gemset@some_ruby thin -C thin.yml restart 如果。。。然后执行“/path/to/thin\u restart.sh” 而thin_restart.sh将类似

  1    2   3   4   5   6  ... 下一页 最后一页 共 11 页