Salesforce 如何使用 Grafana 和 Prometheus 大规模管理服务运行状况 - grafana


基于云的软件公司 Salesforce 是全球第一的客户关系管理平台 (CRM)。它帮助企业通过一个集成平台将其营销、销售、商务、服务和 IT 团队联系起来。 
GrafanaCONline 2021 演讲中,Salesforce 的一个团队讨论了他们如何使用 Grafana 的仪表板、Prometheus 和插件来可视化和管理整体服务运行状况和警报,以及推动整个公司的整体产品可用性洞察。
Salesforce 每分钟处理超过 7000 万个电子商务指标。根据这些指标,公司的内部团队配置了数千个独特的警报定义。Grafana 警报与 Salesforce 自己的警报服务相结合,每分钟处理超过 120,000 个警报,为其内部团队提供主动监控功能。每天,Grafana 为公司内部团队的 300 多名活跃用户提供服务。
Salesforce 可以观察到的数据包括高系统利用率、每台服务器的 CPU 和数据库连接。根据公司所见,它可以引导调查以发现客户可能遇到的任何问题的根本原因。然后 Pallotta 完成了其中一项完整调查,以展示 Grafana 图如何用于集体解决问题。