企业客户端面板提醒

关键 API 故障提醒

描述

contacts APImessages API 的成功率低

行动项

  1. contactsmessages API 的每秒请求数面板中查找 API 错误代码。
  2. 查看错误代码文档
  3. 查看核心应用每秒请求数数据库每秒请求数面板,以了解故障是否与核心应用故障或数据库故障相关。
  4. 查看核心应用概览面板(使用发生问题的核心应用填充节点变量)和 MySQL 概览面板,以获取更多信息。

无统计数据提醒

描述

监控数据丢失

行动项

  1. 访问 Prometheus 目标端点(即 http://your-monitoring-hostname:9090/targets),以验证网络统计数据和应用统计数据端点的状态是否为 UP
  2. 如果 Prometheus 无法连接到网页应用,则运行 WADebug 来解决错误。
  3. 如果网页应用和核心应用容器正在运行,则查看 .env 文件中的 WA_WEB_ENDPOINTWA_WEB_USERNAMEWA_WEB_PASSWORD 是否有效。

核心应用概览面板提醒

回调故障提醒

描述

应用程序设置中指定的 Webhook 网址发送回调的成功率很低

行动项

  1. 回调请求数面板中查找回调响应错误代码。
  2. Grep 核心应用网络错误日志,查看实际错误消息。
  3. 根据错误代码和消息:
    • 验证是否可以使用核心应用访问您的 Webhook。
    • 验证您的 Webhook 在处理通知后是否总是返回 HTTPS 200 OK 响应。
    • 验证您的 Webhook 是否要用很长时间才能返回响应。

高待传出消息提醒

描述

传出消息队列接近饱和;API 请求很快会失败,并显示 System overloaded error (1016)

行动项

  1. 查看传出消息面板行是否有流量增加异常的情况。如果有流量增加异常,请尝试减少流量负载,直至提醒解除。
  2. 核实您近期的数据库故障是否超过其他区域。由于跨区域延迟,WhatsApp Business API 可能无法赶上负载。
  3. 如果传出消息正随着时间缓慢排队,则您应该向我们报告此漏洞。
  4. 如果单个 WhatsApp Business API 客户端无法满足您的负载要求,请设置多连接以支持更高负载。

高排队回调提醒

描述

回调队列接近饱和;API 请求很快会失败,并显示 System overloaded error (1016)

行动项

  1. 查看回调错误率面板,以验证回调处理是否成功。
  2. 缩短 Webhook 的回调处理时间。
  3. 应用程序设置中配置 max_concurrent_requests,以增加处理中回调请求的数量(默认为 6)。

机器概览面板提醒

高 CPU 占用提醒

描述

机器的 CPU 利用率过高

行动项

  1. 查看 CPU 利用率详情面板以了解利用率分配情况。
  2. 在机器上运行 atoptop,以查找最占用 CPU 的进程。还可以用有问题的机器填充机器变量,查看容器概览面板,以获取容器级别的 CPU 指标。
  3. 如果网页应用、核心应用或数据库占用了大部分 CPU,则为其寻找更强劲的托管机器。对于高可用性/多连接模式,如果网页应用和核心应用容器正在同一台机器上运行,则尝试将其移动到单独的机器上。

高磁盘占用提醒

描述

机器上的设备磁盘利用率过高

行动项

  1. 在设备上运行 dudf 命令,以分析磁盘使用情况。还可以用有问题的机器填充机器变量,查看容器概览面板,以获取容器级别的磁盘指标。
  2. 清理设备上不必要的占用空间的数据,如果有媒体文件或日志,则设置一个定时任务来定期清理旧数据。

高内存占用提醒

描述

机器的内存利用率过高

行动项

  1. 查看内存详细信息面板,以了解利用率分配情况。
  2. 在机器上运行 atoptop,以查找最占用内存的进程。还可以用有问题的机器填充机器变量,查看容器概览面板,以获取容器级别的内存指标。
  3. 如果网页应用、核心应用,或数据库占用了大部分内存,则为其寻找更强劲的托管机器。
  4. 如果核心应用的内存利用率正随着时间增加,这可能是内存泄漏导致,您需要向我们报告漏洞。重启核心应用以改善内存问题。

文件打开过多提醒

描述

机器即将用完文件描述符

行动项

  1. 查看文件描述符面板,以了解打开文件数限制。
  2. /etc/sysctl.conf 文件中配置更高的值 (例如,fs.file-max = 600000),以增加打开文件数限制。
  3. 运行 sysctl -p 以应用更改。

MySQL 概览面板提醒

数据库连接过多提醒

描述

数据库连接池的利用率很高,新的数据库请求会很快失败,并显示 Too many connections 错误

行动项

  1. 查看连接面板,以了解当前连接限制。
  2. my.cnf 中增加 MySQL 系统变量 max_connections 的数量(默认为 151),然后重启 MySQL 服务器。查看 MySQL 服务器系统变量文档,以获取更多信息。
  3. 对于 AWS RDS,您需要迁移到更大的 RDS 实例。查看 AWS 部署详细信息RDS 实例大小调整部分,以获得更多指引。

网页应用概览面板提醒

HTTP 服务器高挂起连接提醒

描述

网页应用的内部 HTTP 服务器连接队列接近饱和

行动项

  1. 查看企业客户端面板,以了解异常 API 流量或高 API 请求延迟。
  2. 查看网页应用日志,以获取更多信息。
  3. 检查网页应用的 CPU 利用率是否较高,如果是,则为网页应用寻找更强劲的机器。