Ce document fournit des descriptions et indique les actions à entreprendre liées aux alertes définies dans les tableaux de bord de surveillance. Si vous ne parvenez pas à régler un problème, vous pouvez soumettre un ticket d’assistance directe en y joignant les captures d’écran des tableaux de bord et les journaux appropriés.
Le taux de réussite de l’API contacts
ou de l’API messages
est faible.
contacts
ou messages
.Données de surveillance manquantes
http://your-monitoring-hostname:9090/targets
) pour vérifier que l’état des statistiques webstats et appstats est UP
. WA_WEB_ENDPOINT
, WA_WEB_USERNAME
et WA_WEB_PASSWORD
sont valides dans le fichier .env
.Le taux de réussite de l’envoi de rappels à l’URL de webhook indiquée dans les paramètres de l’application est faible.
Grep
dans les journaux du Coreapp afin de voir les messages d’erreur.HTTPS 200 OK
après avoir traité les notifications.La file d’attente des messages sortants est presque saturée ; les requêtes d’API échoueront bientôt avec le message System overloaded error
(1016
).
Remarque : dans de rares cas, le tableau de bord affiche une utilisation à plus de 100 % de la file d’attente de messages sortants, due à l’implémentation sous-jacente de la file d’attente. Les actions à entreprendre restent les mêmes.
La file d’attente des rappels est presque saturée ; les requêtes d’API échoueront bientôt avec le message System overloaded error
(1016
).
max_concurrent_requests
dans les paramètres de l’application pour augmenter le nombre de requêtes de rappel simultanées (par défaut, la valeur est 6
).Le taux d’erreur des opérations de transaction de la base de données (transaction, commit, rollback) est élevé.
Grep
dans les journaux du Coreapp afin de voir le code et le message d’erreur SQL.Le taux d’erreur des opérations de lecture dans la base de données (select, prepare) est élevé.
Grep
dans les journaux du Coreapp afin de voir le code et le message d’erreur SQL.Le taux d’erreur des opérations d’écriture dans la base de données (insert, update, delete, etc.) est élevé.
Grep
dans les journaux du Coreapp afin de voir le code et le message d’erreur SQL.La latence moyenne des opérations de transaction de la base de données (transaction, commit, rollback) est élevée.
Nous recommandons une latence de base de données inférieure à 15 ms pour profiter d’un débit de messages élevé.
mysqlslap
ou pgbench
pour mesurer la latence XACT avec des clients simultanés. La latence moyenne des opérations de lecture dans la base de données (select, prepare) est élevée.
Nous recommandons une latence de base de données inférieure à 15 ms pour profiter d’un débit de messages élevé.
mysqlslap
ou pgbench
pour mesurer la latence de lecture avec des clients simultanés. La latence moyenne des opérations d’écriture dans la base de données (insert, update, delete, etc.) est élevée.
Nous recommandons une latence de base de données inférieure à 15 ms pour profiter d’un débit de messages élevé.
mysqlslap
ou pgbench
pour mesurer la latence d’écriture avec des clients simultanés. La latence moyenne des requêtes de retour adressées à l’URL de webhook indiquée dans les paramètres de l’application est élevée.
Nous recommandons une latence de retour inférieure à 80 ms pour profiter d’un débit élevé.
HTTPS 200 OK
immédiatement.Le Coreapp perd constamment la connexion aux serveurs WhatsApp. Les connexions instables ont un impact sur les performances des messages du Coreapp et provoquent des échecs au niveau des API.
Grep
dans les journaux du Coreapp pour voir l’erreur et le message de connexion perdue, ainsi que la fréquence des pertes de connexion.Le Coreapp ne parvient pas à déchiffrer assez vite les messages entrants provenant du serveur WhatsApp, et cela déclenche la perte de la connexion.
L’utilisation de l’UC d’une machine est trop intensive
atop
ou top
sur la machine pour identifier les processus qui sollicitent le plus le processeur. Il peut également être utile de consulter le tableau de bord Container Overview (Vue d’ensemble du conteneur) pour voir les métriques d’utilisation du processeur au niveau du conteneur en associant la variable Machine à la machine qui pose problème. L’utilisation du disque d’un appareil est trop intensive
du
et df
sur l’appareil pour analyser l’utilisation du disque. Il peut également être utile de consulter le tableau de bord Container Overview (Vue d’ensemble du conteneur) pour voir les métriques d’utilisation du disque au niveau du conteneur en associant la variable Machine à la machine qui pose problème. L’utilisation de la mémoire d’une machine est trop intensive
atop
ou top
sur la machine pour identifier les processus qui sollicitent le plus la mémoire. Il peut également être utile de consulter le tableau de bord Container Overview (Vue d’ensemble du conteneur) pour voir les métriques d’utilisation de la mémoire au niveau du conteneur en associant la variable Machine à la machine qui pose problème. La machine va bientôt dépasser la limite en descripteurs de fichiers
fs.file-max = 600000
, par exemple) dans le fichier /etc/sysctl.conf
pour augmenter cette limite. sysctl -p
pour appliquer les modifications.Le pool de connexion à la base de données est élevé ; les nouvelles requêtes risquent d’échouer avec le message d’erreur Too many connections
.
max_connections
(par défaut : 151
) dans my.cnf
et redémarrez le serveur MySQL. Pour plus d’informations, consultez la documentation sur les variables système du serveur MySQL.La file d’attente des connexions au serveur HTTP interne Webapp est presque saturée