En production, une passerelle OpenClaw peut afficher un état « en ligne » alors que les messages n’arrivent plus, que les webhooks tournent à vide ou que l’auth WebSocket se ferme en silence. Ce scénariofaux en ligneressemble à un incident matériel ; en réalité, il répond souvent mieux à unepreuve dans les journauxet à deux lectures CLI —channels status --probeethealth --json— qu’à unredémarrage aveuglequi masque la cause. Ce guide propose une checklist comparable pour décider vite, sans mélanger symptôme et remède. Pour cadrer l’installation initiale et ledoctor, voyez aussi
OpenClaw 2026 : installation sans interface, daemon et doctor sur une page.
1. Nommer le problème : « en ligne » n’est pas « routé »
Lelaunchdpeut laisser vivre un processus qui écoute encore un port alors que la session amont (fournisseur de modèle, broker, stockage d’état) est rompue. Les tableaux de bord verts aggravent la confusion : ils agrègent un battement de cœur réseau, pas lalivraison bout en bout. Avant toute action, notez l’heure exacte du dernier message utile, le canal concerné et la version du CLI ; comparez avec les notes de version et les migrations récentes — le sujet des mises à jour et duhealthest détaillé dans
OpenClaw 2026 : mises à jour, migration de configuration et validation health multi-régions.
2. Journaux : ce qui tient lieu de preuve
Collectez en parallèle la sortiestdout/stderrdu démon, les fermetures WebSocket aveccode et raison, et les refus TLS ou proxy (en-têtesAuthorizationouSec-WebSocket-*tronqués). Horodatez avec NTP correct : deux machines à dérive temporelle rendent inutilisable la corrélation. Si vous hébergez plusieurs expérimentations sur le même Mac, séparez les répertoires de configuration et les identités OS — le mélange de comptes est la première cause de « ça marchait hier en SSH ». Conservez un extrait anonymisé dans le ticket ; il évite les allers-retours quand l’astreinte change d’continent.
Pour les serviceslaunchd, exportez aussi la définition de l’unité (chemins des binaires, variables d’environnement, limites de fichiers ouverts) et confrontez-la à ce que vous observez en session SSH : une divergence silencieuse surHOMEouOPENCLAW_* suffit à fabriquer un « faux en ligne ». Quand la charge augmente, activez une rotation courte des journaux sur disque dédié afin de ne pas saturer la partition système — les équipes qui mélangent cache modèle et logs sur la même NVMe voient souvent des timeouts intermittents plutôt qu’une panne nette.
3. channels status --probe : tester le chemin réel
La sonde exécute le même chemin d’émission qu’un message utilisateur : elle révèle les canaux fantômes, les URL de webhook obsolètes ou les quotas silencieux. Si la sonde échoue alors que l’UI reste verte, suspectez d’abordDNS asymétrique, un load balancer qui bufferise l’upgrade WebSocket, ou un channel secondaire qui capte encore le trafic. Réduisez la surface : désactivez les canaux hors production, renvoyez un message synthétique, comparez la latence aller-retour avec celle mesurée depuis votre région cible. Pour arbitrer la métropole et le stockage avant d’empiler des passerelles, la FAQ Mac cloud 2026 : six régions, latence et coûts de locationdonne des repères chiffrés utiles.
4. health --json : décider avec des champs stables
Parsez la sortie JSON dans vos scripts d’alerte plutôt que de gréer du texte libre. Vous cherchez des incohérences entreprocessus actif,connectivité sortante,version d’API attendueet l’état des dépendances locales (disque, fichiers de verrou, permissions workspace). Quand un champ critique passe en défaut mais le service répond encore HTTP, programmez un redémarragecontrôléaprès sauvegarde de la config — pas l’inverse. Les redémarrages répétés sans delta JSON sont un signal d’instrumentation insuffisante, pas de charge CPU.
Automatisez un instantané horodaté :health --jsonsuivi d’un extrait de journal de la même seconde. Les alertes qui ne capturent qu’un code HTTP 200 sur le port d’administration encouragent précisément le biais « faux en ligne » ; préférez des sondes qui consomment le même schéma que vos outils d’exploitation (Prometheus, OpenTelemetry, ou simple fichier append-only sur le Mac cloud).
- Comparer
health --jsonavant et après un changement réseau (VPN, Tailscale, règle de bastion). - Vérifier l’espace disque : une NVMe pleine produit des erreurs TLS et WS masquées en « auth ».
- Aligner le PATH du démon et celui de votre shell interactif avant d’écarter une régression binaire.
5. Matrice courte : redémarrer ou corriger ?
Si la sonde et le JSON pointent versfuite de descripteursoufichier de config illisible, un redémarrage propre peut débloquer. Si le JSON signale401/403 persistantsou1008 policy, corrigez jeton, audience et proxy : redémarrer ne fera que réinitialiser le compteur d’échecs. Documentez l’ordre des opérations dans votre runbook multi-régions afin que Singapour et la Virginie appliquent la même séquence.
6. Cas d’usage par métropole (location courte ou moyenne durée)
Les équipes déploient généralementune passerelle par fuseau critiqueplutôt qu’un hub unique. Exemples fréquents en 2026 : àSingapour, une location de quelques jours pour valider la sonde vers les fournisseurs ASEAN ; àTokyoouSéoul, une fenêtre deux à quatre semaines alignée sur une release mobile locale ; àHong Kong, un pont court entre équipes continentales et îliennes ; sur lacôte est des États-Unis, une instance proche des SaaS juridiques ; sur lacôte ouest, un voisinage avec les pipelines ML et les caches d’artefacts. Le Mac mini M4 16 Go/256 Go suffit souvent aux passerelles seules ; montez en 24 Go/512 Go quand la même machine héberge runners lourds ou de gros journaux. Chaque région répète la même colonne vertébrale d’installation ; seuls le RTT et les politiques d’egress changent.
Sur le cloud vpszap, la ligne de base reste ennuyeuse — ce qui est une bonne nouvelle
Toutes les étapes ci-dessus sont plus simples sur unMac mini M4 physique, sans virtualisation, avec CPU, mémoire et SSD entièrement réservés à votre instance,SSH et VNCen environcinq minutes. La facturation aujour, semaine, mois ou trimestres’accompagne d’aucun engagement long : vous clonez la procédure à Tokyo pour la préproduction et gardez la Virginie pour la charge réelle, sans partager de voisins bruyants sur le disque.
Si vous voulez du matériel qui ne combat pas votre checklist de diagnostic, commencez par la page d’accueil Mac mini cloud vpszap et choisissez les métropoles où vivent déjà vos utilisateurs et runners.