Zigbee en producción real: qué falla después de 90 días (R7)

Instalar Zigbee funciona. Lo que nadie te cuenta es lo que pasa después.

Llevamos años documentando instalaciones domóticas en viviendas reales. Hay un patrón que se repite: los problemas de Zigbee no aparecen en el primer mes. Aparecen entre el segundo y el cuarto. Cuando el entusiasmo de la instalación ya pasó, cuando dejaste de monitorizar activamente, cuando ya diste por supuesto que todo funcionaba.

Esta investigación documenta qué falla en instalaciones Zigbee después de 90 días de uso real, por qué falla, y cuándo el problema es realmente Zigbee y cuándo es otra cosa.

El mito del protocolo estable

Zigbee es un protocolo de malla. En teoría, cuando añades dispositivos a la red, la malla se fortalece: más nodos, más rutas alternativas, más redundancia. En la práctica, las instalaciones domésticas tienen entre 10 y 40 dispositivos, no los cientos para los que está optimizado el protocolo en entornos industriales. Con esas cifras, la malla es más frágil de lo que parece.

Los routers Zigbee (los dispositivos con alimentación permanente que repiten la señal) crean rutas fijas en la tabla de enrutamiento. Esas rutas no se recalculan continuamente: se recalculan cuando hay un fallo. Hasta que ese fallo ocurre, el dispositivo sigue intentando comunicarse por la ruta original, aunque sea subóptima o haya empeorado.

El resultado: un dispositivo que funciona en el primer mes puede empezar a dar latencias o pérdidas de paquetes en el tercer mes sin que hayas cambiado nada visible en la instalación.

Qué falla de verdad después de 90 días

1. Dispositivos que se vuelven inalcanzables sin razón aparente

Es el fallo más frecuente. Un sensor o un enchufe que llevaba meses funcionando aparece como «offline» en el dashboard. Lo desconectas y reconectas: vuelve. Durante unos días. Y luego se repite.

La causa casi siempre es una de estas tres: el router Zigbee por el que ruteaba ese dispositivo tuvo un problema transitorio (reinicio, fallo de firmware, interferencia puntual) y el dispositivo final no reconectó correctamente a la malla. O el canal Zigbee está solapando con una red WiFi 2,4 GHz que se añadió o cuya potencia aumentó. O el dispositivo tiene un firmware con un bug de gestión de conexión que solo se manifiesta después de semanas de uso continuo.

2. Latencia creciente en dispositivos que antes respondían instantáneamente

Enciendes una luz y responde en 3 segundos. Antes respondía en menos de uno. La lámpara sigue funcionando, pero algo cambió.

En la mayoría de casos que hemos documentado, la causa es que el dispositivo cambió de ruta de enrutamiento hacia una peor: más saltos, señal más débil, o un router intermedio con carga alta. La ruta de enrutamiento Zigbee no es transparente en la mayoría de implementaciones de usuario: no ves por dónde pasan los mensajes sin herramientas de diagnóstico como Zigbee2MQTT con el panel de topología activado.

El otro culpable frecuente de latencia creciente es el propio hub: si el coordinator Zigbee (el dongle USB o el hub propietario) tiene la memoria llena de dispositivos fantasma, mensajes acumulados sin procesar, o simplemente lleva meses encendido sin reinicio, el cuello de botella no está en la malla sino en el coordinator. Un reinicio semanal programado del coordinator resuelve esta categoría de problemas en la mayoría de instalaciones.

3. Dispositivos que se emparejan pero no responden a comandos

El dispositivo aparece en el dashboard, tiene señal, pero no ejecuta los comandos. O los ejecuta con un delay de 10-30 segundos. O solo funciona si estás físicamente cerca del coordinator.

Este es el patrón clásico de un router Zigbee que ha fallado silenciosamente. El dispositivo final sigue viendo al router (que todavía emite señal de presencia), pero el router ya no está retransmitiendo los mensajes de vuelta al coordinator. La malla tiene un agujero que nadie notó porque el router sigue pareciendo activo.

La solución más rápida es identificar qué router Zigbee está actuando como intermediario para ese dispositivo (con la topología en Z2M o ZHA) y reiniciarlo. Si el problema persiste, ese router puede tener un firmware corrupto o un fallo de hardware.

4. Automatizaciones que fallan solo de noche o en horas específicas

Una automatización que funciona perfectamente durante el día empieza a fallar entre las 00:00 y las 06:00. O solo los fines de semana. O solo cuando hay viento.

Este patrón horario casi siempre apunta a interferencias de canal. De noche, cuando los vecinos duermen, sus routers reducen potencia o cambian comportamiento, y el canal Zigbee que estaba siendo empujado por interferencias externas queda despejado o lo contrario. Los routers WiFi domésticos modernos tienen ajuste de potencia dinámico que cambia según la demanda: a las 2 de la mañana tu router puede estar en potencia mínima, reduciendo la interferencia con Zigbee 2,4 GHz.

Si tienes este patrón, lo primero es verificar qué canal Zigbee estás usando y qué canales WiFi están activos en tu entorno. Los canales Zigbee 11 a 14 solapan con WiFi canal 1. Los canales Zigbee 15 a 22 solapan con WiFi canal 6. El canal Zigbee 25 o 26 es el que menos interferencias tiene con WiFi estándar en España.

5. El coordinator que «se cuelga» sin razón

El coordinator Zigbee (dongle USB, hub) deja de responder. Todos los dispositivos aparecen offline. Un reinicio del coordinator lo resuelve, pero vuelve a pasar semanas después.

Con dongles USB tipo Sonoff Zigbee 3.0, HUSBZB-1 o similares, este problema suele tener tres causas: la fuente de alimentación del USB tiene ripple eléctrico que genera errores de comunicación acumulados; el firmware del dongle tiene un memory leak que se manifiesta después de semanas; o el cable USB tiene resistencia suficiente como para causar problemas bajo carga sostenida. El cambio a un cable USB con núcleo de cobre de buena calidad y la alimentación desde un puerto USB con regulación propia (no del hub USB genérico) resuelve la mayoría de estos casos.

Cuándo el problema es Zigbee y cuándo es otra cosa

Esta distinción es la más importante y la que más tiempo hace perder en diagnóstico.

Casi siempre es Zigbee cuando: los fallos afectan a dispositivos alejados del coordinator y no a los cercanos; los problemas mejoran al acercar dispositivos; la topología muestra saltos de 3 o más niveles; los fallos son intermitentes con patrón irregular.

Casi nunca es Zigbee cuando: todos los dispositivos fallan a la vez; los dispositivos físicamente cercanos al coordinator también fallan; el problema se resuelve reiniciando el servidor de Home Assistant sin tocar la malla; las automatizaciones fallan pero los dispositivos responden a comandos manuales.

Es casi seguro WiFi cuando: los fallos correlacionan con el uso intensivo de la red WiFi doméstica; empezaron después de instalar un nuevo punto de acceso WiFi; el canal Zigbee que usas solapa con el canal WiFi de tu router o del vecino; los fallos mejoran a las horas de menos actividad WiFi en el entorno.

La frase que más repetimos internamente en TCC: muchos problemas Zigbee son en realidad problemas WiFi disfrazados. Antes de culpar al protocolo, comprueba el entorno de radiofrecuencia.

Lo que una instalación Zigbee bien hecha necesita para aguantar

Después de documentar instalaciones que aguantan sin incidencias durante años y otras que empiezan a degradarse a los 3 meses, hay patrones claros en las que funcionan:

Canal fijo alejado de WiFi. Elige el canal Zigbee en el momento de configurar el coordinator y no lo cambies. El canal 25 es el más seguro en la mayoría de entornos europeos. Cambia tus routers WiFi a canales 1 o 11 si puedes (evita el 6 si usas Zigbee en canales bajos).

Routers Zigbee bien distribuidos. Necesitas al menos un router Zigbee (enchufe o bombilla siempre encendida) cada 10-15 metros de los sensores y dispositivos finales. Los dispositivos con batería son end devices, no enrutan: no cuentan como refuerzo de malla.

Coordinator en posición central, no en el router. El dongle USB o hub Zigbee debería estar en el centro físico de la instalación, no en el armario donde está el router de fibra (que suele estar en un extremo del piso). Un cable de extensión USB activo de 3-5 metros para alejar el dongle de la fuente de interferencias del propio router es una inversión de 8 euros que cambia el comportamiento de toda la instalación.

Firmware actualizado en el coordinator. Los firmwares de los dongles Zigbee tienen versiones con bugs de estabilidad que se corrigen en actualizaciones. Comprobar una vez al año que el firmware del coordinator es el más reciente es mantenimiento básico.

Limpieza periódica de dispositivos fantasma. Cuando retiras un dispositivo Zigbee de la instalación sin hacer el proceso de baja correctamente, el coordinator sigue intentando contactar con él. En instalaciones grandes, acumular 10-15 dispositivos fantasma carga el coordinator de forma significativa. Hacer una limpieza cada 6-12 meses de la tabla de dispositivos es higiene básica.

La conclusión que no está en ninguna guía de instalación

Zigbee es un protocolo sólido para el hogar. Pero la estabilidad a largo plazo no viene del protocolo: viene de la arquitectura de la instalación, del entorno de radiofrecuencia y del mantenimiento.

Una instalación Zigbee bien diseñada con canal fijo, routers bien distribuidos y coordinator en posición central puede aguantar años sin intervención. Una instalación Zigbee con canal solapando WiFi, sin routers intermedios y coordinator pegado al router de fibra va a dar problemas a los 3 meses independientemente de la calidad de los dispositivos.

El fallo no es de Zigbee. Es de la instalación.

Esta investigación forma parte de la serie Investigaciones TCC: análisis basados en patrones documentados en instalaciones reales y comunidades de domótica. Sin afiliado. Sin producto protagonista. Solo lo que hemos visto funcionar y fallar.