Temas técnicos

¿Qué es la observabilidad en las operaciones informáticas?

Ilustración de artículos informáticos centrada en un ordenador portátil

Visión general

La observabilidad de los sistemas empresariales se consigue cuando los operadores, desarrolladores e ingenieros de fiabilidad de sistemas (SRE) pueden comprender rápidamente los cambios en el rendimiento de los sistemas informáticos y reaccionar ante ellos. Al basarse en un profundo conocimiento de las comunicaciones entre aplicaciones y microservicios, permite a los ingenieros y administradores encontrar inmediatamente fallos y ralentizaciones sin las salas de guerra de alto coste y mano de obra intensiva que asolan a las grandes organizaciones. La velocidad que se obtiene es especialmente útil cuando las aplicaciones complejas abarcan nubes públicas, centros de datos propios y procesadores de terceros, lo que hace más difícil identificar la causa raíz de las degradaciones del servicio.

La observabilidad avanzada difiere de la supervisión tradicional en un aspecto clave: La observabilidad avanzada no sólo recopila los datos métricos que prevalecen en la supervisión, sino que también captura el flujo y los tiempos de las transacciones, y los combina con eventos y registros correlacionados para proporcionar información procesable. Esta información proporciona una comprensión más completa del comportamiento del sistema/aplicación y ayuda a identificar problemas que de otro modo serían difíciles de detectar.

La observabilidad no es un término nuevo. Acuñado en 1960 en relación con la teoría del control, la observabilidad se ha trasladado ahora a otras disciplinas, incluidas las TI. Debido a la complejidad de la nube híbrida, "observabilidad de la nube" también se ha convertido en un término popular.

Descubra cómo puede utilizar la capacidad de observación basada en OpenTelemetry para obtener información moderna.

Observabilidad

¿Cuál es la diferencia entre supervisión y observabilidad?

La observabilidad se confunde a menudo con la supervisión, pero ambas son bastante diferentes.

La monitorización consiste en observar el rendimiento de un sistema a lo largo del tiempo. Las herramientas de monitorización suelen recopilar datos de rendimiento de fuentes específicas, como archivos de registro o contadores de rendimiento. Por ejemplo, la monitorización puede decirte cuántos usuarios hay en el sistema, pero no te dice proactivamente cuándo estás alcanzando un límite de capacidad. La monitorización es un enfoque reactivo que requiere que sepas de antemano qué es importante monitorizar. Una de sus limitaciones es que se centra en capturar métricas en un momento concreto.

La observabilidad cumple una función más amplia que la supervisión. Las herramientas de observabilidad recopilan datos de todas las fuentes disponibles, como registros, contadores de rendimiento y código de aplicación. A continuación, analizan esos datos para obtener visibilidad del funcionamiento interno de un sistema y comprender su comportamiento. Estos datos pueden utilizarse para detectar incidencias antes de que causen problemas, identificando tendencias y proporcionando información sobre cómo puede mejorarse el sistema.

La observabilidad es el resultado de una amplia monitorización y análisis a nivel de transacción, al igual que la vista es el resultado de los ojos y el procesamiento visual del cerebro. Las soluciones de observabilidadOpenText™ , cuando se combinan con la plataformaOpenText AIOps, pueden ofrecer tanto la información de observabilidad como las amplias capacidades de eventos, gestión de sistemas y corrección necesarias para mantener servicios de TI complejos.


¿Cuáles son los tipos de datos importantes para la observabilidad?

Existen dos escuelas de pensamiento para las soluciones de observabilidad:

  1. MELT. Este acrónimo identifica los tipos de datos recogidos en el marco de la observabilidad.
    • Métricas: Se trata de la supervisión clásica: mediciones de actividades a lo largo del tiempo, desde tiempos de respuesta de red de microsegundos hasta transacciones sintéticas completas.
    • Eventos: Los eventos generados por el sistema que ocurren durante el periodo de medición.
    • Registros: Datos no estructurados que proporcionan información sobre las actividades del sistema.
    • Trazas: Representación visual grabada de todo el recorrido de una solicitud a medida que se desplaza por los nodos de un sistema distribuido que proporciona un desglose temporal con contexto sobre la conexión entre servicios.
  2. Señales doradas. Popularizadas por Google como parte de su manual de SRE, las señales doradas representan un enfoque más centrado en el rendimiento para resolver problemas.
    • Latencia: El tiempo que tarda tu aplicación en atender una petición.
    • Tráfico: El número de peticiones que recibe tu sistema.
    • Errores: La tasa de peticiones que fallan.
    • Saturación: El estado de la capacidad dentro de su servicio.

Observe que existen similitudes significativas en los datos recopilados, pero se describen de forma diferente en función del contexto (tipo frente a rendimiento). Tanto si utiliza MELT como señales doradas, la clave es centrarse en los resultados anómalos para detectar problemas e identificar dónde se producen. En la siguiente sección, titulada ¿Cómo ayuda OpenTelemetry con la observabilidad?, usted puede aprender más acerca de cómo OpenTelemetry utiliza estos datos para ofrecer una observabilidad extraordinaria.


¿Cómo ayuda OpenTelemetry a la observabilidad?

OpenTelemetry es un proyecto de código abierto gestionado por la Cloud Native Computing Foundation. Proporciona un protocolo de instrumentación independiente del proveedor para recopilar datos de telemetría, incluidas métricas, trazas y registros. El protocolo funciona en todos los lenguajes de programación y plataformas, lo que permite analizar todos los datos en una única vista. Este enfoque estandarizado agiliza la instrumentación a la vez que define y correlaciona los datos de telemetría. La principal ventaja de OpenTelemetry es su portabilidad, que permite a los desarrolladores y al departamento central de TI seleccionar los conjuntos de herramientas más adecuados para sus funciones.


Observabilidad y operaciones informáticas

El departamento de Operaciones de TI suele supervisar sus centros de datos para mantener el tiempo de actividad y el rendimiento del servicio. Cuando surgen problemas no relacionados con fallos de hardware o software, Operaciones de TI abre tickets para que los desarrolladores investiguen los problemas subyacentes utilizando herramientas de observabilidad. Los desarrolladores suelen realizar consultas complejas en Promotheus, creando flujos de datos para su análisis y accediendo a los registros para investigar los fallos.

Con la llegada de OpenTelemetry, los equipos de operaciones de TI pueden simplificar la recopilación y el análisis de datos con trazas que incluyen métricas y registros correlacionados. Las capacidades de correlación del protocolo OpenTelemetry eliminan la necesidad de que los operadores utilicen lenguajes de programación complejos como PromQL o realicen consultas de registro para iniciar y comprender los datos de observabilidad.

En su lugar, pueden acceder a datos correlacionados con facilidad. Aunque los operadores no pueden sugerir actualizaciones de código, pueden identificar cuellos de botella en el rendimiento y enviar tickets directamente a la parte responsable, ya sea un desarrollador interno o un proveedor externo que experimente ralentizaciones en su aplicación.


¿Cuáles son las ventajas de la observabilidad?

Las organizaciones pueden obtener una completa observabilidad de TI gracias a estas ventajas clave:

  • Mejora de la calidad: Cuanto más se observa, más problemas críticos se pueden encontrar, lo que se traduce en mejores productos que satisfacen las expectativas de las partes interesadas y los clientes.
  • Mayor eficacia: Gracias a la observabilidad, las empresas pueden depurar rápidamente sistemas y software.
  • Reducción de costes: Los largos periodos de depuración cuestan mucho tiempo y dinero, que la observabilidad puede reducir a largo plazo.
  • Mayor rapidez de comercialización: Gracias a la observabilidad, podrá prestar servicios de TI, como aplicaciones nuevas o actualizadas, en el plazo previsto.
  • Supervisión del rendimiento de las aplicaciones: La observabilidad integral permite a las organizaciones diagnosticar inmediatamente los problemas críticos del software y mejorar las métricas de rendimiento.
  • Análisis empresariales útiles: Dado que la observabilidad es un proceso que requiere muchos datos, puede obtener más información sobre los indicadores clave de rendimiento (KPI), como el retorno de la inversión (ROI) y su cuenta de resultados.
  • Experiencia de usuario excepcional: La detección de incidencias antes de que se conviertan en problemas conduce a una experiencia de usuario excepcional, que puede mejorar la reputación y la rentabilidad de una organización.
  • Supervisión de la infraestructura, la nube y Kubernetes: Observability puede ayudar a detectar problemas de software en todos los equipos de infraestructura y operaciones (I&O), entornos Kubernetes y la nube. El resultado es una cobertura mejorada de todos los componentes que conforman una aplicación de éxito.
  • Mejora del análisis de la causa raíz: La combinación de métricas, registros y trazas permite un análisis más rápido y preciso de la causa raíz. Los equipos pueden correlacionar rápidamente los datos de distintos sistemas y servicios para identificar el origen de los problemas.
  • Mayor colaboración: La capacidad de observación crea una comprensión compartida del comportamiento del sistema entre los equipos de desarrollo, operaciones y negocio. Esta base común mejora la comunicación y acelera la resolución de problemas.
  • Resolución predictiva de problemas: Con datos completos de observabilidad y análisis avanzados, las organizaciones pueden identificar posibles problemas antes de que afecten a los usuarios. Este enfoque proactivo reduce el tiempo de inactividad y mejora la fiabilidad del servicio.
  • Gestión de la escalabilidad: Observability proporciona información crucial para gestionar la escalabilidad del sistema, ayudando a las organizaciones a optimizar los recursos y planificar el crecimiento de forma eficaz.

Cuando se implementa correctamente, la observabilidad puede ser una herramienta poderosa para obtener una visibilidad completa de TI, lo que se traduce en impactos positivos en la calidad del rendimiento de TI de una organización, la eficiencia, el tiempo de comercialización y la rentabilidad.


¿Cómo funciona AIOps con la observabilidad?

AIOps mejora la observabilidad traduciendo los conocimientos en acciones. Por ejemplo, mientras que la observabilidad ayuda a los desarrolladores a comprender cómo afectan determinados segmentos de código al comportamiento de la aplicación, AIOps permite a los equipos de operaciones responder automáticamente a las interrupciones y ralentizaciones con el mínimo esfuerzo. Juntas, estas herramientas ofrecen a los equipos la máxima visibilidad y un profundo conocimiento de los problemas y sus repercusiones.

Esta combinación es esencial para que las operaciones se desarrollen sin contratiempos, especialmente si cuenta con equipos multifuncionales y un entorno informático altamente distribuido. Las AIOP más la observabilidad mejoran las operaciones informáticas diarias críticas, entre otras:

  • Depuración precisa: Utilice datos de eventos, métricas, registros, trazas y otras fuentes disponibles para identificar y resolver problemas rápidamente.
  • Detección proactiva: Detecte las incidencias antes de que causen problemas utilizando tendencias visuales y basadas en algoritmos para identificar posibles problemas.
  • Mantenimiento rentable: Proporcione a los propietarios de las aplicaciones y a los equipos centrales de TI la capacidad de supervisar los sistemas de toda la empresa para obtener una amplia perspectiva de los fallos y el rendimiento del software y el hardware sin depender de costosos recursos de desarrolladores o SRE.
  • Mejora de la eficacia: Obtenga información sobre cómo puede mejorar un sistema y realice los cambios oportunos.
  • Cobertura más amplia de múltiples arquitecturas nativas de la nube: Utilice una herramienta de terceros para obtener una visión holística de varias arquitecturas nativas de la nube en lugar de depender de las herramientas de rendimiento de los proveedores de nubes públicas.
  • Aceleración de las operaciones de TI basada en GenAI: Permita que tanto los operadores experimentados como los nuevos comprendan y solucionen rápidamente los problemas detectados con sugerencias de corrección basadas en eventos y consultas inteligentes de documentación basadas en GenAI.
  • Corrección integrada: Ofrezca reparaciones automatizadas o implementadas por el usuario con una sólida plataforma de AIOps para impulsar operaciones eficientes y eficaces.

Las AIOps y la observabilidad tienen aplicaciones de amplio alcance, desde la optimización de las transacciones web hasta la garantía de que el rendimiento de TI cumple las expectativas de los clientes. He aquí un caso de uso que pone de relieve su valor:

Supongamos que eres un desarrollador que intenta identificar la causa de un fallo del sistema. Con la monitorización, tendrías que asegurarte de que se han monitorizado todos los sistemas relevantes, recopilar manualmente datos de ellos e intentar averiguar qué ha ocurrido. Este proceso sería difícil y llevaría mucho tiempo porque los datos serían posteriores al fallo.

Con AIOps y la observabilidad, tiene acceso automático a los datos de todas las fuentes disponibles, incluidas las métricas correlacionadas, los registros y las trazas. También tiene acceso a recomendaciones de corrección de GenAI a partir de documentación tanto pública como privada y corrección automatizada. Y lo que es más importante, cuenta con la ayuda de la analítica para encontrar anomalías que podrían indicarle el problema antes de que colapse el sistema.


Herramientas y costes de la observabilidad

El coste es uno de los principales inconvenientes de las herramientas de observabilidad. Según una encuesta reciente, casi todos los encuestados (98%) han experimentado sobrecostes o picos inesperados en los costes al menos un par de veces al año, y el 51%, al menos una vez al mes.

Estos picos se deben principalmente a los costes de ingestión que cobran los proveedores de herramientas de observabilidad que pueden extraer grandes cantidades de datos relacionados con las transacciones de las aplicaciones. Estos costes tienen dos consecuencias:

  1. Un conjunto incompleto de aplicaciones que utilizan la observabilidad (sólo las calificadas como críticas para el funcionamiento de la empresa).
  2. No se amplían las herramientas de observabilidad más allá de los SRE y los desarrolladores.

En ambos casos, la llegada de OpenTelemetry y los precios más rentables que ofrecen proveedores como OpenText pueden ampliar la supervisión a todos los servicios de TI y permitir que el departamento de Operaciones de TI acceda a las herramientas.


¿Cuáles son las mejores prácticas de observabilidad?

Para maximizar el valor de la observabilidad en su organización, tenga en cuenta estas mejores prácticas esenciales:

Empezar con objetivos claros

  • Defina objetivos específicos para su aplicación de la observabilidad.
  • Identificar los sistemas y servicios críticos que requieren una supervisión detallada.
  • Establecer métricas de referencia para el comportamiento normal del sistema.

Definir métricas significativas

  • Céntrese en las métricas que repercuten directamente en los resultados empresariales.
  • Aplicar el método USE (Utilización, Saturación, Errores).
  • Cree métricas personalizadas para procesos específicos de la empresa.

Establecer la instrumentación adecuada

  • Implantar instrumentación automatizada siempre que sea posible.
  • Garantizar la coherencia del etiquetado en todos los sistemas.
  • Equilibre la granularidad de los datos con los costes de almacenamiento y rendimiento.

Crear cuadros de mando eficaces

  • Diseñe cuadros de mando que ofrezcan información clara sobre la salud del sistema.
  • Incluya tanto visiones generales de alto nivel como capacidades de desglose detallado.
  • Personalice las vistas según las necesidades de las distintas partes interesadas.

Soluciones de observabilidad OpenText

OpenText ofrece soluciones integrales de observabilidad diseñadas para abordar las complejas necesidades de los entornos de TI modernos. Nuestro enfoque integrado garantiza una visibilidad completa de todo su entorno de TI:

Observabilidad de la nube Las soluciones de observabilidad de la nube de OpenText proporcionan una visión profunda de las aplicaciones nativas de la nube y la infraestructura a través de múltiples proveedores de nube. Estas soluciones permiten a las organizaciones supervisar la utilización, los costes y el rendimiento de los recursos en la nube, al tiempo que garantizan una prestación de servicios óptima. Los equipos pueden identificar y resolver rápidamente problemas específicos de los entornos de nube, como servicios mal configurados o limitaciones de recursos.

Observabilidad de aplicaciones Nuestras funciones de observabilidad de aplicaciones ofrecen información detallada sobre el rendimiento de las aplicaciones, la experiencia del usuario y las transacciones empresariales. Esta solución ayuda a los equipos de desarrollo y operaciones a comprender el comportamiento de las aplicaciones, realizar un seguimiento de las experiencias de los usuarios y optimizar el rendimiento de las aplicaciones. Incluye funciones de supervisión en tiempo real, diagnósticos a nivel de código y análisis de la experiencia del usuario.
¿Qué hay de nuevo en OpenText Application Observability?

Observabilidad de la infraestructura La solución de observabilidad de la infraestructura deOpenText proporciona una supervisión y un análisis completos de toda su infraestructura de TI, incluidos servidores, almacenamiento y entornos virtualizados. Esta solución permite a los equipos realizar un seguimiento de la utilización de los recursos, las tendencias de capacidad y el estado de la infraestructura en entornos híbridos, garantizando un rendimiento y una asignación de recursos óptimos.
¿Qué hay de nuevo en OpenText Infrastructure Observability?

Observabilidad de la red Nuestras soluciones de observabilidad de la red ofrecen visibilidad de extremo a extremo del rendimiento de la red, los patrones de tráfico y los problemas de conectividad. Ayudan a las organizaciones a mantener un rendimiento óptimo de la red, identificar posibles amenazas a la seguridad y garantizar una prestación de servicios fiable. La solución incluye análisis avanzados para la resolución de problemas de red, la planificación de la capacidad y la optimización del rendimiento.


Lo esencial de la observabilidad: Mejor visibilidad de su parque informático

La observabilidad es un elemento importante para comprender el estado completo de toda su infraestructura. La afluencia de herramientas que se implantaron con buenas intenciones ha dejado desordenado su parque informático, provocando que sus sistemas sean más complejos de lo que nunca han sido.

Esta complejidad dificulta enormemente la resolución de problemas y la gestión del sistema. Un mayor número de herramientas genera más problemas, sobre todo cuando las que se utilizan con más frecuencia dejan de funcionar, lo que dificulta aún más su localización y solución.

Las herramientas de observabilidad eficaces proporcionan un enfoque de corrección proactivo para ayudar a descubrir los problemas con mayor rapidez.

Productos relacionados

OpenText AI Operations Management

Aumente la fiabilidad empresarial con AIOps de pila completa en todas las nubes

OpenText Core Application Observability

Supervise y gestione aplicaciones de forma rentable con OpenTelemetry

OpenText Core Infrastructure Observability

Aumente el rendimiento de su infraestructura en la nube y en sus instalaciones

OpenText Network Operations Management

Optimice su red en evolución

OpenText Observabilidad de la red central en nube

Cerrar la brecha de observabilidad entre las redes en la nube y fuera de la nube

Notas a pie de página