jueves, 1 de junio de 2017

Some Monitoring & Troubleshooting Tools - OEL/RHEL

Monitoring tools 


DSTATDespliega estadísticas sobre el uso de los recursos del sistema


En la seccion de "system", "int" y "csw" significan lo siguiente:

int   = interrupts
csw = context switches

FREE = Reporte de la memoria del sistema




IOSTAT = Estadisticas de I/O del sistema




IOTOPMonitorea el disco y el intercambio de E / S en una base por proceso




MPSTAT = Verifica el procesador




SAR = Actividad del sistema




Uptime = Tiempo del servidor en "up" y carga actual del mismo




NMON = Herramienta para monitorear y analizar informacion de rendimiento




DMESG = Errores del sistema en general






Troubleshooting:



El porcentaje de tiempo tomado tomado para un código de sistema en ejecución no debería exceder el 30%, especialmente si %idle está cercano al 0%



En un sistema ocupado, el porcentaje de carga reportado por uptime o sar –q, debería usualmente no ser mayor que 2 veces el número de CPU cores, en los periodos de 5 o 15 minutos



Una combinación de un promedio sostenido de carga o un encolamiento de procesos en espera y un bajo “%idle%, indica que el sistema tiene insuficiente CPU para la carga de trabajo



El siguiente comando muestra cuales procesos están usando CPU’s, memoria y bloques de I/O de manera más intensa:

  • dstat --top-cpu --top-mem --top-bio




Una vez que el sistema supera la memoria fisica e inicia a utilizar el swap, el rendimiento se deteriora dramaticamente.

  • sar -r



Graphical System Monitor:


Comandos de importancia


Lista de procesos que mas consumen en Megas:

ps aux  | awk '{print $6/1024 " MB\t\t" $11}'  | sort -n



Cuantos Megas consume un proceso en memoria:


ps aux | grep gnome | awk '{sum=sum+$6}; END {print sum/1024 " MB"}'




Arbol de procesos

ps -e -o pid,args --forest