GNU/Linux >> Tutoriales Linux >  >> Linux

Linux:¿Qué puede hacer que Linux no responda durante minutos al navegar por ciertos sitios web?

Estoy usando Linux 4.15, y esto me sucede muchas veces cuando navego en Google, Facebook o cualquier otro sitio web que consume muchos recursos:todo el sistema operativo deja de responder, se congela y es inútil. Lo único que veo que funciona es el disco (partición principal del sistema formateada como ext4), que está en uso masivo (limitación de E/S).

Me veo obligado a esperar un minuto o más para deshacerme de la hinchazón, a veces no responde durante doce minutos, y por lo tanto me frustro. El hecho de que el sistema operativo no pueda manejar bien la multitarea tiende a reflejar un comportamiento absolutamente extraño e inaceptable.

Esto no solo ocurre con Firefox, sino con cualquiera aplicación de interpretación de javascript que incluye Microsoft VSCode o angular-cli (ng serve comando), así como cualquier otro subproceso de ejecución que consuma muchos recursos, como el caso de plantuml al generar un gráfico muy grande a partir de un diagrama UML muy complejo.

Hoy en día, el sistema operativo se vuelve totalmente inmanejable, después de lanzar un software de recuperación de datos para un disco duro externo (a través de una partición ext4) que se desconectó recientemente de un puerto USB defectuoso por un pequeño movimiento.

No puedo decir la causa raíz detrás de tal comportamiento defectuoso

Tengo muchas pestañas abiertas en el navegador y un 94 % de uso de la partición del sistema operativo según df salida:

Filesystem     1K-blocks      Used Available Use% Mounted on
udev             3964160         0   3964160   0% /dev
tmpfs             798164      3192    794972   1% /run
/dev/sda5      173466400 153224316  11407424  94% /
tmpfs            3990820     62936   3927884   2% /dev/shm
tmpfs               5120         4      5116   1% /run/lock
tmpfs            3990820         0   3990820   0% /sys/fs/cgroup
/dev/loop5           128       128         0 100% /snap/anbox-installer/24
/dev/loop2           128       128         0 100% /snap/anbox-installer/17
/dev/loop4        223616    223616         0 100% /snap/kde-frameworks-5/26
/dev/loop3         90624     90624         0 100% /snap/core/7169
/dev/loop7        223616    223616         0 100% /snap/kde-frameworks-5/25
/dev/loop8         90624     90624         0 100% /snap/core/7270
/dev/loop0         87552     87552         0 100% /snap/qownnotes/2160
/dev/loop1        241664    241664         0 100% /snap/kde-frameworks-5/27
tmpfs             798164         0    798164   0% /run/user/0
tmpfs             798164        32    798132   1% /run/user/1000
/dev/loop9         87552     87552         0 100% /snap/qownnotes/2176
/dev/sda3      188669948 187132488   1537460 100% /media/kais/DATA
/dev/sdb1       15142960   2091904  13051056  14% /media/kais/STORE N GO

Como hardware, estoy usando:

  1. Intel Core i3 v2348M según lscpu :

    Architecture:        x86_64
    CPU op-mode(s):      32-bit, 64-bit
    Byte Order:          Little Endian
    Address sizes:       36 bits physical, 48 bits virtual
    CPU(s):              4
    On-line CPU(s) list: 0-3
    Thread(s) per core:  2
    Core(s) per socket:  2
    Socket(s):           1
    NUMA node(s):        1
    Vendor ID:           GenuineIntel
    CPU family:          6
    Model:               42
    Model name:          Intel(R) Core(TM) i3-2348M CPU @ 2.30GHz
    Stepping:            7
    CPU MHz:             905.312
    CPU max MHz:         2300.0000
    CPU min MHz:         800.0000
    BogoMIPS:            4589.49
    Virtualization:      VT-x
    L1d cache:           32K
    L1i cache:           32K
    L2 cache:            256K
    L3 cache:            3072K
    NUMA node0 CPU(s):   0-3
    Flags:               fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm pbe syscall nx rdtscp lm constant_tsc arch_perfmon pebs bts rep_good nopl xtopology nonstop_tsc cpuid aperfmperf pni pclmulqdq dtes64 monitor ds_cpl vmx est tm2 ssse3 cx16 xtpr pdcm pcid sse4_1 sse4_2 x2apic popcnt tsc_deadline_timer xsave avx lahf_lm epb pti tpr_shadow vnmi flexpriority ept vpid xsaveopt dtherm arat pln pts
    
  2. 8 GB de RAM. (Ver htop salida a continuación).

  3. 99,83 MHz de velocidad de bus de placa base
  4. Disco duro interno de 500 GB:este es el S.M.A.R.T. informe del
    sistema operativo:

    smartctl 6.6 2017-11-05 r4594 [x86_64-linux-4.15.0-33-generic] (local build)
    Copyright (C) 2002-17, Bruce Allen, Christian Franke, www.smartmontools.org
    
    === START OF INFORMATION SECTION ===
    Model Family:     Western Digital Blue Mobile
    Device Model:     WDC WD5000LPVX-22V0TT0
    Serial Number:    WD-WXE1E13AAMR4
    LU WWN Device Id: 5 0014ee 25db04ba7
    Firmware Version: 01.01A01
    User Capacity:    500,107,862,016 bytes [500 GB]
    Sector Sizes:     512 bytes logical, 4096 bytes physical
    Rotation Rate:    5400 rpm
    Device is:        In smartctl database [for details use: -P show]
    ATA Version is:   ACS-2 (minor revision not indicated)
    SATA Version is:  SATA 3.0, 6.0 Gb/s (current: 6.0 Gb/s)
    Local Time is:    Wed Aug  7 15:52:05 2019 CET
    SMART support is: Available - device has SMART capability.
    SMART support is: Enabled
    
    === START OF READ SMART DATA SECTION ===
    SMART overall-health self-assessment test result: PASSED
    
    General SMART Values:
    Offline data collection status:  (0x00) Offline data collection activity
                        was never started.
                        Auto Offline Data Collection: Disabled.
    Self-test execution status:      (   0) The previous self-test routine completed
                        without error or no self-test has ever 
                        been run.
    Total time to complete Offline 
    data collection:        ( 8040) seconds.
    Offline data collection
    capabilities:            (0x7b) SMART execute Offline immediate.
                        Auto Offline data collection on/off support.
                        Suspend Offline collection upon new
                        command.
                        Offline surface scan supported.
                        Self-test supported.
                        Conveyance Self-test supported.
                        Selective Self-test supported.
    SMART capabilities:            (0x0003) Saves SMART data before entering
                        power-saving mode.
                        Supports SMART auto save timer.
    Error logging capability:        (0x01) Error logging supported.
                        General Purpose Logging supported.
    Short self-test routine 
    recommended polling time:    (   2) minutes.
    Extended self-test routine
    recommended polling time:    (  93) minutes.
    Conveyance self-test routine
    recommended polling time:    (   5) minutes.
    SCT capabilities:          (0x7035) SCT Status supported.
                        SCT Feature Control supported.
                        SCT Data Table supported.
    
    SMART Attributes Data Structure revision number: 16
    Vendor Specific SMART Attributes with Thresholds:
    ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
      1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       1
      3 Spin_Up_Time            0x0027   149   143   021    Pre-fail  Always       -       1541
      4 Start_Stop_Count        0x0032   057   057   000    Old_age   Always       -       43173
      5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
      7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
      9 Power_On_Hours          0x0032   083   083   000    Old_age   Always       -       12797
     10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
     11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
     12 Power_Cycle_Count       0x0032   091   091   000    Old_age   Always       -       9496
    191 G-Sense_Error_Rate      0x0032   001   001   000    Old_age   Always       -       250
    192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       399
    193 Load_Cycle_Count        0x0032   147   147   000    Old_age   Always       -       160989
    194 Temperature_Celsius     0x0022   101   092   000    Old_age   Always       -       42
    196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
    197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
    198 Offline_Uncorrectable   0x0030   100   253   000    Old_age   Offline      -       0
    199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
    200 Multi_Zone_Error_Rate   0x0008   100   253   000    Old_age   Offline      -       0
    
    SMART Error Log Version: 1
    No Errors Logged
    
    SMART Self-test log structure revision number 1
    No self-tests have been logged.  [To run self-tests, use: smartctl -t]
    
    SMART Selective self-test log data structure revision number 1
     SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
        1        0        0  Not_testing
        2        0        0  Not_testing
        3        0        0  Not_testing
        4        0        0  Not_testing
        5        0        0  Not_testing
    Selective self-test flags (0x0):
      After scanning selected spans, do NOT read-scan remainder of disk.
    If Selective self-test is pending on power-up, resume after 0 minute delay.
    

Estos son los resultados del uso de recursos por htop :

  1  [|||||                    14.1%]   Tasks: 286, 1497 thr; 2 running
  2  [|||||                    13.2%]   Load average: 3.00 4.97 6.09 
  3  [|||||                    12.5%]   Uptime: 3 days, 16:12:35
  4  [|||                       9.3%]
  Mem[|||||||||||||||||||5.09G/7.61G]
  Swp[|||||||||||||||||||3.68G/4.65G]

  PID USER      PRI  NI  VIRT   RES   SHR S CPU% MEM%   TIME+  Command
 7006 jvb        20   0 6640M  102M  6780 S  5.3  1.3 18:53.18 java -Xmx3072m -X
 8224 kais     20   0 4537M  771M  200M S  6.6  9.9  2h31:23 /usr/lib/firefox/
 2299 kais     20   0 2958M  184M 42912 S  5.3  2.4 13:54.41 /usr/lib/firefox/
 1216 root       20   0  519M  120M 94640 S  5.3  1.5  1h52:50 /usr/lib/xorg/Xor
28401 kais     20   0 3354M  584M  107M S  7.9  7.5 34:44.51 /usr/lib/firefox/
 8439 kais     20   0 4537M  771M  200M S  4.6  9.9 37:06.21 /usr/lib/firefox/
 8831 kais     20   0 3222M  351M 64828 R  4.0  4.5 11:19.87 /usr/lib/firefox/
 7025 jvb        20   0 6640M  102M  6780 S  0.0  1.3  0:18.34 java -Xmx3072m -X
 7027 jvb        20   0 6640M  102M  6780 S  0.0  1.3  0:18.05 java -Xmx3072m -X
 5901 kais     20   0  7492  5612  2904 R  4.0  0.1  0:00.66 htop
 5329 kais     20   0  547M 47456 38388 S  1.3  0.6  0:01.29 /usr/lib/gnome-te
13540 kais     20   0 2958M  184M 42912 S  2.0  2.4  0:06.25 /usr/lib/firefox/
16897 kais     20   0  904M 28292 18076 S  2.0  0.4 50:08.37 pavucontrol
17999 kais     20   0 2424M 29460 25380 S  1.3  0.4 52:41.73 /usr/bin/pulseaud
F1 Help  F2 Setup  F3 Search  F4 Filter  F5 Tree  F6 SortBy F7 Nice  -  F8 Nice  +  F9 Kill  F10 Quit

Esos son también los resultados de las estadísticas de VM, generados por el comando vmstat 5 .

AFAIK, el bloatware no debería hacer que el sistema operativo no responda, por lo que no consideraría ni aceptaría que el bloatware es la causa raíz del problema, ya que el trabajo del sistema operativo es aislar procesos y garantizar la multitarea.

Relacionado:¿Agregar más espacio en disco para Linux desde Windows en una máquina de arranque dual?

No sé si este problema es específico del sistema operativo, del hardware o de la configuración.

¿Alguna idea?

Respuesta aceptada:

¿Qué puede hacer que Linux no responda?

Sobrecomprometer la RAM disponible, lo que provoca una gran cantidad de intercambio, definitivamente puede hacer esto. Recuerde que la E/S de acceso aleatorio en su disco duro mecánico requiere mover un cabezal de lectura/escritura, que solo puede realizar alrededor de 100 búsquedas por segundo.

Es habitual que Linux salga totalmente a almorzar, si sobreasigna RAM "demasiado". También tengo un disco giratorio y 8 GB de RAM. He tenido problemas con un par de piezas de software con pérdidas de memoria. Es decir. su uso de memoria sigue creciendo con el tiempo y nunca se reduce, por lo que la única forma de controlarlo habría sido detener el software y luego reiniciarlo. Según las experiencias que tuve durante esto, no me sorprende mucho escuchar retrasos de más de diez minutos, si está generando más de 3 GB de intercambio.

Relacionado:Linux:¿usando el comando sed para una línea específica?

No necesariamente verá esto en todos los casos en los que tenga más de 3 GB de intercambio. La teoría dice que el concepto clave es paliza. Por otro lado, si está tratando de cambiar entre dos conjuntos de trabajo diferentes y requiere intercambiar 3 GB de entrada y salida, a 100 MB/s tardará al menos 60 segundos, incluso si el patrón de E/S se puede optimizar perfectamente. En la práctica, el patrón de E/S estará lejos de ser óptimo.

Después de la dificultad que tuve con esto, reformateé mi espacio de intercambio a 2 GB (varias veces más pequeño que antes), para que el sistema no pudiera intercambiar tan profundamente. Puede hacer esto incluso sin perder el tiempo cambiando el tamaño de la partición, porque mkswap toma un parámetro de tamaño opcional.

El equilibrio aproximado es entre quedarse sin memoria y que los procesos se eliminen, y que el sistema se cuelgue durante tanto tiempo que se rinda y reinicie de todos modos. No sé si una partición de intercambio de 4 GB es demasiado grande; podría depender de lo que estés haciendo. Lo importante es estar atento cuando el disco comience a funcionar, verifique el uso de la memoria y responda en consecuencia.

Verificar el uso de memoria de las aplicaciones multiproceso es difícil. Para ver el uso de memoria por proceso sin contar dos veces la memoria compartida, puede usar sudo atop -R , presione M y m y busque en la columna TAMAÑO. También puedes usar smem . smem -t -P firefox mostrará el PSS de todos sus procesos de Firefox, seguido de una línea con el PSS total. Este es el enfoque correcto para medir el uso total de la memoria de los navegadores basados ​​en Firefox o Chrome. (Aunque también hay funciones específicas del navegador para mostrar el uso de la memoria, que mostrará pestañas individuales).


Linux
  1. Linux – ¿Qué hace 'hacer Localmodconfig'?

  2. Linux:¿qué hacer cuando un escritorio Linux se congela?

  3. Linux:¿cómo saber qué hacer con Grep en Dmesg?

  4. ¿Qué hacer cuando Ctrl + C no puede matar un proceso?

  5. ¿Para qué sirve Linux test -a command test?

¿Cuál es la mejor distribución de Linux para principiantes?

¿Qué hace cuando una aplicación no está empaquetada para su distribución de Linux?

Cómo crear una carga de CPU del 100 % en un sistema Linux

¿La mejor interfaz SVN para Linux?

¿Qué hacer cuando un escritorio Linux se congela?

Linux - ¿Cómo puedo ver lo que está esperando el disco IO?