Estoy usando Linux 4.15, y esto me sucede muchas veces cuando navego en Google, Facebook o cualquier otro sitio web que consume muchos recursos:todo el sistema operativo deja de responder, se congela y es inútil. Lo único que veo que funciona es el disco (partición principal del sistema formateada como ext4), que está en uso masivo (limitación de E/S).
Me veo obligado a esperar un minuto o más para deshacerme de la hinchazón, a veces no responde durante doce minutos, y por lo tanto me frustro. El hecho de que el sistema operativo no pueda manejar bien la multitarea tiende a reflejar un comportamiento absolutamente extraño e inaceptable.
Esto no solo ocurre con Firefox, sino con cualquiera aplicación de interpretación de javascript que incluye Microsoft VSCode o angular-cli (ng serve
comando), así como cualquier otro subproceso de ejecución que consuma muchos recursos, como el caso de plantuml al generar un gráfico muy grande a partir de un diagrama UML muy complejo.
Hoy en día, el sistema operativo se vuelve totalmente inmanejable, después de lanzar un software de recuperación de datos para un disco duro externo (a través de una partición ext4) que se desconectó recientemente de un puerto USB defectuoso por un pequeño movimiento.
No puedo decir la causa raíz detrás de tal comportamiento defectuoso
Tengo muchas pestañas abiertas en el navegador y un 94 % de uso de la partición del sistema operativo según df
salida:
Filesystem 1K-blocks Used Available Use% Mounted on
udev 3964160 0 3964160 0% /dev
tmpfs 798164 3192 794972 1% /run
/dev/sda5 173466400 153224316 11407424 94% /
tmpfs 3990820 62936 3927884 2% /dev/shm
tmpfs 5120 4 5116 1% /run/lock
tmpfs 3990820 0 3990820 0% /sys/fs/cgroup
/dev/loop5 128 128 0 100% /snap/anbox-installer/24
/dev/loop2 128 128 0 100% /snap/anbox-installer/17
/dev/loop4 223616 223616 0 100% /snap/kde-frameworks-5/26
/dev/loop3 90624 90624 0 100% /snap/core/7169
/dev/loop7 223616 223616 0 100% /snap/kde-frameworks-5/25
/dev/loop8 90624 90624 0 100% /snap/core/7270
/dev/loop0 87552 87552 0 100% /snap/qownnotes/2160
/dev/loop1 241664 241664 0 100% /snap/kde-frameworks-5/27
tmpfs 798164 0 798164 0% /run/user/0
tmpfs 798164 32 798132 1% /run/user/1000
/dev/loop9 87552 87552 0 100% /snap/qownnotes/2176
/dev/sda3 188669948 187132488 1537460 100% /media/kais/DATA
/dev/sdb1 15142960 2091904 13051056 14% /media/kais/STORE N GO
Como hardware, estoy usando:
-
Intel Core i3 v2348M según
lscpu
:Architecture: x86_64 CPU op-mode(s): 32-bit, 64-bit Byte Order: Little Endian Address sizes: 36 bits physical, 48 bits virtual CPU(s): 4 On-line CPU(s) list: 0-3 Thread(s) per core: 2 Core(s) per socket: 2 Socket(s): 1 NUMA node(s): 1 Vendor ID: GenuineIntel CPU family: 6 Model: 42 Model name: Intel(R) Core(TM) i3-2348M CPU @ 2.30GHz Stepping: 7 CPU MHz: 905.312 CPU max MHz: 2300.0000 CPU min MHz: 800.0000 BogoMIPS: 4589.49 Virtualization: VT-x L1d cache: 32K L1i cache: 32K L2 cache: 256K L3 cache: 3072K NUMA node0 CPU(s): 0-3 Flags: fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm pbe syscall nx rdtscp lm constant_tsc arch_perfmon pebs bts rep_good nopl xtopology nonstop_tsc cpuid aperfmperf pni pclmulqdq dtes64 monitor ds_cpl vmx est tm2 ssse3 cx16 xtpr pdcm pcid sse4_1 sse4_2 x2apic popcnt tsc_deadline_timer xsave avx lahf_lm epb pti tpr_shadow vnmi flexpriority ept vpid xsaveopt dtherm arat pln pts
-
8 GB de RAM. (Ver
htop
salida a continuación). - 99,83 MHz de velocidad de bus de placa base
-
Disco duro interno de 500 GB:este es el S.M.A.R.T. informe del
sistema operativo:smartctl 6.6 2017-11-05 r4594 [x86_64-linux-4.15.0-33-generic] (local build) Copyright (C) 2002-17, Bruce Allen, Christian Franke, www.smartmontools.org === START OF INFORMATION SECTION === Model Family: Western Digital Blue Mobile Device Model: WDC WD5000LPVX-22V0TT0 Serial Number: WD-WXE1E13AAMR4 LU WWN Device Id: 5 0014ee 25db04ba7 Firmware Version: 01.01A01 User Capacity: 500,107,862,016 bytes [500 GB] Sector Sizes: 512 bytes logical, 4096 bytes physical Rotation Rate: 5400 rpm Device is: In smartctl database [for details use: -P show] ATA Version is: ACS-2 (minor revision not indicated) SATA Version is: SATA 3.0, 6.0 Gb/s (current: 6.0 Gb/s) Local Time is: Wed Aug 7 15:52:05 2019 CET SMART support is: Available - device has SMART capability. SMART support is: Enabled === START OF READ SMART DATA SECTION === SMART overall-health self-assessment test result: PASSED General SMART Values: Offline data collection status: (0x00) Offline data collection activity was never started. Auto Offline Data Collection: Disabled. Self-test execution status: ( 0) The previous self-test routine completed without error or no self-test has ever been run. Total time to complete Offline data collection: ( 8040) seconds. Offline data collection capabilities: (0x7b) SMART execute Offline immediate. Auto Offline data collection on/off support. Suspend Offline collection upon new command. Offline surface scan supported. Self-test supported. Conveyance Self-test supported. Selective Self-test supported. SMART capabilities: (0x0003) Saves SMART data before entering power-saving mode. Supports SMART auto save timer. Error logging capability: (0x01) Error logging supported. General Purpose Logging supported. Short self-test routine recommended polling time: ( 2) minutes. Extended self-test routine recommended polling time: ( 93) minutes. Conveyance self-test routine recommended polling time: ( 5) minutes. SCT capabilities: (0x7035) SCT Status supported. SCT Feature Control supported. SCT Data Table supported. SMART Attributes Data Structure revision number: 16 Vendor Specific SMART Attributes with Thresholds: ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x002f 200 200 051 Pre-fail Always - 1 3 Spin_Up_Time 0x0027 149 143 021 Pre-fail Always - 1541 4 Start_Stop_Count 0x0032 057 057 000 Old_age Always - 43173 5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always - 0 7 Seek_Error_Rate 0x002e 200 200 000 Old_age Always - 0 9 Power_On_Hours 0x0032 083 083 000 Old_age Always - 12797 10 Spin_Retry_Count 0x0032 100 100 000 Old_age Always - 0 11 Calibration_Retry_Count 0x0032 100 100 000 Old_age Always - 0 12 Power_Cycle_Count 0x0032 091 091 000 Old_age Always - 9496 191 G-Sense_Error_Rate 0x0032 001 001 000 Old_age Always - 250 192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age Always - 399 193 Load_Cycle_Count 0x0032 147 147 000 Old_age Always - 160989 194 Temperature_Celsius 0x0022 101 092 000 Old_age Always - 42 196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always - 0 197 Current_Pending_Sector 0x0032 200 200 000 Old_age Always - 0 198 Offline_Uncorrectable 0x0030 100 253 000 Old_age Offline - 0 199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age Always - 0 200 Multi_Zone_Error_Rate 0x0008 100 253 000 Old_age Offline - 0 SMART Error Log Version: 1 No Errors Logged SMART Self-test log structure revision number 1 No self-tests have been logged. [To run self-tests, use: smartctl -t] SMART Selective self-test log data structure revision number 1 SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS 1 0 0 Not_testing 2 0 0 Not_testing 3 0 0 Not_testing 4 0 0 Not_testing 5 0 0 Not_testing Selective self-test flags (0x0): After scanning selected spans, do NOT read-scan remainder of disk. If Selective self-test is pending on power-up, resume after 0 minute delay.
Estos son los resultados del uso de recursos por htop
:
1 [||||| 14.1%] Tasks: 286, 1497 thr; 2 running
2 [||||| 13.2%] Load average: 3.00 4.97 6.09
3 [||||| 12.5%] Uptime: 3 days, 16:12:35
4 [||| 9.3%]
Mem[|||||||||||||||||||5.09G/7.61G]
Swp[|||||||||||||||||||3.68G/4.65G]
PID USER PRI NI VIRT RES SHR S CPU% MEM% TIME+ Command
7006 jvb 20 0 6640M 102M 6780 S 5.3 1.3 18:53.18 java -Xmx3072m -X
8224 kais 20 0 4537M 771M 200M S 6.6 9.9 2h31:23 /usr/lib/firefox/
2299 kais 20 0 2958M 184M 42912 S 5.3 2.4 13:54.41 /usr/lib/firefox/
1216 root 20 0 519M 120M 94640 S 5.3 1.5 1h52:50 /usr/lib/xorg/Xor
28401 kais 20 0 3354M 584M 107M S 7.9 7.5 34:44.51 /usr/lib/firefox/
8439 kais 20 0 4537M 771M 200M S 4.6 9.9 37:06.21 /usr/lib/firefox/
8831 kais 20 0 3222M 351M 64828 R 4.0 4.5 11:19.87 /usr/lib/firefox/
7025 jvb 20 0 6640M 102M 6780 S 0.0 1.3 0:18.34 java -Xmx3072m -X
7027 jvb 20 0 6640M 102M 6780 S 0.0 1.3 0:18.05 java -Xmx3072m -X
5901 kais 20 0 7492 5612 2904 R 4.0 0.1 0:00.66 htop
5329 kais 20 0 547M 47456 38388 S 1.3 0.6 0:01.29 /usr/lib/gnome-te
13540 kais 20 0 2958M 184M 42912 S 2.0 2.4 0:06.25 /usr/lib/firefox/
16897 kais 20 0 904M 28292 18076 S 2.0 0.4 50:08.37 pavucontrol
17999 kais 20 0 2424M 29460 25380 S 1.3 0.4 52:41.73 /usr/bin/pulseaud
F1 Help F2 Setup F3 Search F4 Filter F5 Tree F6 SortBy F7 Nice - F8 Nice + F9 Kill F10 Quit
Esos son también los resultados de las estadísticas de VM, generados por el comando vmstat 5
.
AFAIK, el bloatware no debería hacer que el sistema operativo no responda, por lo que no consideraría ni aceptaría que el bloatware es la causa raíz del problema, ya que el trabajo del sistema operativo es aislar procesos y garantizar la multitarea.
Relacionado:¿Agregar más espacio en disco para Linux desde Windows en una máquina de arranque dual?No sé si este problema es específico del sistema operativo, del hardware o de la configuración.
¿Alguna idea?
Respuesta aceptada:
¿Qué puede hacer que Linux no responda?
Sobrecomprometer la RAM disponible, lo que provoca una gran cantidad de intercambio, definitivamente puede hacer esto. Recuerde que la E/S de acceso aleatorio en su disco duro mecánico requiere mover un cabezal de lectura/escritura, que solo puede realizar alrededor de 100 búsquedas por segundo.
Es habitual que Linux salga totalmente a almorzar, si sobreasigna RAM "demasiado". También tengo un disco giratorio y 8 GB de RAM. He tenido problemas con un par de piezas de software con pérdidas de memoria. Es decir. su uso de memoria sigue creciendo con el tiempo y nunca se reduce, por lo que la única forma de controlarlo habría sido detener el software y luego reiniciarlo. Según las experiencias que tuve durante esto, no me sorprende mucho escuchar retrasos de más de diez minutos, si está generando más de 3 GB de intercambio.
Relacionado:Linux:¿usando el comando sed para una línea específica?No necesariamente verá esto en todos los casos en los que tenga más de 3 GB de intercambio. La teoría dice que el concepto clave es paliza. Por otro lado, si está tratando de cambiar entre dos conjuntos de trabajo diferentes y requiere intercambiar 3 GB de entrada y salida, a 100 MB/s tardará al menos 60 segundos, incluso si el patrón de E/S se puede optimizar perfectamente. En la práctica, el patrón de E/S estará lejos de ser óptimo.
Después de la dificultad que tuve con esto, reformateé mi espacio de intercambio a 2 GB (varias veces más pequeño que antes), para que el sistema no pudiera intercambiar tan profundamente. Puede hacer esto incluso sin perder el tiempo cambiando el tamaño de la partición, porque mkswap
toma un parámetro de tamaño opcional.
El equilibrio aproximado es entre quedarse sin memoria y que los procesos se eliminen, y que el sistema se cuelgue durante tanto tiempo que se rinda y reinicie de todos modos. No sé si una partición de intercambio de 4 GB es demasiado grande; podría depender de lo que estés haciendo. Lo importante es estar atento cuando el disco comience a funcionar, verifique el uso de la memoria y responda en consecuencia.
Verificar el uso de memoria de las aplicaciones multiproceso es difícil. Para ver el uso de memoria por proceso sin contar dos veces la memoria compartida, puede usar sudo atop -R
, presione M y m y busque en la columna TAMAÑO. También puedes usar smem
. smem -t -P firefox
mostrará el PSS de todos sus procesos de Firefox, seguido de una línea con el PSS total. Este es el enfoque correcto para medir el uso total de la memoria de los navegadores basados en Firefox o Chrome. (Aunque también hay funciones específicas del navegador para mostrar el uso de la memoria, que mostrará pestañas individuales).