El sistema Ubuntu 20.04 se congela [drm: intel_pipe_update_end [i915]] * ERROR * Fallo de actualización atómica en la tubería A

Dec 18 2020

Mi sistema Ubuntu 20.04 se ha visto afectado por congelamientos ocasionales (~ cada 1-2 días) que bloquean por completo cualquier interacción (ni siquiera REISUB funciona) y requiere presionar el botón de encendido para reiniciar la computadora. Esta es una nueva instalación en un portátil MSI GF65 Thin 10SER. Ya he investigado un poco y este parece ser un problema antiguo (https://linuxreviews.org/Linux_Kernel_5.5_Will_Not_Fix_The_Frequent_Intel_GPU_Hangs_In_Recent_Kernels, https://www.dedoimedo.com/computers/intel-microcode-atomic-update.html, https://hobo.house/2018/05/18/fix-for-intel-i915-gpu-freeze-on-recent-linux-kernels/) relacionado con Intel iGPU.

Mi dmesgestá lleno de líneas como las de abajo e inevitablemente hacen que el sistema se congele .

[drm:intel_pipe_update_end [i915]] *ERROR* Atomic update failure on pipe A (start=9338 end=9339) time 321 us, min 1063, max 1079, scanline start 1038, end 1090

$ uname -r

5.4.0-58-generic

$ lspci -k | grep -EA3 'VGA|3D|Display':

00:02.0 VGA compatible controller: Intel Corporation UHD Graphics (rev 05)
    DeviceName: Onboard - Video
    Subsystem: Micro-Star International Co., Ltd. [MSI] Device 12aa
    Kernel driver in use: i915
--
01:00.0 VGA compatible controller: NVIDIA Corporation TU106 [GeForce RTX 2060] (rev a1)
    Subsystem: Micro-Star International Co., Ltd. [MSI] Device 12aa
    Kernel driver in use: nvidia
    Kernel modules: nvidiafb, nouveau, nvidia_drm, nvidia

He probado lo siguiente:

  • Agregue las opciones del kernel i915.enable_psr=0,i915.enable_dc=0

  • Habilite los primeros KMS para el controlador de gráficos Intel (agregue i915 a / etc / initramfs-tools / modules)

  • Habilite GuC con i915.enable_guc=2, sin embargo, no funciona como $ sudo cat /sys/kernel/debug/dri/0/i915_guc_load_status | grep status:devolucionesstatus: DISABLED

  • Cambie el controlador de pantalla X.Org a modeset en lugar de xserver-xorg-video-intel

  • Actualice el kernel de linux a 5.8

  • Agregue lo siguiente a /usr/share/X11/xorg.conf.d/10-intel.conf

      Section "Device"
        Identifier "Intel Graphics"
        Driver "intel"
        Option "NoAccel" "True"
        Option "DRI" "False"
      EndSection
    

Una observación es que cuando cambio el perfil principal al modo de rendimiento (es decir, solo se usa la gpu de nvidia y la de intel no) no obtengo ninguno de estos errores en dmesg. Sin embargo, esta no es una solución para mí, ya que esta opción agota mi batería muy rápidamente.

Soy un nuevo usuario de Ubuntu y agradecería mucho si alguien pudiera echar una mano o simplemente proporcionar una solución para que pueda tener un sistema estable sin fallas. Hazme saber si necesitas cualquier información adicional. ¡Gracias por adelantado!

Actualización 20/12/2020:

La configuración GRUB_CMDLINE_LINUX="nouveau.modeset=0"de / etc / default / grub detuvo los dmesgerrores de falla de actualización atómica. Sin embargo, ahora glxinfo|egrep "OpenGL renderer"da en OpenGL renderer string: llvmpipe (LLVM 10.0.0, 256 bits)lugar de OpenGL renderer string: Mesa Intel(R) UHD Graphics (CML GT2). Esto es un problema porque ahora obtengo un uso extremadamente alto de la CPU de gnome-shell. Realmente no sé qué sacar de esta información.

Se agradecería mucho la ayuda.

Mientras tanto, restauré la configuración de grub y realicé algunos otros cambios. $ inxi -G

Graphics:  Device-1: Intel UHD Graphics driver: i915 v: kernel 
           Device-2: NVIDIA TU106 [GeForce RTX 2060] driver: nvidia v: 450.80.02 
           Display: x11 server: X.Org 1.20.8 driver: modesetting,nvidia 
           resolution: 1920x1080~144Hz 
           OpenGL: renderer: Mesa Intel UHD Graphics (CML GT2) v: 4.6 Mesa 20.0.8

Actualización 21/12/2020:

Ok, he estado ejecutando mi sistema con el perfil de rendimiento de Nvidia Prime activado (creo que esto significa que la iGPU no se está usando, solo la dGPU - nvidia - sí) y acabo de congelarme mientras escuchaba Spotify (lo que sucede con también será una de las razones por las que mi computadora se ha congelado en el pasado), sin embargo, esta vez no registré ningún error de actualización de Atomic en esta sesión y journalctl -b -1 -eno registré nada relevante (al menos para mí). Seguiré la respuesta a esta pregunta. ¿Cómo puedo saber por qué 20.04 se bloquea? y luego actualizaré el tema. Avíseme si hay algún resultado / información que necesite para comprender mejor el problema.

Actualización 23/12/2020:

Realicé una prueba de memoria de https://www.memtest86.com/ y obtuve 0 errores (resultados a continuación):

También hice una instalación limpia de Ubuntu, Mint y Manjaro. Cada uno de ellos mostraría el error de actualización atómica en formato dmesg. Envié la computadora portátil al servicio de reparación porque creo que el problema se debe a un mal funcionamiento del hardware.

Respuestas

DavidS. Jan 28 2021 at 19:19

Así que la computadora portátil salió de RMA y me dijeron que no tenía nada de malo. Desafortunadamente, tuve que cambiarme a Windows porque no puedo permitirme tener un sistema inestable como el que describí anteriormente. En el futuro, puedo intentar instalar una versión más nueva de Ubuntu para comprobar si el problema persiste.