Система Ubuntu 20.04 зависает [drm: intel_pipe_update_end [i915]] * ОШИБКА * Ошибка атомарного обновления на конвейере A

Dec 18 2020

Моя система Ubuntu 20.04 периодически зависает (~ каждые 1-2 дня), что полностью блокирует любое взаимодействие (даже REISUB не работает) и требует нажатия кнопки питания для перезагрузки компьютера. Это новенькая установка на ноутбук MSI GF65 Thin 10SER. Я уже провел некоторое исследование, и это, похоже, старая проблема (https://linuxreviews.org/Linux_Kernel_5.5_Will_Not_Fix_The_Frequent_Intel_GPU_Hangs_In_Recent_Kernels, https://www.dedoimedo.com/computers/intel-microcode-atomic-update.html, https://hobo.house/2018/05/18/fix-for-intel-i915-gpu-freeze-on-recent-linux-kernels/), относящиеся к Intel iGPU.

Моя dmesgполна строк, подобных приведенным ниже, и они неизбежно приводят к зависанию системы .

[drm:intel_pipe_update_end [i915]] *ERROR* Atomic update failure on pipe A (start=9338 end=9339) time 321 us, min 1063, max 1079, scanline start 1038, end 1090

$ uname -r

5.4.0-58-generic

$ lspci -k | grep -EA3 'VGA|3D|Display':

00:02.0 VGA compatible controller: Intel Corporation UHD Graphics (rev 05)
    DeviceName: Onboard - Video
    Subsystem: Micro-Star International Co., Ltd. [MSI] Device 12aa
    Kernel driver in use: i915
--
01:00.0 VGA compatible controller: NVIDIA Corporation TU106 [GeForce RTX 2060] (rev a1)
    Subsystem: Micro-Star International Co., Ltd. [MSI] Device 12aa
    Kernel driver in use: nvidia
    Kernel modules: nvidiafb, nouveau, nvidia_drm, nvidia

Я пробовал следующее:

  • Добавьте параметры ядра i915.enable_psr=0,i915.enable_dc=0

  • Включите ранний KMS для графического драйвера Intel (добавьте i915 в / etc / initramfs-tools / modules)

  • Включите GuC с помощью i915.enable_guc=2, однако он не работает как $ sudo cat /sys/kernel/debug/dri/0/i915_guc_load_status | grep status:возвратstatus: DISABLED

  • Измените драйвер дисплея X.Org на modeset вместо xserver-xorg-video-intel

  • Обновите ядро ​​linux до версии 5.8

  • Добавьте следующее в /usr/share/X11/xorg.conf.d/10-intel.conf

      Section "Device"
        Identifier "Intel Graphics"
        Driver "intel"
        Option "NoAccel" "True"
        Option "DRI" "False"
      EndSection
    

Одно наблюдение заключается в том, что когда я меняю профиль Prime на режим производительности (т. Е. Используется только графический процессор nvidia, а Intel - нет), я не получаю ни одной из этих ошибок в dmesg. Однако это не решение для меня, так как эта опция очень быстро разряжает мою батарею.

Я новый пользователь Ubuntu, и я был бы очень признателен, если бы кто-нибудь мог помочь или просто предоставил обходной путь, чтобы у меня была стабильная система без сбоев. Сообщите мне, если вам понадобится дополнительная информация. Заранее спасибо!

Обновление 20/12/2020:

Установка GRUB_CMDLINE_LINUX="nouveau.modeset=0"в / etc / default / grub остановила dmesgошибки атомарного обновления. Однако теперь glxinfo|egrep "OpenGL renderer"дает OpenGL renderer string: llvmpipe (LLVM 10.0.0, 256 bits)вместо OpenGL renderer string: Mesa Intel(R) UHD Graphics (CML GT2). Это проблема, потому что теперь у меня очень высокая загрузка ЦП из-за gnome-shell. Я действительно не знаю, что вынести из этой информации.

Помощь будет очень признательна.

Тем временем я восстановил конфигурацию grub и внес некоторые другие изменения. $ inxi -G

Graphics:  Device-1: Intel UHD Graphics driver: i915 v: kernel 
           Device-2: NVIDIA TU106 [GeForce RTX 2060] driver: nvidia v: 450.80.02 
           Display: x11 server: X.Org 1.20.8 driver: modesetting,nvidia 
           resolution: 1920x1080~144Hz 
           OpenGL: renderer: Mesa Intel UHD Graphics (CML GT2) v: 4.6 Mesa 20.0.8

Обновление 21/12/2020:

Хорошо, я запустил свою систему с включенным профилем производительности Nvidia Prime (я думаю, это означает, что iGPU не используется, а есть только dGPU - nvidia), и я просто завис во время прослушивания Spotify (что случается с также является одной из причин, по которой мой компьютер зависал в прошлом), однако на этот раз я не зарегистрировал никаких ошибок атомарного обновления в этом сеансе и journalctl -b -1 -eне зарегистрировал ничего значимого (по крайней мере, для меня). Я буду следить за ответом на этот вопрос. Как узнать, почему 20.04 вылетает? а потом обновлю тему. Сообщите мне, есть ли какие-либо выводы / информация, которые вам нужны, чтобы лучше понять проблему.

Обновление 23/12/2020:

Я выполнил мемтест из https://www.memtest86.com/ и получено 0 ошибок (результаты ниже):

Я также произвел чистую установку Ubuntu, Mint и Manjaro. Каждый из них будет показывать ошибку обновления Atomic в dmesg. Я отправил ноутбук в ремонт, так как считаю, что проблема связана с аппаратной неисправностью.

Ответы

DavidS. Jan 28 2021 at 19:19

Ноутбук вышел из RMA, и мне сказали, что с ним все в порядке. К сожалению, мне пришлось переключиться на Windows, поскольку я не могу позволить себе нестабильную систему, как я описал выше. В будущем я могу попытаться установить более новую версию Ubuntu, чтобы проверить, сохраняется ли проблема.