System Ubuntu 20.04 zawiesza się [drm: intel_pipe_update_end [i915]] * BŁĄD * Błąd aktualizacji Atomic na potoku A

Dec 18 2020

Mój system Ubuntu 20.04 był narażony na sporadyczne zawieszanie się (~ co 1-2 dni), które całkowicie blokowało jakąkolwiek interakcję (nawet REISUB nie działa) i wymaga naciśnięcia przycisku zasilania w celu ponownego uruchomienia komputera. To jest zupełnie nowa instalacja na laptopie MSI GF65 Thin 10SER. Zrobiłem już pewne badania i wydaje się, że to stary problem (https://linuxreviews.org/Linux_Kernel_5.5_Will_Not_Fix_The_Frequent_Intel_GPU_Hangs_In_Recent_Kernels, https://www.dedoimedo.com/computers/intel-microcode-atomic-update.html, https://hobo.house/2018/05/18/fix-for-intel-i915-gpu-freeze-on-recent-linux-kernels/) związane z Intel iGPU.

Mój dmesgjest pełen linii, takich jak te poniżej, które nieuchronnie powodują zawieszenie systemu .

[drm:intel_pipe_update_end [i915]] *ERROR* Atomic update failure on pipe A (start=9338 end=9339) time 321 us, min 1063, max 1079, scanline start 1038, end 1090

$ uname -r

5.4.0-58-generic

$ lspci -k | grep -EA3 'VGA|3D|Display':

00:02.0 VGA compatible controller: Intel Corporation UHD Graphics (rev 05)
    DeviceName: Onboard - Video
    Subsystem: Micro-Star International Co., Ltd. [MSI] Device 12aa
    Kernel driver in use: i915
--
01:00.0 VGA compatible controller: NVIDIA Corporation TU106 [GeForce RTX 2060] (rev a1)
    Subsystem: Micro-Star International Co., Ltd. [MSI] Device 12aa
    Kernel driver in use: nvidia
    Kernel modules: nvidiafb, nouveau, nvidia_drm, nvidia

Próbowałem następujących rzeczy:

  • Dodaj opcje jądra i915.enable_psr=0,i915.enable_dc=0

  • Włącz wczesne KMS dla sterownika grafiki Intel (dodaj i915 do / etc / initramfs-tools / modules)

  • Włącz GuC z i915.enable_guc=2, jednak nie działa jako $ sudo cat /sys/kernel/debug/dri/0/i915_guc_load_status | grep status:zwrotystatus: DISABLED

  • Zmień sterownik ekranu X.Org na tryby zamiast xserver-xorg-video-intel

  • Zaktualizuj jądro Linuksa do wersji 5.8

  • Dodaj następujący kod do /usr/share/X11/xorg.conf.d/10-intel.conf

      Section "Device"
        Identifier "Intel Graphics"
        Driver "intel"
        Option "NoAccel" "True"
        Option "DRI" "False"
      EndSection
    

Jedna obserwacja jest taka, że ​​kiedy zmieniam profil Prime na tryb wydajności (tj. Używany jest tylko procesor graficzny nvidia, a Intel nie), nie otrzymuję żadnego z tych błędów w dmesg. Jednak nie jest to dla mnie rozwiązanie, ponieważ ta opcja bardzo szybko wyczerpuje moją baterię.

Jestem nowym użytkownikiem Ubuntu i byłbym naprawdę wdzięczny, gdyby ktoś mógł pomóc lub po prostu zapewnić obejście, dzięki czemu będę mógł mieć stabilny system bez awarii. Daj mi znać, jeśli potrzebujesz dodatkowych informacji. Z góry dziękuję!

Aktualizacja 20.12.2020:

Ustawienie GRUB_CMDLINE_LINUX="nouveau.modeset=0"na / etc / default / grub zatrzymało dmesgbłędy związane z niepowodzeniem aktualizacji atomowej. Jednak teraz glxinfo|egrep "OpenGL renderer"daje OpenGL renderer string: llvmpipe (LLVM 10.0.0, 256 bits)zamiast OpenGL renderer string: Mesa Intel(R) UHD Graphics (CML GT2). To jest problem, ponieważ teraz uzyskuję bardzo wysokie użycie procesora gnome-shell. Naprawdę nie wiem, co wyciągnąć z tych informacji.

Pomoc będzie bardzo mile widziane.

W międzyczasie przywróciłem konfigurację GRUBA i wprowadziłem kilka innych zmian. $ inxi -G

Graphics:  Device-1: Intel UHD Graphics driver: i915 v: kernel 
           Device-2: NVIDIA TU106 [GeForce RTX 2060] driver: nvidia v: 450.80.02 
           Display: x11 server: X.Org 1.20.8 driver: modesetting,nvidia 
           resolution: 1920x1080~144Hz 
           OpenGL: renderer: Mesa Intel UHD Graphics (CML GT2) v: 4.6 Mesa 20.0.8

Aktualizacja z 21.12.2020:

Ok, więc uruchomiłem system z włączonym profilem wydajności Nvidia Prime (myślę, że oznacza to, że iGPU nie jest używany, tylko dGPU - nvidia - jest) i właśnie zawiesiłem się podczas słuchania Spotify (co zdarza się być również jednym z powodów, dla których mój komputer zawiesił się w przeszłości), jednak tym razem nie zarejestrowałem żadnego błędu aktualizacji Atomic w tej sesji i journalctl -b -1 -enie zarejestrowałem niczego istotnego (przynajmniej dla mnie). Podążę za odpowiedzią na to pytanie. Jak mogę stwierdzić, dlaczego 20.04 się zawiesza? a potem zaktualizuję temat. Daj mi znać, jeśli są jakieś dane wyjściowe / informacje, których potrzebujesz, aby lepiej zrozumieć problem.

Aktualizacja 23.12.2020:

Wykonałem memtest z https://www.memtest86.com/ i otrzymałem 0 błędów (wyniki poniżej):

Zrobiłem również czystą instalację Ubuntu, Mint i Manjaro. Każdy z nich pokazywałby błąd aktualizacji Atomic w formacie dmesg. Laptopa wysłałem do naprawy, bo uważam, że przyczyną problemu jest awaria sprzętu.

Odpowiedzi

DavidS. Jan 28 2021 at 19:19

Więc laptop wyszedł z RMA i powiedzieli mi, że nie ma w nim nic złego. Niestety musiałem przejść na Windows, ponieważ nie mogę sobie pozwolić na niestabilny system, jak opisałem powyżej. W przyszłości mogę spróbować zainstalować nowszą wersję Ubuntu, aby sprawdzić, czy problem będzie się powtarzał.