Намертво зависает Ubuntu (длительная проблема)
Привет, в произвольный момент времени намертво зависает Ubuntu.
При зависании система не реагирует ни на какие нажатия, помогает только Alt+SysRq+REISUB.
Зависание может произойти в любой момент даже при работе 2-3 вкладов в Chrome и текстового редактора Gedit — не могу связать проблему с нагрузкой на ЦП, ОЗУ.
Раньше думал, что проблема возможно связана с использованием SWAP (использую шифрование вместе с домашним каталогом), но нет — сейчас 12 гб ОЗУ и зависание произошло при отсутствии использования SWAP.
Проблема наблюдается длительное время — неоднократно обновлял пакеты (включаю MESA, видеодрайверы и т.д.), саму операционную систему.
System Hardware: Processor: Intel Core i3-6006U @ 2.00GHz (4 Cores), Motherboard: Dell 0GGV1M, Chipset: Intel Xeon E3-1200 v5/E3-1500, Memory: 12288MB, Disk: 256GB SK hynix SC311 S + 1000GB Elements SE 25FE, Graphics: Intel Skylake GT2 [HD 520] 2048MB, Audio: Realtek ALC3246, Network: Realtek RTL810xE PCI Fast + Qualcomm Atheros QCA9377 802.11ac Wireless Software: OS: Ubuntu 20.04, Kernel: 5.4.0-131-generic (x86_64), Desktop: GNOME Shell 3.36.9, OpenGL: 4.6 Mesa 22.2.2- kisak-mesa PPA, File-System: ext4 (ecryptfs), Screen Resolution: 1920x1080
Перемещено hobbit из general
-- Logs begin at Mon 2023-05-15 11:22:02 MSK, end at Mon 2023-05-15 11:43:09 MSK. -- мая 15 11:22:02 nikolay-Inspiron-5570 kernel: ACPI Error: No pointer back to namespace node in package 00000000c42902a0 (20190816/dsargs-301) мая 15 11:22:02 nikolay-Inspiron-5570 kernel: ACPI Error: No pointer back to namespace node in package 0000000007a01e2d (20190816/dsargs-301) мая 15 11:22:02 nikolay-Inspiron-5570 kernel: ACPI Error: No pointer back to namespace node in package 00000000fe885b98 (20190816/dsargs-301) мая 15 11:22:02 nikolay-Inspiron-5570 kernel: ACPI Error: No pointer back to namespace node in package 00000000c42902a0 (20190816/dsargs-301) мая 15 11:22:02 nikolay-Inspiron-5570 kernel: ACPI Error: No pointer back to namespace node in package 0000000007a01e2d (20190816/dsargs-301) мая 15 11:22:02 nikolay-Inspiron-5570 kernel: ACPI Error: No pointer back to namespace node in package 00000000fe885b98 (20190816/dsargs-301) мая 15 11:22:02 nikolay-Inspiron-5570 kernel: ACPI Error: No pointer back to namespace node in package 00000000c42902a0 (20190816/dsargs-301) мая 15 11:22:02 nikolay-Inspiron-5570 kernel: ACPI Error: No pointer back to namespace node in package 0000000007a01e2d (20190816/dsargs-301) мая 15 11:22:02 nikolay-Inspiron-5570 kernel: ACPI Error: No pointer back to namespace node in package 00000000fe885b98 (20190816/dsargs-301) мая 15 11:22:02 nikolay-Inspiron-5570 kernel: ACPI Error: No pointer back to namespace node in package 00000000c42902a0 (20190816/dsargs-301) мая 15 11:22:02 nikolay-Inspiron-5570 kernel: ACPI Error: No pointer back to namespace node in package 0000000007a01e2d (20190816/dsargs-301) мая 15 11:22:02 nikolay-Inspiron-5570 kernel: ACPI Error: No pointer back to namespace node in package 00000000fe885b98 (20190816/dsargs-301) мая 15 11:22:02 nikolay-Inspiron-5570 kernel: ACPI Error: No pointer back to namespace node in package 00000000c42902a0 (20190816/dsargs-301) мая 15 11:22:02 nikolay-Inspiron-5570 kernel: ACPI Error: No pointer back to namespace node in package 0000000007a01e2d (20190816/dsargs-301) мая 15 11:22:02 nikolay-Inspiron-5570 kernel: ACPI Error: No pointer back to namespace node in package 00000000fe885b98 (20190816/dsargs-301) мая 15 11:22:02 nikolay-Inspiron-5570 kernel: ACPI Error: No pointer back to namespace node in package 00000000c42902a0 (20190816/dsargs-301) мая 15 11:22:02 nikolay-Inspiron-5570 kernel: ACPI Error: No pointer back to namespace node in package 0000000007a01e2d (20190816/dsargs-301) мая 15 11:22:02 nikolay-Inspiron-5570 kernel: ACPI Error: No pointer back to namespace node in package 00000000fe885b98 (20190816/dsargs-301) мая 15 11:22:02 nikolay-Inspiron-5570 kernel: ACPI Error: No pointer back to namespace node in package 00000000c42902a0 (20190816/dsargs-301) мая 15 11:22:02 nikolay-Inspiron-5570 kernel: ACPI Error: No pointer back to namespace node in package 0000000007a01e2d (20190816/dsargs-301) мая 15 11:22:02 nikolay-Inspiron-5570 kernel: ACPI Error: No pointer back to namespace node in package 00000000fe885b98 (20190816/dsargs-301) мая 15 11:22:02 nikolay-Inspiron-5570 kernel: ACPI Error: No pointer back to namespace node in package 00000000c42902a0 (20190816/dsargs-301) мая 15 11:22:02 nikolay-Inspiron-5570 kernel: ACPI Error: No pointer back to namespace node in package 0000000007a01e2d (20190816/dsargs-301) мая 15 11:22:02 nikolay-Inspiron-5570 kernel: ACPI Error: No pointer back to namespace node in package 00000000fe885b98 (20190816/dsargs-301) мая 15 11:22:02 nikolay-Inspiron-5570 kernel: sd 3:0:0:0: [sdb] No Caching mode page found мая 15 11:22:02 nikolay-Inspiron-5570 kernel: sd 3:0:0:0: [sdb] Assuming drive cache: write through мая 15 11:22:02 nikolay-Inspiron-5570 kernel: scsi 3:0:0:1: Wrong diagnostic page; asked for 1 got 8 мая 15 11:22:02 nikolay-Inspiron-5570 kernel: scsi 3:0:0:1: Failed to get diagnostic page 0x1 мая 15 11:22:02 nikolay-Inspiron-5570 kernel: scsi 3:0:0:1: Failed to bind enclosure -19 мая 15 11:22:02 nikolay-Inspiron-5570 systemd-sysv-generator[443]: [/etc/init.d/cprocsp:4] PID file not absolute. Ignoring. мая 15 11:22:04 nikolay-Inspiron-5570 kernel: ACPI Error: No pointer back to namespace node in package 00000000c42902a0 (20190816/dsargs-301) мая 15 11:22:04 nikolay-Inspiron-5570 kernel: ACPI Error: Aborting method \_SB.PCI0.B0D4.PPCC due to previous error (AE_AML_INTERNAL) (20190816/psparse-529) мая 15 11:22:11 nikolay-Inspiron-5570 libvirtd[1519]: cannot open directory '/media/nikolay/ElementsLinux/KVM': Нет такого файла или каталога мая 15 11:22:11 nikolay-Inspiron-5570 libvirtd[1519]: internal error: Failed to autostart storage pool 'pool': cannot open directory '/media/nikolay/ElementsLinux/KVM': Нет> мая 15 11:22:11 nikolay-Inspiron-5570 libvirtd[1519]: cannot open directory '/media/nikolay/ElementsLinux/Virtual Machines': Нет такого файла или каталога мая 15 11:22:11 nikolay-Inspiron-5570 libvirtd[1519]: internal error: Failed to autostart storage pool 'iso': cannot open directory '/media/nikolay/ElementsLinux/Virtual Ma> мая 15 11:22:17 nikolay-Inspiron-5570 systemd[1]: Failed to start Postfix Mail Transport Agent (instance -). мая 15 11:22:26 nikolay-Inspiron-5570 gdm-password][2724]: gkr-pam: unable to locate daemon control file
dmesg очень много, всё выложить или что-то конкретно ?
Куча acpi ошибок. Тут пишут что может помочь апдейт биоса, но советовать такие критичные вещи я не хочу. 50/50 что может пойти не так при апгрейде и можно в лучшем случае потерять очень много времени
для начала я бы убрал все из автозагрузки и попробовал поработать на чистой машине с дефолтной системой. Кто знает что там у тебя было добавлено/удалено для qemu
У меня была подобная фигня, но оказалось, что это было не зависание, а kernel panic, вызванный драйвером Wi-Fi.
Попробуй воспроизвести зависание в то время как у тебя активна текстовая консоль (без иксов которая), там высвечивается сообщение.
А вообще должны быть какие-то способы поймать сообщение о kernel panic наверное, но я их не знаю. Разве что, у тебя есть RS-232 порт или UART?
Проблема не в QEMU, зависания были до установки каких-либо виртуальных машин.
тогда вопрос работала ли система с другими дистрибутивами или после сразу установки без зависаний или всегда было так? Твою машину никто не знает, а обычный админ всегда копает методом исключений
И автозагрузка тоже здесь ни причём, потому что проблема была и при почти чистой системе. Проблема была с первого запуска нового ноута — с 2018 года. Другие дистрибутивы не использовал.
TheDeckardCain ( 15.05.23 12:25:26 MSK )
Последнее исправление: TheDeckardCain 15.05.23 12:25:47 MSK (всего исправлений: 1)
omg так с этого и надо было начинать. Надо накатить чистую систему и оттуда начинать искать решение проблемы. Для начала посмотреть какие ошибки на дефолтной системе
Я бы поставил еще ко всему прочему совершенно отличный дистрибутив от того, что у тебя сейчас и посмотрел бы есть ли там такая ошибка .
У меня были проблемы с оборудованием на 20.04. Помогло установить HWE ядро. Прошло успешно. По-моему, комманда такая:
apt install --install-recommends linux-generic-hwe-20.04
При этом у меня инсталлировался 5.15.
Ну и, как здесь пишут, осторожненько БИОС проапгрейдить, если ещё не. Иногда помогает просто в дефолт сбросить.
Как вариант — возможно засыхание термо-пасты на процессоре и перегрев.
Если с температурой все в порядке — возможны зависания при простое процессора (включение алгоритмов энергосбережения). У меня было такое на служебном ноуте HP с i5. Самопроизвольные фризы начались после добавления памяти. Причем никакие тесты памяти не выявляли проблему.
Помогло только отключение энергосбережения на процессоре intel_idle.max_cstate=0 . Последующие эксперименты показали, что при cstate=0,1,2 зависаний не было. При отсутствии опции или установке 3 и более — случайные зависания (при этом на проце и памяти снижается напряжения и память видимо не держит). Ну и затем удалось память подобрать, которая нормально работает на низком напряжении проца.
https://wiki.bu.ost.ch/infoportal/_media/embedded_systems/ethercat/controlling_processor_c-state_usage_in_linux_v1.1_nov2013.pdf
sigurd ★★★★★ ( 15.05.23 13:34:59 MSK )
Последнее исправление: sigurd 15.05.23 13:41:38 MSK (всего исправлений: 3)
Проблема была с первого запуска нового ноута — с 2018 года. Другие дистрибутивы не использовал.
Вот это бы добавить в шапку темы.
Причем первая часть коммента важнее и в принципе указывает на особенности железа ноута.
А вторая — как бы толкает нас проверить с другими дистрами, но боюсь будет та же проблема.
Если железо, то что конкретно ?
Ну вон, в комментах рассказывают похожее про свое железо.
Может биос давно не обновлялся, может зависает только под линукс, а вот в windows нет проблем…
Главное, что проблема сразу показала с новья, и как то меньше всего думаешь на софт.
Я, конечно, не специалист, но вроде EFI передаёт управление ОС и дальше никак не участвует в работе системы. Как тогда его обновление может повлиять на работу в ОС ?
Как локализовать проблему ? Воспроизвести зависание невозможно, потому что нет точного определения причины.
Оно какое-то кривое, у меня память течет, когда включаю rtsp поток с камеры.
При этом рядом комп, там прошлый выпуск, ядро 4.15.0-20 и всё нормально.
crutch_master ★★★★★ ( 15.05.23 14:40:23 MSK )
Последнее исправление: crutch_master 15.05.23 14:41:29 MSK (всего исправлений: 1)