Bug 31975

Summary: Не запускается ноутбук с ядром 4.5.1
Product: Sisyphus Reporter: Антон Мидюков <antohami>
Component: kernel-image-un-defAssignee: Vitaly Chikunov <vt>
Status: CLOSED FIXED QA Contact: qa-sisyphus
Severity: blocker    
Priority: P3 CC: adamgrayling, evg, kernelbot, lakostis, lex.shen, placeholder, ruslandh, vt
Version: unstable   
Hardware: all   
OS: Linux   
URL: https://bugzilla.kernel.org/show_bug.cgi?id=114201

Description Антон Мидюков 2016-04-14 16:57:13 MSK
Весь журнал сеанса забит сообщениями вида:
апр 14 20:32:27 antoha kernel: ACPI Error: No handler or method for GPE 11, disabling event (20160108/evgpe-790)
апр 14 20:32:27 antoha systemd-journald[1523]: Missed 41 kernel messages
апр 14 20:32:27 antoha kernel: ACPI Error: No handler or method for GPE 14, disabling event (20160108/evgpe-790)
апр 14 20:32:27 antoha systemd-journald[1523]: Missed 65 kernel messages
апр 14 20:32:27 antoha kernel: ACPI Error: No handler or method for GPE 01, disabling event (20160108/evgpe-790)
апр 14 20:32:27 antoha systemd-journald[1523]: Missed 45 kernel messages
апр 14 20:32:27 antoha kernel: ACPI Error: No handler or method for GPE 0B, disabling event (20160108/evgpe-790)
апр 14 20:32:27 antoha systemd-journald[1523]: Missed 64 kernel messages
апр 14 20:32:27 antoha kernel: ACPI Error: No handler or method for GPE 13, disabling event (20160108/evgpe-790)
апр 14 20:32:27 antoha systemd-journald[1523]: Missed 69 kernel messages
апр 14 20:32:27 antoha kernel: ACPI Error: No handler or method for GPE 0A, disabling event (20160108/evgpe-790)
апр 14 20:32:27 antoha systemd-journald[1523]: Missed 40 kernel messages
апр 14 20:32:27 antoha kernel: ACPI Error: No handler or method for GPE 0C, disabling event (20160108/evgpe-790)
апр 14 20:32:27 antoha systemd-journald[1523]: Missed 63 kernel messages
апр 14 20:32:27 antoha kernel: ACPI Error: No handler or method for GPE 11, disabling event (20160108/evgpe-790)
апр 14 20:32:27 antoha systemd-journald[1523]: Missed 49 kernel messages
апр 14 20:32:27 antoha kernel: ACPI Error: No handler or method for GPE 17, disabling event (20160108/evgpe-790)
апр 14 20:32:27 antoha systemd-journald[1523]: Missed 68 kernel messages
апр 14 20:32:27 antoha kernel: ACPI Error: No handler or method for GPE 0D, disabling event (20160108/evgpe-790)
апр 14 20:32:27 antoha systemd-journald[1523]: Missed 71 kernel messages
апр 14 20:32:27 antoha kernel: ACPI Error: No handler or method for GPE 06, disabling event (20160108/evgpe-790)
апр 14 20:32:27 antoha systemd-journald[1523]: Missed 41 kernel messages
апр 14 20:32:27 antoha kernel: ACPI Error: No handler or method for GPE 0A, disabling event (20160108/evgpe-790)
апр 14 20:32:27 antoha systemd-journald[1523]: Missed 81 kernel messages
апр 14 20:32:27 antoha kernel: ACPI Error: No handler or method for GPE 11, disabling event (20160108/evgpe-790)
апр 14 20:32:27 antoha systemd-journald[1523]: Missed 43 kernel messages
апр 14 20:32:27 antoha kernel: ACPI Error: No handler or method for GPE 16, disabling event (20160108/evgpe-790)
апр 14 20:32:27 antoha systemd-journald[1523]: Missed 64 kernel messages
апр 14 20:32:27 antoha kernel: ACPI Error: No handler or method for GPE 07, disabling event (20160108/evgpe-790)
апр 14 20:32:27 antoha systemd-journald[1523]: Missed 63 kernel messages
апр 14 20:32:27 antoha kernel: ACPI Error: No handler or method for GPE 0D, disabling event (20160108/evgpe-790)
апр 14 20:32:27 antoha systemd-journald[1523]: Missed 107 kernel messages
апр 14 20:32:27 antoha kernel: ACPI Error: No handler or method for GPE 17, disabling event (20160108/evgpe-790)
апр 14 20:32:27 antoha systemd-journald[1523]: Missed 58 kernel messages
апр 14 20:32:27 antoha systemd-journald[1523]: Missed 66 kernel messages
апр 14 20:32:27 antoha kernel: ACPI Error: No handler or method for GPE 0C, disabling event (20160108/evgpe-790)
апр 14 20:32:27 antoha systemd-journald[1523]: Missed 62 kernel messages
апр 14 20:32:27 antoha systemd-journald[1523]: Missed 37 kernel messages
апр 14 20:32:27 antoha kernel: ACPI Error: No handler or method for GPE 0C, disabling event (20160108/evgpe-790)
апр 14 20:32:27 antoha systemd-journald[1523]: Missed 59 kernel messages
апр 14 20:32:27 antoha kernel: ACPI Error: No handler or method for GPE 0D, disabling event (20160108/evgpe-790)
апр 14 20:32:27 antoha systemd-journald[1523]: Missed 43 kernel messages
апр 14 20:32:27 antoha kernel: ACPI Error: No handler or method for GPE 14, disabling event (20160108/evgpe-790)
апр 14 20:32:27 antoha systemd-journald[1523]: Missed 88 kernel messages
апр 14 20:32:27 antoha kernel: ACPI Error: No handler or method for GPE 0A, disabling event (20160108/evgpe-790)
апр 14 20:32:27 antoha systemd-journald[1523]: Missed 50 kernel messages
апр 14 20:32:27 antoha kernel: ACPI Error: No handler or method for GPE 00, disabling event (20160108/evgpe-790)
апр 14 20:32:27 antoha systemd-journald[1523]: Missed 61 kernel messages
апр 14 20:32:27 antoha kernel: ACPI Error: No handler or method for GPE 02, disabling event (20160108/evgpe-790)
апр 14 20:32:27 antoha systemd-journald[1523]: Missed 69 kernel messages
апр 14 20:32:27 antoha kernel: ACPI Error: No handler or method for GPE 0D, disabling event (20160108/evgpe-790)
апр 14 20:32:27 antoha systemd-journald[1523]: Missed 41 kernel messages
апр 14 20:32:27 antoha kernel: ACPI Error: No handler or method for GPE 11, disabling event (20160108/evgpe-790)
апр 14 20:32:27 antoha systemd-journald[1523]: Missed 76 kernel messages
апр 14 20:32:27 antoha kernel: ACPI Error: No handler or method for GPE 0D, disabling event (20160108/evgpe-790)
апр 14 20:32:27 antoha systemd-journald[1523]: Missed 87 kernel messages
апр 14 20:32:27 antoha kernel: ACPI Error: No handler or method for GPE 14, disabling event (20160108/evgpe-790)
апр 14 20:32:27 antoha systemd-journald[1523]: Missed 44 kernel messages
апр 14 20:32:27 antoha kernel: ACPI Error: No handler or method for GPE 00, disabling event (20160108/evgpe-790)
апр 14 20:32:27 antoha systemd-journald[1523]: Missed 62 kernel messages
апр 14 20:32:27 antoha kernel: ACPI Error: No handler or method for GPE 05, disabling event (20160108/evgpe-790)
апр 14 20:32:27 antoha systemd-journald[1523]: Missed 39 kernel messages
апр 14 20:32:27 antoha systemd-journald[1523]: Missed 65 kernel messages
апр 14 20:32:27 antoha kernel:  (20160108/evgpe-790)
апр 14 20:32:27 antoha systemd-journald[1523]: Missed 42 kernel messages

Записалось 12 МБ вот таких сообщений, никакие другие сообщения в журнал пробиться не смогли. Длятся они всего три секунды, кстати. Возможно журнал упал. В течении 1 мин 33 сек шло journald flush. По сообщениям на экране вижу, что запустились все службы. По ctrl+alt+f2 удалось даже в другой терминал переключиться. Но после попытке поглядеть что творится в первой консоли, ноутбук завис намертво.

Ноутбук hp 605 AMD E2-1800. Ядро 4.1.21 загружается и работает без проблем. Также без проблем работали ядра 4.4.x
Comment 1 Michael Shigorin 2016-04-15 17:37:27 MSK
А 4.5.0? (если не было установлено, см. http://altlinux.org/archive)
Comment 2 Антон Мидюков 2016-04-16 12:22:20 MSK
(In reply to comment #1)
> А 4.5.0? (если не было установлено, см. http://altlinux.org/archive)

Тоже самое.
Comment 3 Антон Мидюков 2016-04-16 12:26:47 MSK
А вот и багрепорт данной ошибки для ядра 4.5 нашёлся: https://bugzilla.kernel.org/show_bug.cgi?id=114811
Comment 4 Антон Мидюков 2016-04-16 12:30:00 MSK
(In reply to comment #3)
> А вот и багрепорт данной ошибки для ядра 4.5 нашёлся:
> https://bugzilla.kernel.org/show_bug.cgi?id=114811

Можно сразу смотреть: https://bugzilla.kernel.org/show_bug.cgi?id=114201
Comment 5 Антон Мидюков 2016-04-17 04:21:59 MSK
(В ответ на комментарий №0)
> Ноутбук hp 605

Не hp 605, а hp 655
Comment 6 Антон Мидюков 2016-04-22 06:29:05 MSK
Вот здесь https://bugzilla.kernel.org/show_bug.cgi?id=114201#c40 предлагают в чёрный список внести SMBus:

Reverting the patch on top of 4.5 fixes the ACPI Error spamming, the sp5100_tco module loads and the output is this:

 sp5100_tco: SP5100/SB800 TCO WatchDog Timer Driver v0.05
 sp5100_tco: PCI Revision ID: 0x3a
 sp5100_tco: failed to find MMIO address, giving up.


Without reverting the patch on 4.5 i get the following sp5100_tco output:

 sp5100_tco: SP5100/SB800 TCO WatchDog Timer Driver v0.05
 sp5100_tco: PCI Vendor ID: 0x1022, Device ID: 0x780b, Revision ID: 0x3a
 sp5100_tco: Using 0xfed80b00 for watchdog MMIO address
 sp5100_tco: Last reboot was not triggered by watchdog.
 sp5100_tco: initialized (0xffffc9000001eb00). heartbeat=60 sec (nowayout=0)
 ACPI Error: No handler or method for GPE 00, disabling event (20160108/evgpe-790)
 ... lots of ACPI errors ...

Blacklisting the module also fixes the error spamming for me.
My Device 0x780b (PCI_DEVICE_ID_AMD_HUDSON2_SMBUS) is from about 2013 (Lenovo Edge E145 with AMD A4-5000 APU with Radeon(TM) HD Graphics).

У меня это:
00:14.0 SMBus: Advanced Micro Devices, Inc. [AMD] FCH SMBus Controller (rev 14)

Но мне это не помогло.
Comment 7 ashen 2016-05-07 10:58:49 MSK
lspci|grep -i smbus
00:14.0 SMBus: Advanced Micro Devices, Inc. [AMD] FCH SMBus Controller (rev 14)

sp5100_tco в блэклист мне помогло.
Comment 8 Konstantin A Lepikhov (L.A. Kostis) 2016-05-07 11:09:41 MSK
*** Bug 32072 has been marked as a duplicate of this bug. ***
Comment 9 Антон Мидюков 2016-05-08 11:26:35 MSK
(In reply to comment #7)
> lspci|grep -i smbus
> 00:14.0 SMBus: Advanced Micro Devices, Inc. [AMD] FCH SMBus Controller (rev 14)
> 
> sp5100_tco в блэклист мне помогло.

Видимо я не в тот блэклист вносил (/etc/modules-load.d/). Напишите, куда прописывать и как, буду благодарен.
Comment 10 ashen 2016-05-08 11:32:20 MSK
(In reply to comment #9)
> Видимо я не в тот блэклист вносил (/etc/modules-load.d/). Напишите, куда
> прописывать и как, буду благодарен.

cat /etc/modprobe.d/amd.conf

blacklist sp5100_tco
Comment 11 Антон Мидюков 2016-05-08 15:14:12 MSK
(In reply to comment #10)
> cat /etc/modprobe.d/amd.conf
> 
> blacklist sp5100_tco

Спасибо. Помогло.
Comment 12 ashen 2016-05-08 15:25:00 MSK
(In reply to comment #11)
> (In reply to comment #10)
> > cat /etc/modprobe.d/amd.conf
> > 
> > blacklist sp5100_tco
> 
> Спасибо. Помогло.

Да не мне, Кости Лепикову спасибо, за подсказку костыля.
Как я понимаю для этой баги надо либо ждать официального обновления, где будет пофиксшен kernel bug #114201,
либо просить наших ядерщиков приложить нужный патч:

http://www.spinics.net/lists/linux-watchdog/msg09165.html
Comment 13 Michael Shigorin 2016-05-11 12:10:37 MSK
Хорошо бы проверить на 4.5.3 (вошло в сегодняшние регулярки, если что).
Comment 14 ashen 2016-05-11 14:09:43 MSK
(In reply to comment #13)
> Хорошо бы проверить на 4.5.3 (вошло в сегодняшние регулярки, если что).

Ни каких изменений.
Всё так же.
Comment 15 Konstantin A Lepikhov (L.A. Kostis) 2016-05-22 23:03:40 MSK
(In reply to comment #14)
> (In reply to comment #13)
> > Хорошо бы проверить на 4.5.3 (вошло в сегодняшние регулярки, если что).
> 
> Ни каких изменений.
> Всё так же.

Для справки - этот фикс не вошел в 4.6, есть только в watchdog-next, оттуда добавляется через cherry-pick.
Comment 16 StormFiber 2019-01-14 11:31:02 MSK
(In reply to comment #2)
> (In reply to comment #1)
> > А 4.5.0? (если не было установлено, см. https://whatstatus.co/whatsapp-dp-images)
> 
> Тоже самое.

Видимо я не в тот блэклист вносил (/etc/modules-load.d/). Напишите, куда
прописывать и как, буду благодарен.
Comment 17 Антон Мидюков 2022-08-02 09:17:58 MSK
Багу в 201(Ответ для Антон Мидюков на комментарий #4)
> (In reply to comment #3)
> > А вот и багрепорт данной ошибки для ядра 4.5 нашёлся:
> > https://bugzilla.kernel.org/show_bug.cgi?id=114811
> 
> Можно сразу смотреть: https://bugzilla.kernel.org/show_bug.cgi?id=114201

Багу в 2018 закрыли. Я на hp 655 в 2019-2021 годах систему много раз ставил и разные лайвы регулярок запускал, проблем не было.