MacBook Pro [Précis et détaillé] Kernel Panics très fréquents

ajacquierbret

Membre enregistré
6 Juin 2019
8
2
23
Bonjour à tous !

Je vais ici essayer de créer un compte-rendu le plus détaillé et précis possible des évènements et circonstances qui ont possiblement mené à la survenue de ce problème traité pas un nombre gigantesque de sujets sur la toile mais au final quasiment jamais résolu : les Kernel Panics.

J'ai l'espoir de pouvoir obtenir l'aide de membres experts de ce forum au cours d'un long processus de diagnostic et de pouvoir enfin être cette bouée auxquels d'innombrables utilisateurs de Mac OS et victimes de ce problème aimeraient se raccrocher, tout comme moi.
Je remercie d'avance tous les contributeurs de ce fil de discussion pour leur temps passé à tenter de démêler l'inextricable complexité et diversité de causes probables de ce problème auquel tant de personnes semblent confrontées.

Voici tout d'abord une liste non exhaustive des composant de mon mac, de son modèle et de la version de Mac OS :

Macbook Pro mid-2017 13" Function Keys A1708 (Two Thunderbolt 3 ports)
(NON COUVERT PAR LA GARANTIE APPLE)
Logiciel : macOS Mojave 10.14.5 (18F132)
Processeur : 2,3 GHz Intel Core i5
Mémoire : 8 Go 2133 MHz LPDDR3
Disque de démarrage : SSD (500Go)
Graphisme : Intel Iris Plus Graphics 640 1536 Mo


1. Voici maintenant une description du problème en question, de la manière la plus précise possible :

L'ordinateur se fige quelques secondes, sans aucune réponse, le moteur électro-mécanique du trackpad ne répond plus lui non plus, puis l'écran vire au noir sans rétroéclairage (à ce moment et uniquement si un haut-parleur est branché au mac via le port mini-jack, le haut-parleur en question reproduit un son sourd et aigu durant une ou deux secondes).
S'ensuit une activation soudaine des ventilateurs à leur vitesse maximale (7200 rpm) durant une durée indéterminée et en maintenant l'écran éteint, sans aucune possibilité d'action, ce qui me pousse à forcer l'extinction du mac en pressant la touche de démarrage pendant 6 secondes, ce qui force également et évidemment, le ventilateur à s'éteindre.
C'est à ce moment là qu'il m'est permis de ré-appuyer sur la touche de démarrage du clavier pour allumer l'ordinateur. Le rétroéclairage s'allume, puis l'écran affiche le sempiternel message :
"Votre ordinateur a redémarré en raison d'un problème. Pour poursuivre le redémarrage, appuyez sur une touche ou patientez quelques secondes."
Après avoir appuyé sur une touche quelconque, l'OS démarre et il m'est permis de m'authentifier pour voir apparaitre le message de rapport d'erreur d'Apple ainsi que le log de ce redémarrage brutal, m'indiquant alors par les termes de "kernel trap at : xxxxx", qu'il s'agit bien d'une Kernel Panic.
 
2. Plusieurs évènements précèdent cette panique du système :

• (Sur)chauffe du CPU détectée à l'aide du software iStat Menus et par les capteurs "CPU Core 1 ; CPU Core 2 ; CPU Core PECI ; CPU Die PECI ; CPU Proximity ; CPU System Agent Core" entre 80° et 100°C. Ce phénomène de chauffe normalement presque anodin survient lors d'une utilisation plutôt intensive du CPU (utilisation de la suite Adobe CC par exemple ou logiciels 3D) ou lors du visionnage d'un film ou d'un autre média sur un écran externe via un adaptateur Thunderbolt -> HDMI (entre autres connecteurs). Précision : cet adaptateur est en partie en métal et semble chauffer abondamment, et il est plaqué contre la coque en métal du Macbook Pro.

• Lors de rares occasions, et plutôt récemment, lors de tests hardware effectués par différents logiciels tels que TechTool Pro 10 ou encore Rember. Et plutôt lors de tests concernant la mémoire RAM.
• Lors de rares occasions, lors de calculs 3D, tel que de la photogrammétrie par exemple.
• Lors de très rares occasions, (il ne me semble pas avoir notifié ce problème plus d'une ou deux fois) lors de l'utilisation d'un plugin Flash intégré à une page web. (Il me semble même que ce ou ces Kernel Panics soient les premiers auxquels j'ai été confronté avec mon mac, le début d'un long périple dans les dédales des pertes d'heures de travail sans avoir sauvegardé...)
• Quelquefois, oserais-je dire de plus en plus souvent ? Lors d'une utilisation tout à fait habituelle et sans aucune utilisation intensive des ressources du CPU ou de tout autre composant, ni chauffe et encore moins de surchauffe (entre 35 et 50°C pour le CPU). Exemple : en écrivant ce post.

• Lors de tentatives de réinstallation de Mac OS par le biais du mode Recovery ou d'une clé USB bootable, sans distinction entre les deux. Ce qui m'a valu de passer des semaines pour enfin réussir une installation de Mac OS après avoir formaté le SSD. (Non, même effectuer l'installation dans le froid hivernal sur la terrasse de ma maison ne suffisait pas.)
 
3. Voici maintenant une chronologie approximative et non exhaustive des évènements survenus depuis la première manifestation du problème et des tentatives de réparation effectuées :


1. Il y a 8-9 mois : Utilisation du Mac avec écran externe branché via l'adaptateur décrit ci-dessus. La panique survient lors de l'utilisation d'un plugin Flash intégré à une page web (jeu flash pour être précis). En redémarrant puis en retournant sur cette même page, la panique survient de nouveau. C'est alors la première fois que ce problème apparait, et ne retournant plus sur cette page ou sur une autre similaire contenant de plugin Flash, le problème semble avoir disparu jusqu'à la prochaine manifestation de celui-ci (n°2), ou alors il est possible que quelques paniques soient survenues mais trop rarement pour que je le notifie et que je puisse m'en rappeler.
2. Il y a 5-6 mois : Encryption du disque par FileVault. Installation de tout un tas de logiciels de hacking par l'intermédiaire de Homebrew. Installation de VirtualBox et donc d'une machine virtuelle grâce à la création d'une partition sur mon SSD sur laquelle sera installé Kali Linux.
3. Il y a 4 mois : Kernel Panics à répétition et de manière très fréquente lors d'un voyage en Colombie (je sais il y fait chaud mais tout de même). Après quelques recherches sur la toile, je comprends que ce problème est possiblement lié à l'encryption du SSD par FileVault. Je décide alors de lancer le décryptage du disque par ce même utilitaire, seulement durant l'opération l'ordinateur panique une nouvelle fois, et cette fois-ci au démarrage il m'est impossible de m'authentifier, le mot de passe n'étant plus reconnu car le disque n'a été décrypté qu'à moitié. Je décide alors, n'ayant d'autre choix, que de formater le disque SSD par l'intermédiaire du mode Recovery, et d'effectuer une installation propre et fraîche de Mac OS. Seulement, après avoir terminé l'installation, il m'est impossible de démarrer l'OS (problème de symbole "cercle barré"). Malgré de nombreuses pérégrinations sur internet pour tenter de découvrir le nœud du problème et sa résolution, c'est un échec. Je retente alors de réinstaller Mac OS de nombreuses fois, et la seule tentative fructueuse fut possible grâce au fait de formater mon disque SSD au format HFS, puis de lancer l'installation de Mac OS qui, elle, reformatera le disque SSD au format APFS automatiquement.
4. Il y a 4 mois jusqu'à il y a deux mois : Le mac tourne alors plus ou moins bien, il est possible de s'en servir pour des tâches qui ne sollicitent que peu les composants, mais est toujours victime de Kernel Panics fréquents.
5. Il y a 2 mois : Lors du chargement d'une longue vidéo, l'ordinateur panique et l'OS ne parvient plus à démarrer, il m'est possible d'effectuer tout un tas d'opérations via le mode Single-User en lignes de commande et de suivre le déroulement du démarrage via le mode Verbose, ainsi que d'avoir accès au mode Recovery, mais sinon, l'ordinateur est inutilisable, est toute réinstallation du système se solde par un échec (Kernel Panic à répétition empêchant le bon déroulement de l'installation).

6. Il y a 1 mois et demi : Après récupération des données du disque par le biais de lignes de commande du Terminal dans le mode Recovery, je tente de booter sur un disque externe sur lequel est installé Mac OS High Sierra, et à ce moment-là aucune panique ne survient, l'ordinateur est fonctionnel, mais évidemment tourne grâce à l'OS installé sur le disque externe. Par le biais de ce disque externe il m'est enfin possible d'installer macOS Mojave sur mon disque SSD, et ainsi d'utiliser mon ordinateur, malheureusement les Kernel Panics sont toujours présentes.
7. Il y a deux semaines (Attention, ce problème n'est peut-être pas lié à celui des Kernel Panics, mais semble présenter tout de même cette possibilité) : Lors du visionnage d'un film sur une télévison par le biais de l'adaptateur précédemment décrit, l'image saccade et les fps semblent chuter toutes les 10-15 secondes, après la fin du visionnage, un autre film est lancé, cette fois-ci il m'est impossible de faire abstraction d'énormes sauts d'images et de latence jusqu'ici jamais constatés. Après analyse des processus en action dans la console et via iStat Menus je remarque que le Finder ne répond plus, et ce malgré avoir relancé des dizaines de fois celui-ci et redémarré l'ordinateur autant de fois, et qu'un processus monopolise le CPU, après des heures, que dis-je, des jours d'étude du problème, je décide de créer un nouvel utilisateur sur mon mac et là effectivement plus aucun problème mis à part les sempiternels Kernel Panics.
 
8. Il y a une semaine : Lors du téléchargement d'un film, l'ordinateur s'éteint après avoir subit de fortes températures (80-105°C) sans raison apparente, mais cette fois-ci il est impossible de le rallumer. L'ordinateur s'allume car il est capable d'alimenter des périphériques mais l'OS ne démarre pas, le rétroéclairage est éteint et le ventilateur aussi, le mac ne fait pas un son quand je branche son chargeur. Après quelques jours au frais sans chargement de la batterie et en attendant l'appel d'un réparateur non loin de chez moi, je décide de ré-essayer de l'allumer pour être certain de son "décès", et là l'écran s'allume, m'indique la nécessité de brancher le chargeur car sa batterie est vide, et après l'avoir fait, peut enfin s'allumer et fonctionner à nouveau. Je déduit donc que le fait de laisser la batterie se vider était la solution à ce problème.
9. Depuis, j'utilise mon mac tous les jours en vivant avec ces Kernel Panics, et c'est d'ailleurs avec celui-ci que j'écris ce post, mais vous l'imaginez bien, c'est extrêmement handicapant.
 
4. Voici les occurrences et les fréquences de celles-ci trouvées dans les 35 logs de mes derniers Kernel Panics (il est normal que les pourcentages additionnés dépassent 100, car plusieurs occurrences peuvent être trouvées dans le même log) :

"panic(cpu X caller)" : 34 occurrences (97% du temps)

"Kernel trap at 0xffffff" : 21 occurrences (60 % du temps)
"Error code: 0x0000000000000000" (Erreur de lecture) : 17 occurrences (48,5 % du temps)
"type 14=page fault" : 14 occurrences (40 % du temps)

"type 13=general protection" : 7 occurrences (20 % du temps)
"a freed zone element has been modified in zone xxx" : 4 occurrences (11,4 % du temps)
"Invalid queue element linkage for 0xffffff" : 3 occurrences (8,5 % du temps)
"Error code: 0x0000000000000002" (Erreur d'écriture) : 3 occurrences (8,5 % du temps)
"Spinlock acquisition timed out" : 2 occurrences (5,71 % du temps)
"kfree: size xxxxx > kalloc_largest_allocated xxxxx" : Une seule occurrence (2,85% du temps)

"Inheritor flags lost along the way" : Une seule occurrence (2,85% du temps)

"Error code: 0x0000000000000010" (?) : Une seule occurrence (2,85 % du temps)
"zfree: invalid head pointer 0xffffff for freelist of zone kalloc" : Une seule occurrence (2,85 % du temps)

"Possible memory corruption" : Une seule occurrence (2,85 % du temps)
"mp_kdp_enter() timed-out on cpu 2, NMI-ing" : Une seule occurrence (2,85% du temps)

Derniers ou parmis les derniers kexts chargés ou non-chargés :

"com.apple.driver.AGPM" : 33 occurrences (94% du temps) -> Jamais le dernier kext chargé mais toujours parmis les derniers
"com.apple.driver.AppleGraphicsDevicePolicy" : 33 occurences (94% du temps) -> Souvent le dernier kext chargé et toujours parmis les derniers

"com.apple.driver.AudioAUUC" : 31 occurrences (88% du temps) -> Souvent le dernier kext chargé et toujours parmis les derniers
"com.apple.driver.AppleHDAHardwareConfigDriver" : 20 occurrences (57 % du temps) -> Souvent le dernier kext chargé et toujours parmis les derniers
"com.apple.driver.AppleFileSystemDriver" : 6 occurrences (17 % du temps) -> Souvent le dernier kext non-chargé

"com.apple.filesystems.exfat" : 5 occurrences (14% du temps) -> Souvent le dernier kext chargé et non-chargé en même temps et toujours parmis les derniers

"com.apple.filesystems.msdosfs" : 2 occurences ( 5,71% du temps) -> Souvent le dernier kext chargé et non-chargé en même temps
 
5. Dernières précisions :

• Bien évidemment, des réinitialisations de la mémoire NVRAM et du SMC ont été faites des dizaines de fois sans amélioration.
• Des réparations récentes des permissions de la partition de l'EFI du disque SSD ont été faites par lignes de commande récemment car des dommages ont été trouvés par l'Utilitaire de Disque Apple.
• Les Kernel Panics surviennent avec ou sans périphérique connecté au Macbook Pro.
• La pâte thermique du radiateur du CPU a été changée, sans changement notable.


6. Quelques pistes ?

• Il me paraît probable que le CPU soit endommagé du fait de pics de chaleur importants et ce quelquefois même lors d'une utilisation normale.

• J'ai entendu dire que la principale cause de Kernel Panics est la défaillance de la mémoire RAM, je la suspecte donc tout autant que le CPU.
• Peut-être un fichier enfouis dans les dossiers du système perturbe-t-il l'ensemble ou un défaut dans le partitionnement du disque SSD causés par l'installation de VirtualBox il y a 6 mois de cela ? L'erreur aurait persisté après le formatage du SSD car celui-ci n'aurait pas été effectué correctement ? J'ai entendu dire qu'Apple ne laisserait pas formater de manière standard ses SSD via l'Utilitaire de Disque et qu'il faut pour cela passer par des lignes de commande et effectuer un 'secureErase'.
• Il y a quelque-chose d'étrange avec les températures qu'affichent les capteurs de mon CPU, lorsque celles-ci sont basses (35-55°C) la montée en température affichée parait normale, par contre lorsqu'elles sont hautes (65-90°) elles varient énormément d'un instant à l'autre, passant de 55 à 75° en une seconde et revenant à 60° pour repasser à 80° pendant le même laps de temps. Soit le software iStat Menus m'affiche de mauvaises valeurs, soit les capteurs sont en mauvais état. Mais il ne me semble pas possible que les températures d'un CPU puissent varier sur une telle amplitude dans un si court laps de temps.

Toutes mes excuse concernant la longueur de ce post mais il me parait nécessaire de bien structurer et détailler les différents éléments attenants au diagnostic de ce problème, en espérant que cela puisse faire plaisir aux connaisseurs expérimentés que d'avoir une vue globale et claire de la situation.
 
  • J’aime
Réactions: baron
Bonjour,

Problème CPU ou chipset graphique ? Pour moi c'est hardware, donc SAV pour tests poussés. Essaie de négocier quand même une prise en charge sous garantie.
 
Merci pour ta réponse Sly54, effectivement j'en suis arrivé à la conclusion qu'il est très probable que le CPU soit défectueux, ou alors sa gestion logicielle interne, dans tout les cas, ça veut dire remplacement de celui-ci, et inévitablement remplacement de la carte mère (la magie Apple). J'ai pu arrivé à cette conclusion principalement grâce à ces graphiques, où l'on peut voir des écarts incroyables de température et de consommation en si peu de temps, tout au plus quelques secondes. J'ai pu voir sur le site d'Intel et sur la page des spécifications de mon processeur qu'il dispose d'un système de gestion thermique interne, et que la température de jonction maximale est fixée à 100°C.
Un problème de Kernel Panic pourrait alors survenir au moment où un de ces pics (impossibles physiquement, mais bien représentés sur les graphiques) dépasse cette sainte limite, où la panique est provoquée par une extinction brutale de sécurité thermique du CPU. J'ai pu lire des posts concernant des phénomènes de CPU throttling liés aux processeurs i9 d'Intel sur des machines plus récentes et sous mac, constatant qu'un simple patch pouvait être la solution au problème, malheureusement Apple semble nier la présence de ce dysfonctionnement sur les Macbook Pro de 2016 et 2017.
Si le problème est logiciel et se trouve être lié à un simple patch ou correctif cela me rassurerait beaucoup, malheureusement je n'ai aucune idée de la manière dont il est possible d'obtenir ce dit patch si il n'existe même pas pour ma machine.. Autrement, si le problème est matériel il me faudra changer l'intégralité de la carte mère, et donc mon portefeuille par la même occasion, sauf si j'arrive à négocier avec un réparateur agréé la prise en charge du mac dans le cadre de la loi contre les vices cachés, ce dont je doute fortement même si bien entendu, un CPU ne devrait pas réagir de cette manière au bout de deux ans d'utilisation si il s'agit là d'un problème hardware et non logiciel.. Je vous met ci-joint les graphiques en question, réalisés sous Intel Power Gadget et iStat Menus.

PS : Si ça peut aider, ces pics semblent survenir principalement lorsque le Turbo Boost est activé et qu'aucune limite de consommation du CPU n'est imposée, autrement ils sont quasiment inexistants, ou du moins, semblent être conformes à des graphiques typiques d'un CPU en bon état (Turbo Boost désactivé / Limite de 5W).

Merci !
 

Fichiers joints

  • Capture d’écran 2019-06-08 à 11.50.29.png
    Capture d’écran 2019-06-08 à 11.50.29.png
    1,2 Mo · Affichages: 142
  • Capture d’écran 2019-06-08 à 11.50.40.png
    Capture d’écran 2019-06-08 à 11.50.40.png
    1,2 Mo · Affichages: 168
  • Capture d’écran 2019-06-08 à 11.51.13.png
    Capture d’écran 2019-06-08 à 11.51.13.png
    422,9 KB · Affichages: 157
Bravo pour ce niveau de détail et d’analyse. Je pense qu’il y a effectivement un souci soit au niveau de la carte mère ou du cpu. Je propose quand même un test supplémentaire avant d’emmener chez un réparateur : Rember est bien mais pas parfait pour tester la ram. Le mieux est d’utiliser memtest en ligne de commande et en mode single user (commande S au démarrage) et de le laisser tester jusqu’au bout (si possible !) Au cas où ce soit un souci de ram même si je n’en suis pas convaincu. Bon courage !