Aller au contenu
Site Communauté

Ecrans bleus (BSoD) récurrents


Adverty
Aller à la solution Résolu par Delta,

Messages recommandés

Bonjour à tous,

J'ai acheté et monté mon nouveau PC il y a un approximativement un mois.
Tout fonctionnait plutôt bien jusqu'ici malgré quelques freeze/crash récurrents sur certains jeux mais je n'avais pas eu le temps de m'y intéresser.
Il y a 3 jours, j'ai voulu installer un jeu et j'ai subit un écran bleu, j'ai réussis tant bien que mal à terminer l'installation mais depuis je ne peux lancer aucun jeu sans que mon pc crash avec écran bleu, j'ai eu plusieurs messages d'erreur sur cet écran donc difficile de savoir le problème exact. Voici ce que j'ai tenté:

- Test de la RAM avec l'utilitaire Windows (aucun problème relevé)
- Vérification/Réparation de l'OS au démarrage
- Mise à jour du pilote de la carte graphique
- Test du CPU avec "Intel Processor Diagnostic Tool" qui conduit encore une fois à un écran bleu quand le CPU se met en charge


Sans changement, j'ai suivi ce tuto aujourd'hui pour identifier le problème.
Voici ce que WinDBG m'indique à la suite de l'analyse

Révélation

WHEA_UNCORRECTABLE_ERROR (124)
A fatal hardware error has occurred. Parameter 1 identifies the type of error
source that reported the error. Parameter 2 holds the address of the
nt!_WHEA_ERROR_RECORD structure that describes the error condition. Try !errrec Address of the nt!_WHEA_ERROR_RECORD structure to get more details.
Arguments:
Arg1: 0000000000000004, PCI Express Error
Arg2: ffffb30ee4905028, Address of the nt!_WHEA_ERROR_RECORD structure.
Arg3: 0000000000000000
Arg4: 0000000000000000

Debugging Details:
------------------


KEY_VALUES_STRING: 1

    Key  : Analysis.CPU.mSec
    Value: 578

    Key  : Analysis.DebugAnalysisManager
    Value: Create

    Key  : Analysis.Elapsed.mSec
    Value: 7486

    Key  : Analysis.Init.CPU.mSec
    Value: 608

    Key  : Analysis.Init.Elapsed.mSec
    Value: 165794

    Key  : Analysis.Memory.CommitPeak.Mb
    Value: 102

    Key  : WER.OS.Branch
    Value: ni_release

    Key  : WER.OS.Timestamp
    Value: 2022-05-06T12:50:00Z

    Key  : WER.OS.Version
    Value: 10.0.22621.1


FILE_IN_CAB:  MEMORY.DMP

DUMP_FILE_ATTRIBUTES: 0x1000

BUGCHECK_CODE:  124

BUGCHECK_P1: 4

BUGCHECK_P2: ffffb30ee4905028

BUGCHECK_P3: 0

BUGCHECK_P4: 0

HARDWARE_VENDOR_ID:  10DE

HARDWARE_DEVICE_ID:  2488

BLACKBOXNTFS: 1 (!blackboxntfs)


PROCESS_NAME:  System

STACK_TEXT:  
ffff8000`2406bc78 fffff804`3def603b     : 00000000`00000124 00000000`00000004 ffffb30e`e4905028 00000000`00000000 : nt!KeBugCheckEx
ffff8000`2406bc80 fffff804`3d1c10c0     : 00000000`00000000 ffff8000`2406bd59 ffffb30e`e4905028 ffffb30e`e46ee1d4 : nt!HalBugCheckSystem+0xeb
ffff8000`2406bcc0 fffff804`3dfff8ff     : 00000000`00000000 ffff8000`2406bd59 ffffb30e`e4905028 ffffb30e`e46ee1d4 : PSHED!PshedBugCheckSystem+0x10
ffff8000`2406bcf0 fffff804`42cbdb39     : ffffb30e`e46ee1d4 ffffb30e`e46ee1d4 00000000`00000001 ffff8000`00000407 : nt!WheaReportHwError+0x38f
ffff8000`2406bdc0 fffff804`42cb97b1     : 00000000`00000130 ffffb30e`e4843390 00000000`00000000 ffffb30e`e4854490 : pci!PciRpRcecHandleAerInterrupt+0x2e9
ffff8000`2406be20 fffff804`42cb9c16     : ffff8000`24562d00 ffff8000`2406bed0 ffff8000`24051180 ffffb30e`e20e46c0 : pci!ExpressRootPortAerInterruptRoutine+0xa1
ffff8000`2406be90 fffff804`42cb9cd9     : ffff8000`24562dc0 ffff8000`2406bfb0 00000000`006681c8 fffff804`3de7de00 : pci!ExpressRootPortInterruptRoutine+0x46
ffff8000`2406bef0 fffff804`3dd5b761     : ffff8000`24051180 ffffb30e`e0dad040 00000000`00000f32 ffffb084`94c3fa70 : pci!ExpressRootPortMessageRoutine+0x9
ffff8000`2406bf20 fffff804`3dd4b38b     : ffffb30e`e0dad040 fffff804`3dc9407c ffff8000`24051180 ffff8000`24562dc0 : nt!KiInterruptMessageDispatch+0x11
ffff8000`2406bf50 fffff804`3de2d7cf     : ffffb084`94c3fa70 ffff8000`24562dc0 ffffb30e`e0dad040 00000000`00000f25 : nt!KiCallInterruptServiceRoutine+0x16b
ffff8000`2406bf90 fffff804`3de2da97     : 00000000`02880bfc 00000000`00000000 00000000`027130c6 00000000`00000000 : nt!KiInterruptSubDispatch+0x11f
ffffb084`94c3f9f0 fffff804`3de306aa     : 00000000`00000f25 00000000`00000000 ffffb30e`e0dad040 ffffb30e`e0dad040 : nt!KiInterruptDispatch+0x37
ffffb084`94c3fb80 00000000`00000000     : ffffb084`94c40000 ffffb084`94c39000 00000000`00000000 00000000`00000000 : nt!KiIdleLoop+0x5a


MODULE_NAME: GenuineIntel

IMAGE_NAME:  GenuineIntel.sys

STACK_COMMAND:  .cxr; .ecxr ; kb

FAILURE_BUCKET_ID:  0x124_4_GenuineIntel_PCIEXPRESS_VENID_10DE_DEVID_2488_MALFORMED_TLP_IMAGE_GenuineIntel.sys

OS_VERSION:  10.0.22621.1

BUILDLAB_STR:  ni_release

OSPLATFORM_TYPE:  x64

OSNAME:  Windows 10

FAILURE_ID_HASH:  {360f36dc-8337-865b-cc7f-127008b3f433}

Followup:     MachineOwner
---------
 

 

J'arrive un peu à cours d'idées. Je ne sais plus trop quoi tester et comment solutionner mon problème et je ne veux pas partir dans des manipulations trop hasardeuses sachant que je n'ai pas trop l'habitude de bidouiller ces choses.

Est-ce que quelqu'un aurait déjà eu ce genre de problème ou saurait m'aider ?
(je peux fournir plus de détails sur ma configuration si nécessaire.)

Merci d'avance

Modifié par Adverty
Lien vers le commentaire

Bonjour @Adverty Donnez nous la config exacte 

Testez les ram à l'aide de memtest https://lecrabeinfo.net/memtest86-tester-la-memoire-vive-ram-de-son-pc.html c'est plus parlant 

Pour l'erreur https://learn.microsoft.com/en-us/windows-hardware/drivers/debugger/bug-check-0x124---whea-uncorrectable-error il y a lieu de penser qu'un problème matériel est à l'origine de ces BSOD , ram , cm processeur 

Lien vers le commentaire

Pour la config:

CM: Z790 AORUS ELITE DDR4
CPU: Intel Core i7-13700KF
RAM: 4x8Go GSkill Trident RGB DDR4 (3600MHz)
GPU: RTX 3070 MSI VENTUS 3X Plus

L'OS est installé sur un SSD 2.5 récupéré de mon ancien PC (donc assez vieux).
Le reste de mes fichiers sont présents sur un NVME.

Du coup, y a il un moyen de tester le CPU et la CM pour savoir lequel pose problème ? 

 

Modifié par Adverty
Lien vers le commentaire

Testez le processeur à l'aide de l'outil Intel 64b https://www.intel.com/content/www/us/en/download/15951/intel-processor-diagnostic-tool.html

Edit : pas la peine étant donné que le test montre des faiblesses sur le processeur après relecture de votre post initial 

Contactez le vendeur du CPU 

Petite question : le disque système a t-il fait l'objet d'une installation neuve avec formatage du disque après installation dans le nouveau PC et quel système est installé 

Pour la CM si il s'agit des connecteurs ram on doit renvoyer la carte pour examen au vendeur ou au fabriquant qui lui a les outils diag nécessaires 

 

 

Modifié par calisto06
Lien vers le commentaire

Je viens de tester le processeur mais comme la dernière fois, j'ai un écran bleu au bout de quelques secondes dès que le CPU se met en charge.

Il y a 2 heures, calisto06 a dit :

Petite question : le disque système a t-il fait l'objet d'une installation neuve avec formatage du disque après installation dans le nouveau PC et quel système est installé 

--> J'avais W10 installé sur un SSD 2.5' dans mon ancien PC, du coup je me suis dit que ce serait parfait pour mettre l'OS de mon nouveau PC et garder tout mon NVME pour les gros jeux/logiciels. Je l'ai donc réinstallé sur le nouveau PC et je l'ai formaté avant d'y mettre W11.

C'est tout de même étrange que je pouvais lancer des jeux il y a encore quelques jours (avec quelques freeze ou retour bureau certes) et maintenant plus rien du tout.
Je pense qu'il s'agit d'un problème processeur, je peux utiliser mon PC normalement en dehors du lancement de jeu donc j'imagine que la CM fonctionne correctement.
Je l'espère en tout cas car ça me ferait bien ch*** de devoir démonter tout mon PC avec le temps que j'y ai passé...

Modifié par Adverty
Lien vers le commentaire
il y a 13 minutes, calisto06 a dit :

Avez vous noté les températures CPU juste avant les  BSOD ? 

Je n'ai jamais remarqué de température hors norme.
Sur le Memtest, je peux voir que la température max du CPU était de 58°C mais je n'ai jamais fait attention à la température avant les BSoD
Quand je lançais des jeux avant mes problème de blue screen, les températures étaient plutôt normales, jamais au dessus de 60°C (le CPU est refroidi par un waterccoling pour précision).

J'ai fait plutôt attention en appliquant la pâte pour que la couche soit homogène sans être trop fine ni épaisse et j'ai pris une bonne pâte (lien)

Lien vers le commentaire

hello @Adverty et @calisto06

ce que l'on pourrait essayer vus qu'il y a sur le memtest des erreurs sur la Ram selon le dossier il est mis en fail.

C'est de retirer les 3 Ram pour en laisser qu'une. Ensuite essayer un jeu, certes le jeu ira pas bien du tout sa vas etre lent etc mais il ne devrais pas tomber.

et faire ceci avec les 4 Ram voir si elle réagisse pareil ou si un jeu s'effondre.

Cela nous permettrai déjà d'y voir plus clair et éliminé les Ram ou pas.

 

Lien vers le commentaire

Salut @Delta, je pense que si je lance un jeu pas trop gourmand ça devrait aller (genre Rocket League). Est-ce que je dois faire un memtest sur chaque barrette également ?

Vu que ça va me prendre pas mal de temps, je ne pourrai pas faire ça aujourd'hui, du coup je pense faire les manips demain et je vous redis dès que j'ai tout testé.

Merci à vous deux pour l'aide précieuse et la réactivité, c'est vraiment cool

Modifié par Adverty
  • J'adore 1
Lien vers le commentaire
il y a 1 minute, Adverty a dit :

Salut @Delta, je pense que si je lance un jeu pas trop gourmand ça devrait aller (genre Rocket League). Est-ce que je dois faire un memtest sur chaque barrette également ?

on pourrait faire un test memtest sur une seul barrette a la fois sans passer par un jeu!

Si le pc reagit tout de suite ou presque sur les 4 ram une a une, on peut se dire qu'un autre élément nous perturbe

  • Plusser (+1) 1
Lien vers le commentaire

Je vais voir pour faire le test maintenant, que je soit fixé sur le fonctionnement des RAM.
On est d'accord que si je vois qu'une barrette fonctionne mal (memtest avec des erreurs) il faudra que je refasse le test avec le même slot et une barrette différente pour savoir si c'est la barrette ou le slot qui est défectueux ?

  • J'aime 1
Lien vers le commentaire
il y a 2 minutes, Adverty a dit :

Je vais voir pour faire le test maintenant, que je soit fixé sur le fonctionnement des RAM.
On est d'accord que si je vois qu'une barrette fonctionne mal (memtest avec des erreurs) il faudra que je refasse le test avec le même slot et une barrette différente pour savoir si c'est la barrette ou le slot qui est défectueux ?

oui sur le Dimm 1 vous tester les 4

puis sur le Dimm 2 vous tester les 4

Mais si sur Dimm 1 les 4 sont ok. Cela veut deja dire que vos 4 Ram sont bonne!

donc il faudra pour bien faire tester Dimm 2 et re passer les 4 Ram. Si c'est bon, c'est ailleurs mais pas lié au slot Ram ni aux Ram

Modifié par Delta
  • J'aime 1
Lien vers le commentaire

Bonjour,
ça a été un peu laborieux de trouver le temps avec le travail mais je viens de finir de tester les 4 barrettes et je n'ai eu aucune erreur sur Memtest sur le Dimm1.
Je vais maintenant essayer de tester les Dimm2/3/4 pour être sûr que cela vient bien des ports.

J'aurais préféré que ce soit un problème de barrette, là je vais devoir démonter tout le PC et attendre une nouvelle CM :dry: 

Lien vers le commentaire
il y a une heure, Adverty a dit :

Bonjour,
ça a été un peu laborieux de trouver le temps avec le travail mais je viens de finir de tester les 4 barrettes et je n'ai eu aucune erreur sur Memtest sur le Dimm1.
Je vais maintenant essayer de tester les Dimm2/3/4 pour être sûr que cela vient bien des ports.

J'aurais préféré que ce soit un problème de barrette, là je vais devoir démonter tout le PC et attendre une nouvelle CM :dry: 

hello, 

les 4 barrettes sont bonne donc

il y a une heure, Adverty a dit :

Je vais maintenant essayer de tester les Dimm2/3/4 pour être sûr que cela vient bien des ports.

inutile de passer les 4 Ram sur le Dimm2  puis 3 puis 4.. Suffit juste de tenter une ram sur dimm2 puis la retirer et aller a dim3 et puis dimm4.

 

Lien vers le commentaire

Oui, vu que les RAM sont fonctionnelles, je vais juste effectuer un Memtest sur chaque Dimm avec une barrette.

J'en lance un ce soir avant de partir au travail et les 2 autres seront faits demain.
Logiquement je devrais avoir des erreurs sur un des 3 autres ports (sinon je ne vois pas d'où pourrait venir le problème).

Merci encore pour ton aide précieuse @Delta

Lien vers le commentaire
il y a une heure, Adverty a dit :

Logiquement je devrais avoir des erreurs sur un des 3 autres ports (sinon je ne vois pas d'où pourrait venir le problème).

si c'est ok sur les 4 dimm's

soit CPU soit CG soit oui la carte mère mais a un autre endroit..

Si maintenant le pc tourne bien quand il n'est pas en force donc en charge de travail, il faut voir si c'est pas le CPU qui décroche

Quand le pc est au repos que vous consulter des choses légère qui ne sollicite pas le CPU ou les Ram, le pc se comporte comment

Lien vers le commentaire

Le DIMM2 est ok, je teste les 2 autres demain

En utilisation normale et même en jeu, cela se passe bien avec une barrette (sur les dimm1 et 2), je ne pense pas que le problème vienne du CPU, je viens de faire un stress test avec le logiciel Intel Processor Diagnostic Tool et tout semble ok (image en PJ)

Pour ce qui est de la CG, elle était déjà installée sur mon ancien PC et je n'ai jamais eu de problème, donc je doute que cela puisse venir de ça.

Surtout que les blue screen ont totalement cessé depuis que j'utilise 1 seule barrette au lieu des 4 donc pour moi, cela viens forcément d'un des Dimm ou d'un composant qui leur est lié.

cpu_test.png

Lien vers le commentaire
Invité
Ce sujet ne peut plus recevoir de nouvelles réponses.
  • En ligne récemment   0 membre est en ligne

    • Aucun utilisateur enregistré regarde cette page.
×
×
  • Créer...