meridian-shaft Jump to content
Forums

Problème pilote NVIDIA après mise à jour de Debian 11.3


Solved

Recommended Posts

Bonjour à toutes et à tous,

Suite à une mise à jours de Debian, je n'arrive plus à faire fonctionner ma carte graphique. Juste après la mise à jours, mon écran secondaire n'était plus reconnus et la commande nvidia-detect m'indique qu'il faut que j'installe les pilotes.

En fait, il s'agissait de 2 mises à jours d'affilés, voilà un screenshot de la seconde mise à jours :

363774426_Capturedcrande2022-09-0418-00-07.png.4bd41afd1ef67fb0cc6f4b65dbd8b119.png

J'ai déjà eu des soucis avec la procédure décrite dans l'article sur l'installation des pilotes NVIDIA. Nous avions finis par résoudre le problème avec @Tulburite en installant non pas le driver 390xxx (recommandé) mais le 470xxx. Donc cette fois ci, je tente directement d'installer le 470xxx, avec ma propre procédure.

1. Listing des paquets NVIDIA :

apt list --installed '*nvidia*'

2. Suppression de tout les paquets NVIDIA :

apt update
apt remove '^nvidia'
apt autoremove
apt-get purge 'nvidia*'
apt autoremove
sudo apt-get purge 'libnvidia*'
apt autoremove
apt list --installed '*nvidia*'

3. Redémarrage du PC :

systemctl reboot

NB : Après le reboot le deuxième écran branché à la GPU, qui était inutilisable, se réactive.

5. Avec Synaptic, j'installe tout les paquets NVIDIA correspondant au driver 470, soit 55 nouveaux paquets.

NB : Pendant l'installation, un message d'avertissement m'indique que le module "nouveau" entre en conflit avec le module non libre "nvidia". La manière la plus simple de corriger est de redémarrer une fois l'installation terminée.

6. Redémarrage du PC.

7. Retour à la case départ...

Je pense que je vais provisoirement tout re-supprimer pour retrouver le second écran, en attendant de trouver une solution, et d'avoir du temps pour m'y pencher. Est-ce que quelqu'un aurait une piste de résolution ?

Je me demande si je ne ferrais pas mieux de trouver une autre carte graphique, ayant moins de problème avec Linux. Une AMD/ATI par exemple ? Un modèle plus récent ? J'ai lu que par rapport à NVIDIA, AMD "garantit une compatibilité supérieure et un choix de pilotes fiables, qu’ils soient open source ou propriétaires." (source : blog FrancoAndroid).

Link to comment

Bonjour,

Comme je peux voir selon ta capture d'écran, il y a eu une mise à jour du noyau de ta Debian, avant de tout supprimer, il serait intéressant de démarrer ta machine avec l'ancien noyau. Pour cela au démarrage, tu appuies sur la touche "esc" pour ouvrir les options de grub, et tu bootes sur un autre noyau.

Il faut simplement espérer que tu n'as pas supprimés les noyaux soit avec le terminal ou avec une application du genre "stacer" ou autre

Link to comment

Bonjour Tulburite,

Je viens d'essayer d'aller dans les options de GRUB avec la touche "échap" et aussi avec les flèches, pour aller à la section "Advanced options for Debian GNU/Linux" mais l'ordi à planté.

Quand je suis dans le menu GRUB, dès que je fais autre chose qu'attendre que l'OS démarre, l'ordi plante. J'ai essayé en appuyant sur "Entrée" par exemple et ça plante. Je suis obligé d'éteindre le PC en laissant appuyer le bouton d'allumage.
 

Link to comment

J'ai eu de nouveaux problèmes de plantage. Une première fois lors de l'utilisation d'un logiciel de modélisation 3D, sur le coup j'ai trouvé ça logique si la carte graphique n'est pas en plein capacité. Puis le PC à planté de nouveau, à plusieurs reprises, quelques temps après avoir redémarré, avec simplement le navigateur web, le navigateur de fichier ou le terminal d'ouvert.

Je pense qu'il y a un problème avec le nouveau noyau effectivement. Par contre, impossible de faire quelque chose depuis GRUB donc je vais devoir trouver un autre moyen.

Link to comment

Après avoir rétrogradé mon noyau, j'ai voulu utiliser Synaptic pour faire la réinstallation des drivers. Donc j'ai sélectionné tout ce que j'avais "pour réinstallation" mais ça n'a pas semblé fonctionné. Le terminal affichait un message d'erreur :

E: Impossible de corriger les problèmes, des paquets défectueux sont en mode « garder en l'état ».
E: Impossible de corriger les problèmes, des paquets défectueux sont en mode « garder en l'état ».
E: Impossible de corriger les dépendances
E: Impossible de verrouiller le répertoire de téléchargement

Du coup, je décide de procéder à la désinstallation complète des paquets NVIDIA avec apt remove '^nvidia', puis apt autoremove, puis apt-get purge 'nvidia*', puis apt-get purge 'libnvidia*' et enfin systemctl reboot.

Là je flippe un peu parce que mon ordi se met à ramer et planter très facilement. Je m'en sors en débranchant un écran et en évitant d'ouvrir plus de 2 fenêtre.

J'utilise Synaptic pour installer tout les paquets NVIDIA qui contiennent "470" et leurs dépendances. Avec quelques autres comme nvidia-detect et nvidia-smi pour détecter la carte. Résumé : 69 nouveaux paquets, 882 MB utilisés, 0B télécharchés.

Au redémarrage du PC, la résolution de mon écran est passé à 1024 x 768 au lieu de 1920 x 1080. La commande nvidia-smi ne trouve pas la carte graphique... retour à la case départ.

 

Link to comment

En changeant de prise HDMI la résolution est revenue, c'était une histoire de configuration.

J'ai utilisé la commande apt list --installed '*nvidia*' pour repérer les paquets manquant par rapport à ce que j'avais avant de faire la première suppression. Il manquait 9 paquets : libnvidia-allocator1, libnvidia-compiler, libnvidia-encode1, libnvidia-fbc1, libnvidia-opticalflow1, nvidia-cuda-mps, nvidia-libopencl1, nvidia-opencl-icd et nvidia-xconfig.  Et par contre j'en ai 2 en plus : libnvidia-wayland-client et nvidia-driver, qui n'étaient pas présents avant.

J'ai tout remis comme avant, mais rien n'a changé au niveau de la détection de la carte graphique.

Edited by QuentinPlsn
Link to comment

J'ai retenté une installation avec :

# apt purge "*nvidia*"
systemctl reboot

Puis en cochant les paquets 470xxx dans Synaptic. Ça n'a pas fonctionné, la commande nvidia-smi ne peu pas communiquer avec la GPU.

Je ne sais pas si c'est important, mais pendant l'installation du paquet nvidia-smi, faite une fois la ré-installation terminée, j'ai eu un avertissement dans la console avec "le groupe de liens nvidia est cassé"

update-alternatives: avertissement: forçage de la réinstallation de l'alternative /usr/lib/nvidia/current car le groupe de liens nvidia est cassé


 

Edited by QuentinPlsn
Link to comment

Bonjour,

Je me pose une question, es-tu pas entrain d'essayer d'installer les drivers prioritaires ainsi que les drivers alternatifs voir éventuellement les drivers libres pour Debian et que ta distribution perde les pédales.

Je te propose de tout supprimer via le terminal et de contrôler via synaptic que tout soit réellement supprimé, y compris les résidus de configuration, de faire un grand nettoyage avec stacer et même avec bleachbit et de repartir sur des bonnes bases.

Link to comment

Bonjour @Tulburite,

Merci pour ta présence quotidienne pour mon problème. Je viens de terminer la procédure, malheureusement sans résultats probants. Ci-dessous un historique des opérations.

1. Le ménage.

1.1. Installation de stacer, en AppImage et de bleachbit avec le fichier DEB.

dpkg -i bleachbit_4.4.2-0_all_debian11.deb
apt install -f

1.2. Suppression des paquets NVIDIA, et CUDA avec apt, puis redémarrage.

apt update
---
apt remove '^nvidia'
apt remove 'nvidia*'
apt remove 'libnvidia*'
apt remove nvidia-cuda-toolkit
---
apt autoremove
---
apt purge '^nvidia'
apt purge 'nvidia*'
apt purge 'libnvidia*'
apt purge nvidia-cuda-toolkit
---
systemctl reboot

NB : au démarrage du PC, je dois débrancher-rebrancher ma souris pour pouvoir l'utiliser.

Vérification dans Synaptic : quand je déroule la liste des paquets, il reste 3 paquets associé à NVIDIA. Je sélectionne firmware-miscnonfree et vdpau-driver-all pour suppression complète mais je laisse xserver-xorg-video-nouveau pour ne rien risquer.

a.thumb.png.7e41bddc2d53e734966afe7c36613dab.png

1.3. Suppression des résidus de configuration via Synaptic, dans l'onglet 'Etat' à la section "Non installés (résidus de configuration)" je supprime les 22 paquets affichés.

1189075777_Capturedcrande2022-09-0906-08-34.thumb.png.3522fcb177fb454ebbfcb42c85012bf0.png

1.4. Nettoyage avec Stacer -> System Cleaner qui supprime 11.7 Go de fichiers.

1175418853_Capturedcrande2022-09-0906-10-22.png.d0876c88afaee63e1c2eda4d5cfacdf8.png

1.5. Grand nettoyage avec BleachBit. Je coche tout pour être sûr de ne rien oublier (Analyse approfondie, APT, Bash, Brave, Firefox, etc.).

1431771734_Capturedcrande2022-09-0907-37-08.thumb.png.8202305fbd9de3d3faf92eb220944fb4.png

NB : le nettoyage prends plus d'une heure. J'ai pas mal d'erreurs N°13, permission non accordé, au début seulement. Puis ponctuellement j'ai des erreurs N°2, aucun fichier ou dossier de ce type.

1.6. Redémarrage du PC.

NB : en tapant "nvidia" dans la barre de recherche du navigateur de fichiers, je trouve quelques dossiers et fichiers, que je décide de supprimer. Ce sont pour la plupart des fichiers contenus dans des applications (fichiers cachés).

1682469796_Capturedcrande2022-09-0907-43-24.png.b7db9db32c76eb4f1ccb943da9e8e210.png

2. La procédure

Les dépôts contrib et non-free sont bien activées.

199402454_Capturedcrande2022-09-0907-47-59.png.a7ae6ed7c501a428fdf20fc3a7d2b611.png

2.1. Mise à jour de la liste des paquets. NB : quelques erreurs on dirait.

[email protected]:/home/quentin# apt update
Réception de :1 file:/var/cuda-repo-debian11-11-7-local  InRelease [1 575 B]
Réception de :1 file:/var/cuda-repo-debian11-11-7-local  InRelease [1 575 B]
Ign :2 http://ftp.fr.debian.org/debian stretch InRelease
Ign :3 http://ppa.launchpad.net/oguzhaninan/stacer/ubuntu kinetic InRelease    
Atteint :4 http://security.debian.org/debian-security bullseye-security InRelease
Atteint :5 http://deb.debian.org/debian bullseye InRelease                     
Atteint :6 http://ftp.fr.debian.org/debian stretch Release                     
Atteint :7 http://deb.debian.org/debian bullseye-updates InRelease             
Atteint :8 https://brave-browser-apt-release.s3.brave.com stable InRelease     
Atteint :9 http://deb.debian.org/debian bullseye-backports InRelease           
Err :10 http://ppa.launchpad.net/oguzhaninan/stacer/ubuntu kinetic Release     
  404  Not Found [IP : 185.125.190.52 80]
Ign :12 https://developer.download.nvidia.com/compute/cuda/repos//x86_64  InRelease
Err :13 https://developer.download.nvidia.com/compute/cuda/repos//x86_64  Release
  404  Not Found [IP : 152.199.20.126 443]
Lecture des listes de paquets... Fait
E: Le dépôt http://ppa.launchpad.net/oguzhaninan/stacer/ubuntu kinetic Release n'a pas de fichier Release.
N: Les mises à jour depuis un tel dépôt ne peuvent s'effectuer de manière sécurisée, et sont donc désactivées par défaut.
N: Voir les pages de manuel d'apt-secure(8) pour la création des dépôts et les détails de configuration d'un utilisateur.
E: Le dépôt https://developer.download.nvidia.com/compute/cuda/repos//x86_64  Release n'a pas de fichier Release.
N: Les mises à jour depuis un tel dépôt ne peuvent s'effectuer de manière sécurisée, et sont donc désactivées par défaut.
N: Voir les pages de manuel d'apt-secure(8) pour la création des dépôts et les détails de configuration d'un utilisateur.

2.2. Installation du paquet nvidia-driver puis redémarrage.

apt install nvidia-driver firmware-misc-nonfree
systemctl reboot

3. Résultats

3.1. Commande nvidia-detect.

Detected NVIDIA GPUs:
2d:00.0 VGA compatible controller [0300]: NVIDIA Corporation GP107GL [Quadro P400] [10de:1cb3] (rev a1)

Checking card:  NVIDIA Corporation GP107GL [Quadro P400] (rev a1)
Your card is only supported up to the 390 legacy drivers series.
Your card is also supported by the Tesla 440 drivers series.
Your card is also supported by the Tesla 418 drivers series.
It is recommended to install the
    nvidia-legacy-390xx-driver
package.

3.2. Commande nvidia-smi.

NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.


 

Edited by QuentinPlsn
Link to comment

Bonjour,

Il doit y avoir un certain "merdier" dans ta distribution… je m'explique

Tu as une Debian 11 x, nom de code Bullseye

Quand je vois une de tes captures d'écran, je suis surpris de voir ceci

Le 09/09/2022 à 08:13, QuentinPlsn a dit :
Ign :2 http://ftp.fr.debian.org/debian stretch InRelease
Ign :3 http://ppa.launchpad.net/oguzhaninan/stacer/ubuntu kinetic InRelease    
Atteint :4 http://security.debian.org/debian-security bullseye-security InRelease
Atteint :5 http://deb.debian.org/debian bullseye InRelease                     
Atteint :6 http://ftp.fr.debian.org/debian stretch Release                     
Atteint :7 http://deb.debian.org/debian bullseye-updates InRelease             
Atteint :8 https://brave-browser-apt-release.s3.brave.com stable InRelease     
Atteint :9 http://deb.debian.org/debian bullseye-backports InRelease  

Tu as encore des liens qui pointent vers stretch...

Je n'utilise pas Debian sauf avec une machine virtuelle et au niveau de l'installation du pilote Nvidia, je suis bloqué au niveau de VirtualBox.

Afin de pouvoir t'aider un peu plus, je vais installer Debian sur un vieux portable qui traine, mais qui a une carte graphique Nvidia :-)

Edited by Tulburite
Link to comment

Bonjour,

Je me permets de revenir à la charge concernant les drivers Nvidia sur ta machine.

Je viens d'installer chez ma soeur cet après-midi une distribution Debian sur son portable Dell, et comme je n'utilise pas cette distribution j'ai suivi à la lettre cet article pour cette installation.

Bon j'ai procédé à une nouvelle installation en formatant son SSD mais ça marche très bien, et sa carte est reconnue sans problème.

 

Edited by Tulburite
Link to comment

Bonjour @Tulburite,

Ah oui effectivement, il doit y avoir un problème quelque part dans ma distribution !

En tout cas je n'ai pas encore essayé avec le paquet xserver-xorg-video-nvidia, qui est décrit dans l'article. Je vais faire une tentative en repartant de zéro et en suivant la même procédure.

Pour mon problème de distribution, qu'est ce que tu recommanderai ? Une réinstallation complète de l'OS ? C'est peu-être pour ça que GRUB fonctionnait mal avec les derniers noyaux ?

 

 

Link to comment

Je viens d'essayer avec la procédure décrite dans l'article, sans succès. Ci-dessous la suite de ligne de commande que j'ai tapé.

apt update
apt remove '^nvidia'
apt remove 'nvidia*'
apt remove 'libnvidia*'
apt remove nvidia-cuda-toolkit
apt autoremove
apt purge '^nvidia'
apt purge 'nvidia*'
apt purge 'libnvidia*'
apt purge nvidia-cuda-toolkit
systemctl reboot
apt update
apt upgrade
apt install xserver-xorg-video-nvidia
systemctl reboot

Ensuite les commandes lsmod | grep nvidia et nvidia-smi ne donnent rien. Puis avec la commande ls /lib/modules/$(uname -r)/updates/dkms qui permet de vérifier la présence que le module nvidia est bien installé pour le noyau j'ai :

ls: impossible d'accéder à '/lib/modules/5.10.0-15-amd64/updates/dkms': Aucun fichier ou dossier de ce type

Je n'arrive pas à utiliser modprobe pour charger le module manuellement.

[email protected]:/home/quentin# cd /lib/modules/$(uname -r)/updates/dkms
bash: cd: /lib/modules/5.10.0-15-amd64/updates/dkms: Aucun fichier ou dossier de ce type
[email protected]:/home/quentin# modprobe nvidia
bash: modprobe : commande introuvable
[email protected]:/home/quentin# apt install modprobe
Lecture des listes de paquets... Fait
Construction de l'arbre des dépendances... Fait
Lecture des informations d'état... Fait      
E: Impossible de trouver le paquet modprobe

 

Link to comment

Bonjour @QuentinPlsn

Il y a 11 heures, QuentinPlsn a dit :

Pour mon problème de distribution, qu'est ce que tu recommanderai ? Une réinstallation complète de l'OS ? C'est peu-être pour ça que GRUB fonctionnait mal avec les derniers noyaux ?

Personnellement, je serais à ta place, je ferais une clean install de Debian parce qu'à force d'installer, de désinstaller les drivers Nvidia, je suppose que ta distribution ne sait plus comment elle s'appelle :-)

Si tu pars dans cette direction, il faut vraiment faire ce que Debian recommande pour installer les drivers prioritaires, ne pas faire immédiatement une commande du genre "autoremove" à la suite d'une mise à jour, Linux permet de démarrer sur un autre noyau si tu as des problèmes de boot, enfin le terminal, c'est très bien, mais il faut vraiment savoir ce que l'on fait.

Je peux t'accompagner dans cette démarche si tu le désires.

Link to comment

Bonjour @Tulburite,

Je vais partir dans cette direction et faire une clean install de Debian 11. J'ai besoin de mon PC pour travailler jusqu'à samedi, donc je ne toucherais à rien avant ce week-end. Je veux bien être accompagné, si tu pense qu'il y a des pièges à éviter, mais je pense pouvoir y arriver.

J'imagine que la première étape sera de faire une sauvegarde de tout mes fichiers, pour ensuite formater mon SSD, où est installée Debian. J'ai également deux HDD de stockage, qui contiennent des films et des musiques. Et un autre SSD avec Windows 10 dessus. Mais ceux là, je n'ai pas à y toucher normalement ?

1954683706_Capturedcrande2022-09-1414-01-29.png.2dc9855ae6abd89591e751601ca77fe8.png

Ensuite, pour l'installation de Debian 11, je compte suivre la procédure décrite dans l'article du Crabe, qui m'a l'air assez complet.

Link to comment

Bonjour @QuentinPlsn,

Oui, la toute première chose à faire, c'est la sauvegarde de tes documents bien entendu.

Ensuite pour éviter les accidents, si j'étais toi, je débrancherais tous les HDD/SSD de ta machine sauf le HDD/SSD ou tu vas réinstaller Debian (et tu le laisses connecté au même endroit), comme ça, tu installes ta distribution et tu installes le secteur de boot sur le même HDD/SSD.

Une fois l'installation terminée, tu reconnectes aux mêmes endroits tes différents HDD/SSD internes, tu démarres ta machine sur Debian (vu que tu n'as pas changé d'emplacement tes HDD/SSD, l'amorçage doit se faire dessus) et pour faire reconnaitre Windows 10, tu fais un upgrade de grub avec la commande suivante :

upgrade-grub

Après, il faudra procéder à l'installation des drivers Nvidia, mais ça on peut regarder ensemble dans un second temps.

  • J'aime 1
Link to comment

Bonjour @Tulburite, et ceux qui  liront ce fils de discussion,

J'ai procédé à la réinstallation de mon OS avec la dernière image ISO disponible sur le site de Debian (debian-11.5.0-amd64-netinst.iso). Je pense que ça à fait du bien à ma config : plus de message d'erreur au démarrage et j'ai des bugs qui sont partis, notamment la mise en veille qui dysfonctionnait.

Concernant l'installation des pilotes Nvidia, aucun soucis. Mais par rapport à la semaine dernière, j'ai changé de carte graphique pour une RTX 2070. Comme elle est plus récente, j'ai pu installer les drivers par défaut "nvidia-driver" en suivant la procédure classique.

+-----------------------------------------------------------------------------+
| NVIDIA-SMI 470.141.03   Driver Version: 470.141.03   CUDA Version: 11.4     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0  NVIDIA GeForce ...  On   | 00000000:2D:00.0  On |                  N/A |
|  0%   43C    P8    24W / 185W |    481MiB /  7981MiB |     28%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+
                                                                               
+-----------------------------------------------------------------------------+
| Processes:                                                                  |
|  GPU   GI   CI        PID   Type   Process name                  GPU Memory |
|        ID   ID                                                   Usage      |
|=============================================================================|
|    0   N/A  N/A      1261      G   /usr/lib/xorg/Xorg                209MiB |
|    0   N/A  N/A      1387      G   /usr/bin/gnome-shell               65MiB |
|    0   N/A  N/A      7423      G   ...013997728973914087,131072      180MiB |
|    0   N/A  N/A     19193      G   ...yuVZI/usr/bin/FreeCADLink       22MiB |
+-----------------------------------------------------------------------------+

On ne saura pas au final ce qui a résolut le problème : le changement de GPU ou la ré-installation de l'OS ; mais en tout cas c'était instructif de chercher. Je retiens pour la prochaine fois de faire attention aux mises à jours, surtout du noyau, puis réfléchir avant de supprimer n'importe quel paquet.

Merci pour ton aide @Tulburite

Link to comment

Bonjour,

Je suis super content pour toi que ta Debian roule comme une horloge.

Il y a 7 heures, QuentinPlsn a dit :

On ne saura pas au final ce qui a résolut le problème : le changement de GPU ou la ré-installation de l'OS

Perso, je penche pour la réinstallation de l'OS.

Bonne continuation avec le pingouin.

Link to comment
Guest
This topic is now closed to further replies.
  • Recently Browsing   0 members

    • No registered users viewing this page.
×
×
  • Create New...