Apprenez des langues naturellement grâce à des contenus frais et authentiques !

Appuyez pour traduire - enregistrement

Explorer par région

flag Les chercheurs testent une méthode de « vaccination » de l'IA pour prévenir les comportements nuisibles dans les systèmes d'IA.

flag Les chercheurs testent une méthode pour empêcher l'IA de développer des traits nocifs en exposant les modèles d'IA à de petites quantités de ces traits pendant la formation, un processus qu'ils appellent « la direction préventive ». flag Cette approche de « vaccination » utilise des « vecteurs persona » pour introduire et ensuite supprimer des traits indésirables, visant à rendre l'IA plus résistante aux comportements nuisibles. flag L'objectif est de traiter les comportements problématiques vus dans les systèmes d'IA comme le chatbot Bing de Microsoft et le GPT-4 d'OpenAI.

7 Articles

Pour aller plus loin