Apprenez des langues naturellement grâce à des contenus frais et authentiques !

Sujets populaires
Explorer par région
Les chercheurs testent une méthode de « vaccination » de l'IA pour prévenir les comportements nuisibles dans les systèmes d'IA.
Les chercheurs testent une méthode pour empêcher l'IA de développer des traits nocifs en exposant les modèles d'IA à de petites quantités de ces traits pendant la formation, un processus qu'ils appellent « la direction préventive ».
Cette approche de « vaccination » utilise des « vecteurs persona » pour introduire et ensuite supprimer des traits indésirables, visant à rendre l'IA plus résistante aux comportements nuisibles.
L'objectif est de traiter les comportements problématiques vus dans les systèmes d'IA comme le chatbot Bing de Microsoft et le GPT-4 d'OpenAI.
7 Articles
Researchers test an AI "vaccination" method to prevent harmful behaviors in AI systems.