Apple lance le modèle d'édition d'images open source MGIE, alimenté par l'IA, avec des instructions en langage naturel, en collaboration avec des chercheurs en UC.

Apple a lancé un nouveau modèle d'édition d'images IA, MGIE, en collaboration avec des chercheurs de l'Université de Californie. MGIE, qui signifie MLLM-Guided Image Editing, utilise des modèles multimodaux de grand langage (MLLM) et permet aux utilisateurs d'éditer des images en fonction d'instructions en langage naturel. Le modèle a été présenté dans un article lors de la Conférence internationale sur les représentations d'apprentissage 2024, démontrant sa capacité à améliorer les métriques automatiques et l'évaluation humaine tout en maintenant l'efficacité de l'inférence compétitive.

February 07, 2024
4 Articles

Pour aller plus loin