Mode traductionMode vocal

Meta lance le modèle d'IA multimodal open-source Llama 3.2 pour le traitement d'image et de texte. Meta launches open-source multimodal AI model Llama 3.2 for image and text processing.

Meta a lancé Lama 3.2, son premier modèle d'IA multimodal open-source capable de traiter des images et du texte. Meta has launched Llama 3.2, its first open-source multimodal AI model capable of processing images and text. Il comprend des modèles de vision avec 11 milliards et 90 milliards de paramètres, et des modèles de texte légers avec 1 milliard et 3 milliards de paramètres, conçus pour divers matériels. It includes vision models with 11 billion and 90 billion parameters, and lightweight text models with 1 billion and 3 billion parameters, designed for diverse hardware. La lama 3.2 vise à améliorer les applications d'IA dans des domaines tels que la réalité augmentée et l'analyse documentaire, offrant des performances compétitives dans les tâches de reconnaissance d'image contre des rivaux comme OpenAI et Anthropic. Llama 3.2 aims to enhance AI applications in areas like augmented reality and document analysis, offering competitive performance in image recognition tasks against rivals like OpenAI and Anthropic.

Il y a 7 mois

10 Articles