Sahara : Washington appuie l'initiative marocaine d'autonomie, une solution «sérieuse, crédible et réaliste»    Hammouchi reçoit le Conseiller militaire supérieur britannique pour le Moyen-Orient et l'Afrique du Nord    Maroc : S&P anticipe des perspectives de croissance positives    Maroc : Les Assises des industries culturelles et créatives ouvrent leur deuxième édition    Tourisme : les recettes en devises à un nouveau record de 17 MMDH en août (+20%)    Maroc : Après les islamistes, le PPS dénonce l'assassinat de Hassan Nasrallah    Cérémonie en l'honneur de l'équipe nationale de futsal de retour d'Ouzbékistan    Switzerland schedules three meetings on Sahara at Security Council this October    Moroccan police chief receives Senior British Military Advisor for Middle East, North Africa    Agadir : Quatre personnes arrêtées pour agression sexuelle sur une jeune touriste    Des chercheurs marocains et internationaux développent Atlas-Chat, la première IA en Darija    Accord MTEDD-CDG : vers une économie sobre en carbone et des infrastructures écologiques    Banques centrales : M. Jouahri met en avant au Caire l'expérience marocaine en matière de traitement des questions climatiques    Sahara : le think-tank MENAF conseille au gouvernement britannique de soutenir le plan d'autonomie    Antonio Guterres déclaré « persona non grata » par Israël, et interdit d'entrer dans le pays    Mexique : Investiture de Claudia Sheinbaum    Inondations : Aides financières en faveur des familles sinistrées pour reconstruire leurs habitations    Lions de la Téranga : Aliou Cissé débarqué d'urgence du navire !    La CAF lance la campagne « Protect The Dream » pour lutter contre le trafic et l'exploitation des joueurs    Séisme d'Al-Haouz. En application des Hautes Instructions Royales, prolongation de 5 mois de la durée du versement des aides d'urgence    Inauguration de la section consulaire de l'ambassade du Maroc après des travaux de rénovation    Al Barid Bank : Montée en flèche des résultats au premier semestre 2024    Mimoun Azzouz, un Marocain à la tête du centre de thérapie génique de Sheffield au Royaume-Uni    Un symbole vivant d'espoir et de solidarité pour les orphelins du séisme d'Al Haouz    Crise des étudiants en médecine : le ministère fait des concessions pour sauver la rentrée    El Guergarat: Mise en échec d'une tentative de trafic international de drogues dures et saisie de plus de 37 kg de cocaïne (source sécuritaire)    Aéronautique : Le groupe Aciturri inaugure son site de production à Midparc    Industries Culturelles et Créatives : Entre patrimoine et innovation, le Maroc à la croisée des chemins    Avant le « 7 octobre », cette réalité historique impossible à cacher    LdC : Le Real Madrid sans Brahim contre Lille, l'ASM de Ben Seghir face au Dynamo de Mmae    Szczęsny sort de sa retraite pour rejoindre les rangs du FC Barcelone    Le rappeur américain P.Diddy accusé d'agressions sexuelles par 120 nouvelles victimes    Festival de la Francophonie 2024 : La France priorise la langue maternelle et le multilinguisme face aux enjeux globaux    Présidentielle en Tunisie. Incarcéré, le candidat Ayachi Zammel, condamné à 12 ans de prison    La Tanzanie répare les dégâts d'El Niño    Le Canada va surtaxer des produits d'acier et d'aluminium chinois    CAN U17. Les éliminatoires prévues en novembre à Casablanca    Espagne: Andrés Iniesta annonce sa retraite à 40 ans (Médias)    Somalie-USA: signature d'un accord d'aide au développement de 68,5 millions USD    Marrakech: Rencontre de communication à l'occasion du 69è anniversaire du lancement des opérations de l'armée de libération dans le Nord    CGEM lance « CGEM for Tech Founders » : Un nouvel élan pour les start-ups marocaines    Kenya. Le sport et le cinéma s'allient le temps d'un Festival    Botswana. L'industrie cinématographique entame sa mue    Rétro-Verso : Mers Sultan ou le charme discret d'un quartier casablancais    Le remaniement ministériel, l'ultime espoir des avocats dans leur combat avec Ouahbi ?    Santé mentale: L'ONU pour des environnements de travail « sûrs et sains »    Equipe nationale A : Conférence de presse du sélectionneur national ce jeudi    El Pais vante les charmes d'Essaouira et ses atouts touristiques    







Merci d'avoir signalé!
Cette image sera automatiquement bloquée après qu'elle soit signalée par plusieurs personnes.



Des chercheurs marocains et internationaux développent Atlas-Chat, la première IA en Darija
Publié dans Yabiladi le 02 - 10 - 2024

Atlas-Chat est le premier grand modèle linguistique adapté à la Darija, l'arabe marocain, surpassant des modèles similaires dans la gestion de ce dialecte. Le modèle a été créé en utilisant des ressources linguistiques existantes et de nouveaux jeux de données.
Une équipe de chercheurs du Maroc et d'ailleurs a développé les premiers grands modèles de langage spécifiquement conçus pour la Darija, l'arabe marocain. Nommé «Atlas-Chat», ce modèle d'IA est un clin d'œil aux montagnes de l'Atlas, symbole du Maroc.
Atlas-Chat est capable de comprendre et de parler la Darija. Dans un article de recherche publié sur ResearchGate en septembre, intitulé «Atlas-Chat : Adapter les grands modèles de langage pour le dialecte arabe marocain à faibles ressources», les chercheurs expliquent que le modèle a été développé en intégrant des ressources linguistiques existantes en Darija, en créant de nouveaux ensembles de données et en traduisant soigneusement les instructions en anglais.
Atlas-Chat-9B response example 2 (The model can understand English instructions but only responds in Darija)Exemple de réponse d'Atlas-Chat-9B 2 (Le modèle peut comprendre les instructions en anglais mais ne répond qu'en Darija)
L'article souligne également que leurs modèles, «Atlas-Chat-9B et Atlas-Chat-2B», surpassent d'autres modèles de langage spécialisés en arabe de pointe, y compris LLaMa, Jais et AceGPT dans le suivi des instructions en Darija. Les modèles Atlas-Chat peuvent également effectuer des tâches standard de traitement du langage naturel (NLP), qui incluent l'interprétation, la manipulation et la compréhension du langage humain.
Leurs résultats montrent également qu'Atlas-Chat a atteint une «augmentation de performance de 13 % par rapport à un modèle plus grand de 13B sur DarijaMMLU», une nouvelle suite d'évaluation pour la Darija qui couvre à la fois des tâches discriminatives et génératives.
La Darija et les langues à faibles ressources
L'étude observe également que bien que les grands modèles de langage excellent dans la compréhension et l'utilisation des langues majeures, ils ont souvent du mal avec les langues sous-représentées, en particulier les dialectes arabes comme la Darija. Cela est principalement dû au fait que bien que l'arabe bénéficie d'une riche histoire culturelle et d'une structure linguistique complexe, la plupart des efforts pour développer des modèles spécialisés en arabe se concentrent sur le bilinguisme—équilibrant l'anglais et l'arabe standard moderne (MSA)—tout en négligeant souvent l'arabe dialectal (DA).
Bien que l'arabe dialectal soit parlé par des millions de personnes, il y a un manque de données disponibles pour entraîner de grands modèles de langage pour celui-ci. Pour y remédier, les chercheurs ont créé de nouveaux ensembles de données et des tests d'évaluation spécifiquement pour le DA.
Atlas-Chat-9B response example 1.Exemple de réponse d'Atlas-Chat-9B 1.
La recherche a été menée par des chercheurs de l'Université Mohamed bin Zayed d'intelligence artificielle, de l'Ecole des Mines de Rabat, de l'Université Mohammed VI Polytechnique, du KTH Royal Institute of Technology, de l'Atlas Institute for Artificial Intelligence et de l'Ecole Polytechnique.
Pour inspirer le développement de modèles similaires pour d'autres langues à faibles ressources, les chercheurs ont rendu toutes leurs ressources disponibles au public.


Cliquez ici pour lire l'article depuis sa source.