Achraf Fayda, nouveau directeur général de l'ONMT    Xi Jinping est arrivé au Maroc : une escale stratégique pour l'avenir des relations sino-marocaines    Les malades face au défi du reste à charge    L'équipe du Maroc fait match nul avec l'Algérie 1-1    À la croisée du dépassement de soi et de la promotion régionale    SAR la Princesse Lalla Meryem préside la cérémonie de célébration du 25e anniversaire    Une ouverture en fanfare    Nasser Shamma nous rend fiers d'être arabes et donc poètes    Le théâtre marocain, visions esthétiques et questions philosophiques    Deux morts dans le crash d'un avion léger à l'aéroport Benslimane    Algérie : Le commandant d'une région frontalière avec le Maroc nommé chef de l'armée de terre    Système d'aides sociales : les critères d'éligibilité sont-ils devenus fous ?    Le Conseil supérieur des Oulémas tient sa 34è session ordinaire les 29 et 30 novembre à Rabat    Ajman: Le Maroc en tête du classement du Championnat arabe de golf    Glory Collision 7 : Abderrahman Barkouch relève le défi    Cinq sièges parlementaires déclarés vacants par la Cour constitutionnelle après la nomination de leurs titulaires au gouvernement    Le directeur général de l'OMS quitte un hôpital de Rio après un malaise    Moroccan female footballers shine with multiple nominations at CAF Awards 2024    Sanlam s'allie à l'établissement de paiement de CIH Bank, Lana Cash    Deux morts dans le crash d'un avion d'entrainement à Benslimane    Crimes de guerre à Gaza : La CPI émet un mandat d'arrêt contre Benjamin Netanyahu    France : Une radio fermée suite à un « incident diplomatique » avec un député marocain    Le Conseil de gouvernement adopte un projet de loi relatif à la protection du patrimoine    CAF Awards 2024: Le Maroc présent en force dans les nominations féminines    Préparation. CAN (F) Maroc 25 / Les Lionnes face à deux sparring-partners    Qualifs. CDM 26. Asie / La Palestine, surprenante ! Le crash de Qatar aux EAU !    Arbitrage du Raja-Wydad: Finalement, pourquoi pas Collina!    Le président de la Cour Constitutionnelle appelle à encourager la culture du recours à la justice constitutionnelle    Innovation : BMCE Capital Bourse lance l'application BK Bourse avec le soutien de SIX    Sahara : Le plan d'autonomie repose sur le dialogue, le droit international et l'intérêt des populations, selon le parti au pouvoir au Brésil    Morocco drops to 98th in Global Knowledge Index 2024    Moroccan YouTuber Weld Chinwiya detained amid human trafficking investigation    Comme en 2023, l'Algérie préoccupée par les contacts entre le Maroc et l'Iran    Pêche méditerranéenne : baisse des volumes mais hausse des revenus    Croissance : l'Exécutif table sur 4,2% en 2027    La Belgique expulse plus de 200 Marocains en 2024, 4x plus qu'en 2023    Un corps retrouvé au large de Nador après une tentative de migration à la nage vers Melilla    Les températures attendues ce jeudi 21 novembre 2024    Mise en avant du rôle du Maroc dans le renforcement de la souveraineté sanitaire africaine    Le temps qu'il fera ce jeudi 21 novembre 2024    Somalie: plus de 420.000 déplacés internes en 10 mois, selon le HCR    Tempête dans l'ouest du Canada: Des dizaines de milliers de foyers privés d'électricité    Mohamed Ould Errachid reçoit la présidente de l'Assemblée nationale de la République de Serbie    Le Maroc accueille une retraite du Conseil des droits de l'homme de l'ONU, une première dans la région MENA    Upfund lève 1,2 million d'euros auprès de Bpifrance, CDG Invest et MNF Ventures    Censure : le régime algérien accuse Kamel Daoud d'avoir dit la vérité sur la « décennie noire »    Rachid Benzine lauréat du «Grand Prix du Roman Métis»    Trois nouvelles salles Cinerji : le CCM investit 12 millions de dirhams pour relancer le cinéma marocain    







Merci d'avoir signalé!
Cette image sera automatiquement bloquée après qu'elle soit signalée par plusieurs personnes.



Moroccan and International researchers develop Atlas-Chat, the first language model in Darija
Publié dans Yabiladi le 02 - 10 - 2024

Atlas-Chat is the first large language model tailored for Darija, Moroccan Arabic, outperforming similar models in handling this dialect. The model was created using existing language resources and new datasets.
A team of researchers from Morocco and beyond has developed the first large language models specifically designed for Darija, Moroccan Arabic. Named «Atlas-Chat», this AI model is a nod to the Atlas Mountains, a significant symbol of Morocco.
Atlas-Chat is capable of understanding and speaking Darija. In a research paper published on ResearchGate in September, titled «Atlas-Chat: Adapting Large Language Models for Low-Resource Moroccan Arabic Dialect», the researchers explain that the model was developed by integrating existing Darija language resources, creating new datasets, and carefully translating English instructions.
Atlas-Chat-9B response example 2 (The model can understand English instructions but only responds in Darija)
The paper also highlights that their models, «Atlas-Chat-9B and Atlas-Chat-2B», outperform other cutting-edge Arabic-specialized language models, including LLaMa, Jais, and AceGPT in following instructions in Darija. The Atlas-Chat models can also perform standard Natural Language Processing (NLP) tasks, which include interpreting, manipulating, and comprehending human language.
Their findings also show that Atlas-Chat achieved a «13% performance boost over a larger 13B model on DarijaMMLU», a newly introduced evaluation suite for Darija that covers both discriminative and generative tasks.
Darija and low-resource languages
The study also observes that while large language models excel at understanding and using major languages, they often struggle with underrepresented languages, particularly Arabic dialects like Darija.
This is mostly because while Arabic boasts a rich cultural history and a complex linguistic structure, most efforts to develop Arabic-specialized models focus on bilingualism—balancing English and Modern Standard Arabic (MSA)—while often overlooking dialectal Arabic (DA).
Although DA is spoken by millions, there is a lack of data available for training large language models for it. To address this, the researchers created new datasets and evaluation tests specifically for DA.
Atlas-Chat-9B response example 1.
The research was conducted by researchers from Mohamed bin Zayed University of Artificial Intelligence (United Arab Emirates), Ecole des Mines de Rabat (Morocco), Université Mohammed VI Polytechnique (Morocco), KTH Royal Institute of Technology (Sweden), Atlas Institute for Artificial Intelligence (Morocco), and Ecole Polytechnique (France).
To inspire the development of similar models for other low-resource languages, the researchers have made all of their resources publicly available.


Cliquez ici pour lire l'article depuis sa source.