<?xml version='1.0' encoding='utf-8'?><OAI-PMH xmlns="http://www.openarchives.org/OAI/2.0/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/ http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd"><responseDate>2026-05-18T01:05:10Z</responseDate><request verb="GetRecord" metadataPrefix="oai_dc" identifier="oai:www.bilketa.eus:ark:/27020/hal-04600876">https://www.bilketa.eus/in/rest/oai</request><GetRecord><record><header><identifier>oai:www.bilketa.eus:ark:/27020/hal-04600876</identifier><setSpec>ALL</setSpec><datestamp>2025-06-05T09:20:46Z</datestamp></header><metadata> <oai_dc:dc xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:oai_dc="http://www.openarchives.org/OAI/2.0/oai_dc/" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/oai_dc/ http://www.openarchives.org/OAI/2.0/oai_dc.xsd"><dc:identifier>https://www.bilketa.eus/ark:/27020/hal-04600876</dc:identifier><dc:contributor>Laboratoire Informatique de l'Université de Pau et des Pays de l'Adour (LIUPPA) ; Université de Pau et des Pays de l'Adour (UPPA)</dc:contributor><dc:contributor>IXA NLP Group ; Universidad del País Vasco [Espainia] / Euskal Herriko Unibertsitatea [España] = University of the Basque Country [Spain] = Université du pays basque [Espagne] (UPV / EHU)</dc:contributor><dc:contributor>Université de Pau et des Pays de l'Adour (UPPA)</dc:contributor><dc:contributor>Communauté d'Agglomération Pau Béarn Pyrénées</dc:contributor><dc:contributor>Association INFORSID</dc:contributor><dc:creator>Masson, Maxime</dc:creator><dc:creator>Agerri, Rodrigo</dc:creator><dc:creator>Sallaberry, Christian</dc:creator><dc:creator>Bessagnet, Marie-Noelle</dc:creator><dc:creator>Roose, Philippe</dc:creator><dc:creator>Le Parc-Lacayrelle, Annig</dc:creator><dc:source>HAL, hal-04600876</dc:source><dc:date>2024-05-28</dc:date><dc:description>L’influence grandissante des réseaux sociaux dans le domaine du tourisme souligne le besoin d'approches efficaces en traitement automatique du langage naturel (TALN) pour exploiter cette ressource. Toutefois, transformer des textes multilingues, informels et non structurés en connaissances structurées reste un défi, notamment à cause de la nécessité de données annotées pour l'entraînement des modèles. Cet article examine différentes techniques et modèles de TALN basés sur l'apprentissage pour optimiser les performances tout en réduisant le besoin de données annotées manuellement. Un nouveau jeu de données multilingues (français, anglais, espagnol) spécifique au tourisme a été créé, se concentrant sur la région du Pays Basque. Ce jeu de données inclut des tweets avec des annotations manuelles sur les entités nommées spatiales, les concepts thématiques touristiques et les sentiments. Une comparaison des méthodes de fine-tuning et d'apprentissage few-shot avec des modèles multilingues indique que les techniques few-shot peuvent produire de bons résultats avec peu d'exemples annotés. Les expérimentations menées sur ce jeu de données suggèrent la possibilité d'appliquer les méthodes de TALN à base d’apprentissage à divers domaines, tout en réduisant le besoin d'annotations manuelles et évitant les complexités des méthodes basées sur des règles.</dc:description><dc:description>International audience</dc:description><dc:identifier>https://hal.science/hal-04600876</dc:identifier><dc:identifier>https://hal.science/hal-04600876v1/file/actes_inforsid2024-70-87-3-18.pdf</dc:identifier><dc:format>Actes de conférence | Mintzaldietako aktak</dc:format><dc:format>Actes de conférence | Mintzaldietako aktak</dc:format><dc:relation>vignette : https://www.bilketa.eus/in/rest/Thumb/image?id=ark:/27020/hal-04600876&amp;mat=articleNum</dc:relation><dc:language>fre</dc:language><dc:rights>http://hal.archives-ouvertes.fr/licences/copyright/Archive ouverte HAL | HAL artxibo irekia</dc:rights><dc:coverage>Nancy, France</dc:coverage><dc:subject>Fine-Tuning</dc:subject><dc:subject>Large Language Model (LLM)</dc:subject><dc:subject>Tourisme</dc:subject><dc:subject>Apprentissage Few-Shot</dc:subject><dc:subject>Modèle de Langage Masqué (MLM)</dc:subject><dc:subject>Multilinguisme</dc:subject><dc:subject>[INFO]Computer Science [cs]</dc:subject><dc:title>Stratégies optimales pour l'analyse multidimensionnelle de contenus multilingues issus des réseaux sociaux</dc:title><dc:title>Optimal Strategies for the Multidimensional Analysis of Multilingual Content from Social Media</dc:title></oai_dc:dc></metadata></record></GetRecord></OAI-PMH>