About The Position

Et si votre aventure professionnelle commençait avec Airbus ! Vous recherchez un stage de fin d'année ou intégré dans une année de césure vous permettant de valider votre diplôme ? Nous vous proposons de travailler dans une entreprise leader mondial dans son domaine, tournée vers le digital, à la pointe de la recherche et de l'innovation ! Une offre de stage intitulée "Stage 2026 : Data Scientist - Lutte contre la Désinformation, Cadrage des Entités et Identification des Récits (h/f) " vient de s'ouvrir au sein d'Airbus Defence and Space sur son site d'Elancourt. Vous rejoindrez le département " Data Science " pour les produits Multi-Source Intelligence, en charge du développement d'outils d'analyse de documents multi-sources. Objectif L'objectif de ce stage est d'utiliser des techniques d'apprentissage automatique et/ou de prompt engineering afin d'extraire et d'identifier comment des entités sont décrites dans un article de presse (https://propaganda.math.unipd.it/semeval2025task10/). Une fois les entités et la manière dont elles sont décrites (victime, attaquant, innocent) identifiées, l'objectif sera de déterminer la narrative mise en avant dans le texte en utilisant soit des méthodes de classification standard en NLP (modèles de type BERT), soit en utilisant un LLM pour générer et grouper les narratives relatives aux entités extraites. Durant ce stage, le travail consistera à entraîner et évaluer des modèles de traitement des langues pour différentes tâches, allant de la classification à la génération de label par LLM. Le candidat devra aussi être capable d'évaluer rigoureusement différents modèles, de présenter leurs avantages et inconvénients et de choisir la meilleure approche pour réaliser la tâche. Idéalement, ce stage d'une durée de 6 mois commencera en Mars-Avril 2026. La période est communiquée à titre indicatif, et pourra être revue. Ce poste nécessite une habilitation de sécurité ou nécessite d'être éligible à une habilitation par les autorités reconnues.

Requirements

  • Informatique, Science des données, Intelligence artificielle, ou un domaine connexe.
  • Compétences en Programmation (Python)
  • Connaissances et appétence pour le Deep Learning et les librairies associées (ex : Pytorch)
  • Prise en main d'outils : LLMs, Mistral, NLP, BERT, DeBERTa, HuggingFace
  • Anglais : avancé
  • Français : courant

Responsibilities

  • Embarquement sur un projet de recherche collaboratif sur le sujet de la détection de fake news dans la presse francophone
  • Etat de l'art sur la tâche d'entity framing et l'utilisation de LLMs pour la réalisation de cette tâche
  • Conception et développement de modèles de classification et de génération sur des tâches de complexité variable (extraction d'entité, entity framing, génération de texte
  • Benchmarking de modèles, selon leur coût (taille, temps d'inférence) et leur atteinte d'une fiabilité acceptable
  • Mesure des biais et adhérence des modèles à des artefacts / capacité à générer et à gérer les biais des modèles et les biais des données.

Stand Out From the Crowd

Upload your resume and get instant feedback on how well it matches this job.

Upload and Match Resume

What This Job Offers

Career Level

Intern

Industry

Transportation Equipment Manufacturing

Number of Employees

5,001-10,000 employees

© 2024 Teal Labs, Inc
Privacy PolicyTerms of Service