You are using an outdated browser. For a faster, safer browsing experience, upgrade for free today.

Loading...

about event

Ecole thématique - MDD 2026
Data Management for Language Models

  • Where

    Institut d'Études Scientifiques de Cargèse - Université de Corse

  • When

  • Thematic axes
    • High-dimensional vector indexing and similarity search,
    • Data Reduction,
    • Data Provenance,
    • Data modalities and explainable AI,
    • AI agents in human-AI collaboration,
    • Conversational NL interfaces for data analysis,
    • AI regulation,
    • Green AI
      • De plus, nous organiserons un atelier sur la rédaction scientifique, les sciences, les publications, et les données ouvertes, sur le partage et archivage de ces données, sur la diffusion, et enfin sur la vulgarisation des résultats scientifiques. Nous prévoyons d’organiser une séance dynamique de posters et un gong show pendant les pauses café.
  • Le Lieu

    L'édition 2026 aura lieu à Cargese du 26 avril au 2 mai. Le lieu d’accueil est l'Institut d'Études Scientifiques à 20 minutes à pieds du village de Cargèse. Le centre est parfaitement équipé pour accueillir dans les meilleures conditions des journées de travail studieuses dans un très beau cadre. Ce site présente les locaux, ses équipements et son environnement.

    IESC

Bienvenue sur le site de l'école thématique BDA

L'école thématique « Masses de Données Distribuées » (MDD) est issue de la communauté des chercheurs en bases de données. Elle a pour but de compléter la conférence nationale annuelle « Gestion de Données — Principes, Technologies et Applications (BDA) », organisée depuis 40 ans, dont la qualité constante est reconnue nationalement et internationalement. Le comité de pilotage BDA a souhaité renforcer la composante pédagogique (tutoriels) dans le cadre d'une manifestation indépendante, volonté qui a donné naissance à l'école MDD dont la première session s'est tenue aux Houches en 2010, à Aussois en 2012, à Oléron en 2014, Urrugne en 2016, Aussois en 2018, reportée en 2020, à Bastia en 2022, et à Ceillac-en-Queyras en 2024.

Notre école thématique souhaite éclairer ces différents enjeux sociétaux en invitant des experts de diverses disciplines en informatique et en droit. Le thème général, « Data Management for Language Models » sera décliné en 8 grands axes ci-contre.

L'audience
Nous avons deux objectifs :
  • Former des étudiants en master, doctorat, des post-doctorants, et des ingénieurs de recherche. Il est important que ces profils se forment aux nouveaux défis scientifiques ainsi qu’aux écueils des modèles de langue.
  • Nous ciblons également un public hors du domaine de l’informatique, principalement les acteurs de la régulation de l’IA.
Nous couvrirons les champs de recherche à l’intersection des données et des modèles de langue allant de la production de ces données, leur exploitation et leur réutilisation afin de limiter l’impact de l’entraînement et l’utilisation répétitive de ces modèles.

L’école est ouverte également à des enseignants chercheurs et chercheurs plus confirmés dans l’objectif d’une ouverture thématique, de la création d’un réseau d’échange ou d’une reconversion. L’école s’adresse évidemment aux ingénieurs de recherche du secteur privé (R&D, startup, ...).

L’école MDD 2026 sera organisée en conjonction avec ARMADA un ITN européen (International Training Network) dont l’objectif est de former des chercheurs.

Mots-clés
Data for Language Models, Provenance in AI, Explainable AI, Techniques for Data Reduction and for Managing Data at Scale, Human-AI Collaboration and NL Interfaces, Agentic AI, AI Regulation, Green AI.

Voelas
BDA MDD 2026

Institut d'Études Scientifiques de Cargèse - Université de Corse

View map location