Apprentissage de contraintes sur la génération de textes par des réseaux de neurones profonds

Ce travail présente le développement d'un modèle de langage basé sur les réseaux de neurones pour la génération de poèmes, qui respecte des contraintes sur la longueur des vers. Le modèle vise à offrir une expérience poétique personnalisée en permettant à l'utilisateur de choisir librement le nombre de syllabes de chaque vers dans le poème généré.

Le chapitre initial expose les défis de la génération de poèmes par des algorithmes et l'importance des contraintes pour obtenir des vers esthétiquement plaisants.

Les objectifs du travail sont multiples : construire un modèle de langage de base, développer un système d'annotation de la longueur par des balises pour plus de flexibilité, explorer la génération de quatrains cohérents et, enfin, généraliser le modèle à des longueurs de vers différentes.

La méthodologie utilisée comprend l'utilisation de techniques d'apprentissage profond et de réseaux de neurones qui sont entraînés sur des données synthétiques générées grâce à des règles. En outre, une méthode de mesure est proposée et testée.

Les principaux résultats démontrent que le modèle est capable de générer des poèmes qui respectent les contraintes de longueur de vers avec un écart-type toujours inférieur à 0,5 syllabes. Notre méthode permet de contrôler ainsi individuellement la longueur de chaque vers d'une strophe. On observe également que la génération de vers plus longs représente un défi supplémentaire pour le modèle.

Les perspectives suggèrent d'ajouter davantage de données d'entraînement pour améliorer la performance sur les vers plus longs et d'étendre le modèle à d'autres formes de contraintes sur la structure des poèmes telles que le nombre de vers par strophe.

En conclusion, ce travail aboutit à un modèle de langage poétique prometteur, fusionnant l'art et la technologie, ouvrant ainsi la voie à de nouvelles inspirations dans le domaine de l'intelligence artificielle et de la créativité littéraire.

Etudiant: Nicolas Wichoud

Année: 2023

Département: TIC

Filière: Informatique et systèmes de communication avec orientation en Ingénierie des données

Type de formation: Plein temps

Enseignant responsable: Andrei Popescu-Belis

Institut: IICT

Téléchargements:
- Télécharger l'affiche
- Télécharger le rapport