Analyse automatique de la structure d'une présentation

Ce travail de bachelor avait pour objectif d'analyser automatiquement la structure des présentations à partir de transcriptions automatiques. Trois méthodes sont explorées : l'utilisation du modèle de Transformers BertForNextSentencePrediction, les embeddings de BERT avec la similarité cosinus et la méthode de segmentation linéaire proposée dans le package Ruptures. Les métriques d'évaluation utilisées sont les scores Pk et WindowDiff utilisant une fenêtre coulissante. Les résultats préliminaires montrent que les métriques de précision et rappel ne sont pas adaptées à cette tâche spécifique.

Les scores moyens obtenus sur les données du corpus AMI sont : NextSentencePrediction (0.42, 0.43), Embeddings (0.39, 0.41) et Segmentation linéaire (0.39, 0.44). Les embeddings ont donc une performance légèrement supérieure. Ces scores sont conformes aux standards de l'état de l'art en matière de segmentation des transcriptions automatiques. Cependant, comme la taille de fenêtre utilisée joue un rôle déterminant dans les scores, il convient de se concentrer sur l'amélioration observée entre les méthodes plutôt que sur les valeurs obtenues. Les limites de ces méthodes résident dans leur focalisation sur les paires de phrases sans prendre en compte le document dans son ensemble lors de la détermination des bornes de segmentation.

Pour obtenir de meilleurs résultats, plusieurs pistes sont possibles : perfectionner la segmentation des phrases pour corriger les erreurs introduites par les transcriptions automatiques ; inclure les quadruplets de phrases consécutives pour fournir un contexte plus large ; combiner les résultats des trois méthodes en utilisant un système de vote pour déterminer les bornes de segmentation, pour accroitre ainsi la robustesse des segmentations obtenues.

Il est essentiel de poursuivre les recherches dans ce domaine pour améliorer les performances actuelles.

Etudiant: Erica Ludivine Akoumba

Année: 2023

Département: TIC

Filière: Informatique et systèmes de communication avec orientation en Ingénierie des données

Type de formation: Plein temps

Partenaire externe: TALK

Enseignant responsable: Andrei Popescu-Belis

Institut: IICT

Ce travail est confidentiel