Illustration of person relaxing on phone
Illustration of person relaxing on phone

Florian Schottmann

Research

29 gennaio 2024

Una ricerca innovativa sulla generalizzazione in ambito di NLP: tassonomia e revisione


Nota: Questo articolo è stato scritto all’inizio del 2024 e illustra il contesto precedente alla fusione tra Textshuttle e Supertext nonché al conseguente rilancio su supertext.com.




Tra i principali desiderata che si pongono nei confronti del Natural Language Processing (NLP) figura la capacità di generalizzare correttamente. Tuttavia, non è ancora ben chiaro che cosa significhi di preciso generalizzare correttamente e come tale processo debba essere valutato, né tanto meno sono stati definiti standard per la sua valutazione. In questo articolo abbiamo gettato le basi per affrontare ambedue le questioni. Abbiamo proposto in primo luogo una tassonomia per descrivere e comprendere la ricerca sulla generalizzazione in ambito di NLP. Il nostro sistema di tassonomia si fonda su una vasta revisione della letteratura in materia di ricerca sulla generalizzazione e si articola in cinque categorie principali, in base alle quali si differenziano i vari studi: il motivo primario che ha spinto gli autori a condurre il loro studio, la tipologia di generalizzazione oggetto di ricerca, la tipologia di spostamento di dati in esame, l’origine di tale spostamento e il punto in cui esso si verifica all’interno della pipeline di modellazione. Abbiamo utilizzato la nostra tassonomia per classificare oltre 400 articoli che illustrano test condotti sulla generalizzazione, per un totale di oltre 600 esperimenti individuali. Sulla base dei risultati di tale rassegna, abbiamo fornito un’analisi approfondita che illustra lo stato dell’arte della ricerca sulla generalizzazione in ambito di NLP, formulando altresì raccomandazioni sugli aspetti che potrebbero meritare attenzione in futuro. Insieme a questo articolo, siamo lieti di presentarvi anche una pagina web in cui è possibile consultare i risultati della nostra rassegna in modo dinamico, e che intendiamo aggiornare con la pubblicazione di nuovi studi sulla generalizzazione dell’NLP. Con questo lavoro intendiamo compiere passi avanti nel fare in modo che l’innovativa sperimentazione sulla generalizzazione diventi il nuovo status quo in ambito di NLP.


L’articolo completo è disponibile su arXiv

Altri articoli
Un confronto tra le performance di traduzione di DeepL e Supertext
Research

Un confronto tra le performance di traduzione di DeepL e Supertext

5 febbraio 2025


Alex Flückiger