Illustration of person relaxing on phone
Illustration of person relaxing on phone

Alex Flückiger

Research

5. Februar 2025

Übersetzungsqualität von DeepL und Supertext – ein Vergleich


Da moderne maschinelle Übersetzungsprogramme (MT) immer häufiger auf großen Sprachmodellen (LLMs) basieren, ist eine zuverlässige Bewertung der Übersetzungsqualität mit Methoden erforderlich, die die Fähigkeit dieser Programme zur Nutzung eines erweiterten Kontexts berücksichtigen. In dieser Studie werden zwei kommerzielle MT-Systeme – DeepL und Supertext – verglichen, indem ihre Übersetzungsqualität an unsegmentierten Texten gemessen wird. Die Übersetzungsqualität wird in vier verschiedenen Sprachrichtungen von professionellen Übersetzer:innen bewertet, die die Segmente im Kontext des gesamten Dokuments beurteilen. Bei der Bewertung der Segmente selbst ist in den meisten Fällen keines der beiden Systeme klar im Vorteil. Bei der Analyse der Dokumente insgesamt liegt jedoch in drei von vier Sprachkombinationen Supertext vorne, was auf eine bessere Konsistenz bei längeren Texten hinweist. Wir fordern, dass bei der Bewertung von MT-Systemen mehr Kontext berücksichtigt wird, damit die Bewertung der Übersetzungsqualität auch die tatsächliche Praxistauglichkeit widerspiegelt.


Reserach_Figures.png

Lesen Sie das vollständige Forschungspapier auf arXiv.

Weitere Beiträge
Alles drin. Nur keine Leser:innen.
Insights

Alles drin. Nur keine Leser:innen.

29. September 2025


Fabian Dieziger