Übersetzungsqualität von DeepL und Supertext – ein Vergleich

Da moderne maschinelle Übersetzungsprogramme (MT) immer häufiger auf großen Sprachmodellen (LLMs) basieren, ist eine zuverlässige Bewertung der Übersetzungsqualität mit Methoden erforderlich, die die Fähigkeit dieser Programme zur Nutzung eines erweiterten Kontexts berücksichtigen. In dieser Studie werden zwei kommerzielle MT-Systeme – DeepL und Supertext – verglichen, indem ihre Übersetzungsqualität an unsegmentierten Texten gemessen wird. Die Übersetzungsqualität wird in vier verschiedenen Sprachrichtungen von professionellen Übersetzer:innen bewertet, die die Segmente im Kontext des gesamten Dokuments beurteilen. Bei der Bewertung der Segmente selbst ist in den meisten Fällen keines der beiden Systeme klar im Vorteil. Bei der Analyse der Dokumente insgesamt liegt jedoch in drei von vier Sprachkombinationen Supertext vorne, was auf eine bessere Konsistenz bei längeren Texten hinweist. Wir fordern, dass bei der Bewertung von MT-Systemen mehr Kontext berücksichtigt wird, damit die Bewertung der Übersetzungsqualität auch die tatsächliche Praxistauglichkeit widerspiegelt.

Lesen Sie das vollständige Forschungspapier auf arXiv.

Übersetzungsqualität von DeepL und Supertext – ein Vergleich

Weitere Beiträge

Erstmals möglich: Experten-Review direkt in ChatGPT, Claude und Co. – mit Supertext MCP

Enterprise-Übersetzungen direkt in ChatGPT, Copilot und Co. – mit Supertext Translation MCP

Supertext Übersetzer gewinnt den GenAI Zürich Award 2026