Machine Translation
Anfragen für die einen Zauberstab gebraucht wird
„Maschinelle Übersetzung“ oder „Machine Translation“ (MT): Lösungen wie Google Translate haben wir bestimmt alle mindestens einmal im Leben genutzt, sei es bei der Arbeit oder in unserem privaten Alltag.
MT-Lösungen setzen sich in unserer schnelllebigen Zeit immer mehr durch. Viele stehen dieser technologischen Entwicklung jedoch – teilweise zu Recht – skeptisch gegenüber.
Unser Ziel: Wir wollen zu dem Thema aufklären! Was geht, was nicht geht und worauf muss man beim Einsatz dieser „künstlichen Intelligenz“ achten. Aus diesem Grund haben wir unsere Kollegin und interne Language Technology Expertin Madelein zu einem kurzen Gespräch eingeladen. Vielleicht können wir so ein paar Vorurteile aus dem Weg räumen und einen Blick unter die „Motorhaube“ der Machine Translation erhaschen.
Guten Morgen Madelein,
schön, dass du Zeit gefunden hast, um uns in die Welt der Machine Translation einzuführen. Als Language Technology Expertin bei tsd setzt du dich tagtäglich intensiv mit dem Thema auseinander.
tsd: Was würdest du sagen, wann lohnt es sich generell für einen Kunden, Machine Translation einzusetzen?
Madelein: Für den Einsatz von MT gibt es ganz viele unterschiedliche Anwendungsgebiete. Heutzutage wird tagtäglich unendlich viel Inhalt erstellt, der ohne MT erst gar nicht übersetzt werden würde. Grundsätzlich lohnt sich MT aber dann besonders, wenn man ein hohes Übersetzungsvolumen hat, schnelle Übersetzungen benötigt werden und/oder Texte erfasst werden sollen, die sich öfter wiederholen.
tsd: Welche Arten an MT lassen sich im Allgemeinen unterscheiden?
Madelein: Man unterscheidet normalerweise zwischen „Custom MT“ und „Out-of-the-Box MT“.
Wir bei tsd benutzen KantanMT als unsere Custom MT-Lösung und die Business-Versionen von DeepL und Google Translate als unsere Out-Of-the-Box-Systeme.
„Custom MT“ bietet bei fachspezifischen Inhalten den großen Vorteil, dass wir selber Hand anlegen können, wir nennen das „MT Engines trainieren“. Dabei können wir den Output der MT so optimieren, dass wir deutlich bessere Qualitätsergebnisse erzielen können als die Out-of-the-Box-Lösungen.
Gleichzeitig kann bei Inhalten und Output im Rahmen der Nutzung von „Custom MT“ die Datensicherheit von tsd verwaltet werden – ein relevanter Vorteil, wenn man seine Inhalte nicht im „World Wide Web“ teilen will.
tsd: Custom MT oder Out of the Box – Was würdest du einem Kunden empfehlen?
Madelein: Grundsätzlich gilt: Je mehr spezifische Kundendaten ich einer Engine hinzufügen kann, desto höher die Wahrscheinlichkeit, dass der Output eine höhere Qualität liefert als eine Out-of-the-Box MT. Insgesamt kann dies aber nicht immer pauschal beantwortet werden. Es kommt immer darauf an, welcher konkrete Anwendungsfall vorliegt und welche Bedürfnisse und Erwartungen der Kunde hat.
tsd: Welche Vorteile habe ich als Kunde, wenn eine Machine Translation-Lösung in den Übersetzungsprozess einbezogen wird?
Madelein: Machine Translation-Lösungen werden zu ganz unterschiedlichen Zwecken eingesetzt. Der normale Nutzer nimmt oft an, dass eine MT vor allem günstiger produziert werden kann als eine normale, menschliche Übersetzung – das stimmt auch, allerdings nur bedingt. Häufig steht im Fokus eines MT-Prozesses der Zeitfaktor, denn eine MT übersetzt natürlich um ein Vielfaches schneller als ein Mensch. Dies kommt dann insbesondere in Betracht, wenn besondere technische Funktionen, wie zum Beispiel „Realtime-Übersetzung“, notwendig sind. Angewendet werden solche Lösungen üblicherweise bei Chats, im Kundenservice, bei der Übersetzung von Kundenbewertungen (bspw. auf Reiseportalen) etc.
tsd: Realtime-Übersetzung ist ein guter Stichpunkt. Könntest du nochmal kurz erläutern, was Realtime-Übersetzung bedeutet und wie es eingesetzt wird?
Madelein: Machine Translation in Realtime ist mehr oder minder das Gleiche, was man auf Google Translate sieht: Boxen in den man kurze Textstücke einfügen kann, die dann innerhalb von Sekunden übersetzt werden. Teilweise wird die Funktion direkt eingebettet, sodass der Leser erst nicht erkennen kann, dass dies ein MT-Output ist.
Bei Kunden, die Ihre eigene kundenspezifische Engine nutzen, können Anwendungen zur Realtime-Übersetzung beispielsweise im Intranet eingebunden sein.
tsd: Oft werden wir von Kunden gefragt, ob wir gewisse Sprachen mit MT übersetzen können. Welche Sprachkombinationen lassen sich denn grundsätzlich mit MT übersetzen? Eignen sich bestimmte Sprachen besser für eine Machine Translation als andere?
Madelein: Theoretisch eignen sich alle Sprachen für die Bearbeitung mit einer Machine Translation. Praktisch gesehen hängt es davon ab, wie viele Daten man für ein Sprachpaar hat, also beispielsweise ob Translation Memories, Termbanken und Stock Data vorhanden sind. Mit europäischen Sprachen und generell mit Sprachen, die viele Sprecher haben, kann man mit MT im Normalfall einfacher arbeiten. Bei den sogenannten „Lower Resource Languages“, also solchen Sprachen, bei denen einfach wenige Daten vorhanden sind, muss grundsätzlich mit schlechteren MT-Ergebnissen gerechnet werden.
tsd: Viele Kunden interessiert ebenfalls, welches Volumen pro Tag mit Machine Translation übersetzt werden kann. Gibt es hier einen gewissen Richtwert?
Madelein: Das wäre in der Tat ein spannendes Experiment, meines Wissens wurde das hier noch nicht ausprobiert! Aber um euch einen Richtwert zu geben: Die Übersetzung eines Textes von 35 000 Wörtern kann zwischen 20 bis 30 Minuten dauern. Natürlich gilt dieser Wert ausschließlich für eine maschinelle Rohübersetzung ohne Post-Editing. Unter Post-Editing verstehen wir die Prüfung maschinell erstellter Inhalte durch einen professionellen Übersetzer.
tsd: Was war bis jetzt die skurrilste Anfrage zum Thema MT?
Madelein: Keine einfache Frage … Ich kann aber sagen, was für mich eine Anfrage wäre, die nur durch Magie zu lösen wäre.
Allgemein lässt sich sagen, Computer sind nicht sehr clever. KIs sind vielleicht ein bisschen cleverer, aber auch nicht so viel schlauer als ein normaler Computer. Im Umkehrschluss heißt das: Wenn man Texte durch ein Programm laufen lässt, wird niemals alles korrekt sein. Das gilt besonders für optische Zeichenerkennung (OCR) und maschinelle Rohübersetzungen.
Eine Anfrage, für die demnach ein Zauberstab gebraucht wird, wäre ein Prozess, in dem im ersten Schritt eine OCR mit darauffolgender maschineller Übersetzung erfolgt, die kein Mensch zur Korrektur bearbeiten darf und die trotzdem keinen einzigen Fehler beinhalten soll.
tsd: Das klingt ganz nach einer Grundsatzfrage. Mensch oder Maschine – wer übersetzt besser?
Madelein: Maschinelle Übersetzungen sind grundsätzlich nicht schlecht und der Mensch übersetzt nicht immer fehlerfrei – dennoch ist der Mensch immer noch der bessere Übersetzer.
Man kann sehr gute Ergebnisse durch maschinelle Übersetzung erzielen. Oft ist es sinnvoll, die Technologie als eine Unterstützung für einen menschlichen Übersetzer zu betrachten, nicht als einen Ersatz. Wenn man sich über diese Tatsache im Klaren ist, kann man seine Bearbeitungszeit und seine Kosten signifikant reduzieren, ohne sich aufgrund falscher Vorstellungen über eine nicht ausreichende Qualität einer maschinellen Rohübersetzung ärgern zu müssen.
tsd: Übersetzungsfehler sind mittlerweile berühmt-berüchtigt. Was sind denn so typische Fehler, die bei maschinell übersetzten Texten oft zu beobachten sind?
Madelein: Ach ja, Stilblüten sind ja insbesondere im Netz sehr beliebt. Aber tatsächlich gibt es bei MT typische Fehlerarten – anders als beim Menschen sind das dann keine Tippfehler, sondern Fehler anderer Kategorien:
Leider verdoppelt oder verdreifacht die MT manchmal Wörter, so entstehen Wortgebilde, wie „Dokumentation zur Dokumentation der Manure Sensing-Dokumentation“ oder aus „bidirectional“ wird auch mal ein „Bibibi“.
Zudem werden manchmal Zusammenhänge falsch erkannt, so wurde aus „Supplier was inconsistently applying grease […].“ – „Der Lieferant wurde ständig mit Schmierfett versehen.“
Sehr häufig wird aber einfach Inhalt „vergessen“; der Zieltext liest sich dann perfekt und fehlerfrei, aber im Ausgangstext steht was ganz anderes … ein besonders tückischer Fehler!
Manchmal möchte man auch gar nicht wissen, woher ein Fehler kommt. So wie bei dieser Übersetzung ins Französische: „See Surface Files“ wurde zu „Voir Mes balles“ …
tsd: Als abschließende Frage: Kann MT als eigenständiges Tool eingesetzt werden oder ist eine „Kombination“ mit anderen Tools empfehlenswert?
Madelein: Bei Prozessen, in denen ein hoher Qualitätsanspruch im Vordergrund steht, würde ich immer eine Kombination aus einem TMS (Translation Management System) und MT empfehlen. Dies gilt übrigens ebenfalls, wenn haftungsrechtliche Komponenten eine Rolle spielen.
Rohübersetzungen aus der MT sind nicht perfekt und unsere Post-Editoren (Sprachexperten) arbeiten am besten in einer TMS-Oberfläche. Innerhalb des TMS kann der Prozess auch meist besser und eleganter abgebildet werden (Stichwort Pre- und Postprocessing der Daten) und durch die Symbiose beider Tools kann eine optimale Vorübersetzung erzeugt werden.
Grundsätzlich sollte aber der konkrete Anwendungsfall beim Kunden zunächst geklärt und ein Prozess genau auf diese Anforderungen hin aufgesetzt werden. Oder wie wir in Köln sagen „Jeder Jeck ist anders.“ 🙂
Vielen Dank, liebe Madelein! Ich denke, das gibt schon mal einen guten Einblick in die vielversprechende Welt der Machine Translation.
Mehr zum Thema „Machine Translation“-Lösungen bei der tsd finden Sie auf unserer Webseite.