Machine Translation (MT)
Wie funktioniert das überhaupt?
Die Einbindung von Translation-Management-Systemen hat sich in den letzten Jahren in der Übersetzungs- und Lokalisierungsindustrie etabliert: Die Wiederverwendung von bereits übersetzten Segmenten ist ein wichtiger Bestandteil des Prozesses geworden. Zudem entwickeln sich die Systeme durch neue Funktionen kontinuierlich weiter. Doch dass Übersetzungen vollständig von technischen Anwendungen übernommen werden könnten – von einer „Maschine“ – klang lange nach Zukunftsmusik. Diese Idee ist mittlerweile jedoch zumindest in Teilen schon realisierbar, denn auch Technologien und Programme zur maschinellen Übersetzung werden weiterhin erforscht, getestet und unter bestimmten Bedingungen schon eingesetzt. Sie haben das Potential, sich als ein unverzichtbarer Bestandteil im Übersetzungsprozess zu erweisen.
Durch schnellere Durchlaufzeiten und Einsatz von Personal verspricht dieser Trend den Übersetzungsprozess in Zukunft zu revolutionieren. Doch wie genau funktioniert diese Wunderwaffe der Revolution im Übersetzungswesen? Dies möchten wir im folgenden Text näher beleuchten.
Im Feld der maschinellen Übersetzung haben sich im Grunde zwei verschiedene MT-Ansätze durchgesetzt, mit denen Wörter und Sätze von einer in eine andere Sprache übertragen werden: die regelbasierte und die statistische Methode.
Regelbasierte Systeme bauen auf den grammatikalischen Regeln der Quell- und der Zielsprache auf. Daneben werden oft auch Wörterbücher mit zusätzlichen Informationen zu den Wörtern (wie z. B. der Wortart) eingesetzt. Ein Vorteil der regelbasierten Methode ist eine hohe Flexibilität, die sich darin äußert, dass regelbasierte Systeme in unterschiedlichsten Kontexten vergleichbare Ergebnisse erzielen. Dadurch, dass bei diesen Systemen die sprachlichen Regeln im Vordergrund stehen, werden die Texte jedoch oft leserunfreundlich übersetzt, besonders bei Sprachen mit flexibler Wortstellung.
Die statistische Methode basiert auf dem Heranziehen früherer Übersetzungen als Referenz. Die Machine-Translation-Engine analysiert vorangegangene Übersetzungen und vergleicht diese mit dem neuen Ausgangstext. Dadurch ist die Qualität des vorliegenden Projekts stark von der Qualität, Konsistenz und Aktualität der vorherigen Übersetzungen abhängig. Bei ausreichend großen „Korpora“, dem Grundstock einer Machine-Translation-Engine, erzielen statistische Systeme deutlich bessere Ergebnisse als regelbasierte, sind jedoch auf einen bestimmten Fachbereich beschränkt, da Mehrdeutigkeiten von Wörtern seltener erkannt werden können.
Als besondere Ausprägung der statistisch basierten Systeme lassen sich die auf neuronalen Netzen aufbauenden Systeme interpretieren. Diese sind entfernt mit der neuronalen Vernetzung innerhalb des Gehirns vergleichbar. Die eingegebenen Informationen werden durch einen Encoder-/Decoder-Mechanismus in ein numerisches Pendant konvertiert und über mehrere sogenannte „hidden layer“, welche wie Neuronen im Gehirn aufgebaut sind, in die Zielsprache übertragen.
Noch stecken neuronale Systeme in den Kinderschuhen, aber es zeigt sich bereits jetzt, dass sie mit anderen statistischen Systemen mithalten können und in Verbindung mit maschinellem Lernen noch viel Potenzial haben.
In heutigen Systemen wird jedoch nicht allein auf eine der beiden Methoden zurückgegriffen, sondern diese werden miteinander kombiniert. Meist wird dabei ein statistisches System als Grundlage verwendet und dieses durch vorab definierte Regeln erweitert.
Bis dato beeinflussen Überlegungen und Praxisübungen zu Machine-Translation-Technologien schon viele bestehende Prozesse und Konzepte innerhalb der Übersetzungs- und Lokalisierungsindustrie und setzen viele neue Impulse. Bei der derzeit rapiden Entwicklung innerhalb des Felds der MT wird die maschinelle Übersetzung für alle Akteure des Übersetzungsprozesses in der Zukunft auch noch wesentlich relevanter.