Neural Machine Translation (NMT)

– Eine Maschine lernt übersetzen

AI (künstliche Intelligenz), selbstlernende Maschinen, neuronale Netze – all diese Themen sind in den Medien allgegenwärtig, fast täglich wird von neuen, bahnbrechenden Errungenschaften berichtet – und langsam aber sicher halten diese in unseren Alltag Einzug. Auf die Lokalisierungs- und Übersetzungsbranche haben diese Entwicklungen nachhaltige Auswirkungen, denn in den letzten 2 Jahren konnte im Bereich der Machine Translation das erreicht werden, was über 20 Jahre Forschung zuvor nicht schaffen konnten.

Doch was hat letztlich zum Durchbruch im Feld der Machine Translations geführt? Das Stichwort heißt ohne Zweifel Neural Machine Translation (NMT).

Die auf neuronalen Netzen basierenden Systeme sind vergleichbar mit der neuronalen Vernetzung innerhalb des menschlichen Gehirns. Die eingegebenen Informationen werden durch einen Encoder-/Decoder-Mechanismus in ein numerisches Pendant konvertiert und über mehrere sogenannte „hidden layer“, welche wie Neuronen im Gehirn aufgebaut sind, in die Zielsprache übertragen.

Die Anordnung in neuronalen Netzen hat dabei nicht nur Auswirkungen auf die Art, wie Segmente von der Ausgangs- in die Zielsprache übertragen werden. NMT-Systeme besitzen zusätzlich die Fähigkeit zu lernen und genau diese Eigenschaft führt im Endeffekt zu den rapiden Fortschritten in der MT-Technologie.

Wie genau lernt eine Maschine übersetzen?

Allgemein unterscheidet sich der Lernprozess einer Maschine nicht allzu sehr von dem eines Menschen. Er ist verbunden mit zahlreichen Fehlschlägen und einer Art „Ausbilder“, welcher fortwährend die jeweiligen Leistungen auswertet und korrigiert.

Im Feld der maschinellen Übersetzung beginnt der Lernprozess grundsätzlich mit dem Aufsetzen einer Machine Translation Engine. Da MT-Systeme generell nicht dahingehend programmiert sind, relevante Daten eigenständig zu ermitteln, werden diverse Daten manuell in den „Corpus“ (Grundstock einer MT Engine) importiert. Hierzu eignen sich vor allem firmenspezifische Übersetzungsspeicher (Translation Memory – kurz: TM), Terminologie, Glossare oder anderweitige mehrsprachige Referenzdokumente. Alternativ können bereits vorgefertigte MT Engines individuell angepasst werden.

Ist die Grundlage erst einmal gelegt, kann auch schon mit dem Training der MT Engine begonnen werden. Dazu wird eine beachtliche Anzahl an Testläufen mit entsprechenden Korrekturschleifen gestartet.
Bei jedem Testlauf wird dabei die Qualität der erzielten Ergebnisse ermittelt und die nicht zufriedenstellenden Segmente werden editiert, bevor diese unter Einsatz von spezifischen Trainingsmaterialien erneut einen Test durchlaufen. Dieser Vorgang wird so lange wiederholt, bis die gelieferten Ergebnisse einen gewissen Qualitätsstandard erreicht haben. Für die Beurteilung der Qualität orientiert man sich neben der Einschätzung eines erfahrenen Posteditiors vor allem an drei Maßstäben: dem Bleu Score, TAR Score und F-Measure.

Erzielen die Leistungen der MT Engine in allen drei Metriken den gewünschten Schwellenwert, ist die MT Engine bereit, produktiv in den Übersetzungsprozess eingebunden zu werden.
Der Lernprozess einer MT Engine bzw. NMT wird allerdings nach Abschluss des „Trainingscamps“ nicht einfach eingestellt. Wie bei einem Menschen geht das Lernen immer weiter, denn mit jeder importierten Übersetzung gelangen neue Informationen in das System.
Auf diese Weise wird ein kontinuierlicher Verbesserungsprozess in Gang gesetzt, welcher sich vor allem auf die Qualität der Ergebnisse auswirkt.

Machine Translation bei der tsd

Bei tsd setzen wir in der derzeit angebotenen, speziell für unsere Kunden entwickelten MT Engine ebenfalls auf neuronale Maschinen und entwickeln und trainieren diese nach spezifischen Kundenwünschen, in gesicherten Speicherumgebungen, mit kundenspezifischen Inhalten und Terminologien.

Haben Sie Fragen zum Thema Machine Translation, haben Sie Interesse an diesen Dienstleistungen und möchten Sie sich spezifisch dazu von uns beraten lassen? Dann kontaktieren Sie uns unter: tsd@tsd-int.com