Maschinelle Übersetzung

Die maschinelle Übersetzung – Geschichte und Vertraulichkeit

Die maschinelle Übersetzung ist ein sehr komplexes Gebiet, das kontrovers diskutiert wird und oft mit vielen Emotionen verbunden ist. Viele Übersetzer stehen ihr mit einer Mischung aus Ärger und Verachtung gegenüber, da die Qualität in der Vergangenheit Maschinelle Übersetzung - keyboard 125x94schlecht war und die Übersetzer jetzt befürchten, nicht mehr gebraucht zu werden. In der Übersetzungsumgebung ist sie mittlerweile unausweichlich geworden, denn die Qualität hat sich außergewöhnlich schnell verbessert und manche Übersetzer sehen sie heute als nützliches Hilfsmittel an (siehe auch ‚adaptive machine translation‚.

Geschichte der maschinelle Übersetzung

Die Geschichte der maschinelle Übersetzung begann im März 1947 mit einem Brief von Warren Weaver an Norbert Wiener, in dem er fragte, ob es möglich sei, Computer zum Übersetzen der natürlichen menschlichen Sprache einzusetzen. Die anfänglich hohen Erwartungen an die maschinelle Übersetzung wurden nicht so schnell erfüllt, wie es viele erwartet hätten, und die Forschungen der USA auf diesem Gebiet wurden nach dem ALPAC-Bericht im Jahr 1966 für einige Jahre zurückgefahren.
Für viele Jahre war sie nur für einen sehr begrenzten Anwendungsbereich von Nutzen, bei dem sehr geringe Ansprüche an das Vokabular und die Grammatik, wie etwa die Übersetzung von Wetterberichten, gestellt wurden. In Europa wurde jedoch aufgrund des Bedarfs der Europäischen Kommission weiterhin aktiv geforscht.

Eines der ersten kommerziellen Systeme für die maschinelle Übersetzung nutzte die regelbasierte Technologie, die von SYSTRAN entwickelt wurde. Diese Technologie wird heutzutage jedoch von der statistischen maschinellen Übersetzung ersetzt bzw. verdrängt, die erstmals von Warren Weaver im Jahr 1949 vorgeschlagen und dann später von Forschern bei IBM im Jahr 1991 wieder aufgenommen und weiterverfolgt wurde. Google Translate wechselte von einem SYSTRAN-basierten System zur statistischen Übersetzungstechnologie im Jahr 2007 und seine API (und die APIs anderer maschinellen Übersetzungen) wird jetzt in den meisten computergestützten Tools eingesetzt.

Es gibt dazu ein sehr beeindruckendes Video auf YouTube, in dem das aktuelle Potenzial des maschinellen Dolmentschens anschaulich demonstriert wird. Hierzu gehört Sprache-zu-Text-Umwandlung und maschinelle Übersetzung, gefolgt von Text-zu-Sprache-Umwandlung. Siehe auch das Gespräch zwischen Gurdeep Pall (in Englisch) und Diana Heinrichs (in Deutsch).

Eine relativ neue Entwicklung ist die Verwendung der neuronalen Netzen in der maschinellen Übersetzung:

Fortschritte erzielte die Spracherkennung ausgerechnet mit einer Technik, die in den achtziger Jahren schon einmal sehr populär war: Die sogenannten neuronalen Netzwerke sollen im Computer Strukturen simulieren, die dem Gehirn ähneln. Sie empfangen auf der einen Seite Rohdaten (Tonsignale etwa), die an mehrere Schichten von Neuronen weitergegeben werden, bis die letzte Schicht dann das Resultat ausgibt (etwa ein Transkript). Verarbeitet werden die Daten nicht aufgrund eines ausdrücklichen Programms. Das neuronale Netz lernt stattdessen anhand von Beispielen, die man ihm gibt, und passt daraufhin seine inneren „Nervenbahnen“ an. Hat es genug trainiert, dann kann es – so die Hoffnung – selber Wörter erkennen. Zeit Online/2015/10

Das neuronale Netzwerk, das seit September Übersetzungen auf Googles Webdienst Translate durchführt, kann jetzt auch ohne Vorkenntnisse zwischen zwei Sprachen übersetzen. Dabei verwendet das neuronale Netzwerk zusätzliche Sprachen als Hilfestellung, um eine Sprache in eine andere zu überführen. Tatsächlich ist diese „Zero-Shot-Übersetzung“ nur ein Nebenprodukt der eigentlichen Funktion des als Neural Machine Translation bezeichneten Prozesses: Das neuronale Netzwerk verbessert Übersetzungen zwischen zwei Sprachen, indem es Muster zwischen diesen und weiteren Sprachen berücksichtigt. Auf diesem Weg „über Bande“ erweisen sich sogar Übersetzungen zwischen Sprachen, die die Software gar nicht direkt übersetzen kann, als möglich. Spektrum der Wissenschaft 2016/11 

Vertraulichkeit

Allerdings gibt es Bedenken, dass maschinelle Übersetzungen zu einem Verstoß gegen die Vertraulichkeit führen könnten. Zum Beispiel:

Confidentiality is a fundamental value in translation, which is compromised by those MT tools that store information online. The information fed into an online MT tool remains stored in the engine and can be accessed and used by others. Thus, access to proprietary information could be in the hands of third parties alien to the duty of confidentiality that binds a translator with a client.” [IAPTI]

Google über die Vertraulichkeit

Die Aussagen von Google zum Thema Vertraulichkeit sind vom jeweiligenLand abhängig. Die deutsche Version der ‚Nutzungbedingungen’ klingt harmlos und lautet:

 „Indem Sie urheberrechtlich oder sonst rechtlich geschützte Inhalte in unsere Dienste einstellen, räumen Sie Google und den zur Google Gruppe gehörenden Unternehmen sowie den Vertragspartnern von Google unentgeltlich die notwendigen, nicht ausschließlichen, weltweiten und zeitlich unbegrenzten Rechte ein, diese Inhalte ausschließlich zum Zweck der Erbringung des jeweiligen Dienstes und lediglich in dem dafür nötigen Umfang zu nutzen. Damit Google den jeweiligen Dienst anbieten kann, müssen die Inhalte zum Beispiel gespeichert und auf Servern gehostet werden. Das Nutzungsrecht umfasst daher insbesondere das Recht, die Inhalte technisch zu vervielfältigen“.

 Allerdings erlaubt Google in den englischen ‚Terms of Service’ ausdrücklich ’solche Inhalte zu kommunizieren, zu veröffentlichen, öffentlich aufzuführen, öffentlich darzustellen und zu verteilen‘:

 “When you upload, submit, store, send or receive content to or through our Services, you give Google (and those we work with) a worldwide license to use, host, store, reproduce, modify, create derivative works (such as those resulting from translations, adaptations or other changes we make so that your content works better with our Services), communicate, publish, publicly perform, publicly display and distribute such content. The rights you grant in this license are for the limited purpose of operating, promoting, and improving our Services, and to develop new ones”.

Fazit

Die Besorgnis im Hinblick auf die Möglichkeiten zur Verletzung der Vertraulichkeit durch die Nutzung von online maschinellen Übersetzung ist daher verständlich. Allerdings werden die meisten Dokumente, die zwischen Kunden, Agenturen und Übersetzern gesandt werden, per E-Mail geschickt. Es ist bekannt, dass E-Mails kein vertrauliche Art der Kommunikation sind, aber sie haben nicht annähernd den gleichen Grad an Besorgnis im Hinblick auf ihre Vertraulichkeit als maschinelle Übersetzungen erhalten.