Maschinelle Übersetzung

Die maschinelle Übersetzung – Geschichte und Vertraulichkeit

Maschinelle Übersetzung - keyboard 125x94

Die maschinelle Übersetzung ist ein sehr komplexes Gebiet, das kontrovers diskutiert wird und oft mit vielen Emotionen verbunden ist. Viele Übersetzer stehen ihr mit einer Mischung aus Ärger und Verachtung gegenüber, da die Qualität in der Vergangenheit schlecht war und die Übersetzer jetzt befürchten, nicht mehr gebraucht zu werden. In der Übersetzungsumgebung ist sie mittlerweile unausweichlich geworden, denn die Qualität hat sich außergewöhnlich schnell verbessert und manche Übersetzer sehen sie heute als nützliches Hilfsmittel an (siehe auch ‚adaptive machine translation‚.

Geschichte der maschinelle Übersetzung

Die Geschichte der maschinelle Übersetzung begann im März 1947 mit einem Brief von Warren Weaver an Norbert Wiener, in dem er fragte, ob es möglich sei, Computer zum Übersetzen der natürlichen menschlichen Sprache einzusetzen. Die anfänglich hohen Erwartungen an die maschinelle Übersetzung wurden nicht so schnell erfüllt, wie es viele erwartet hätten, und die Forschungen der USA auf diesem Gebiet wurden nach dem ALPAC-Bericht im Jahr 1966 für einige Jahre zurückgefahren.
Für viele Jahre war sie nur für einen sehr begrenzten Anwendungsbereich von Nutzen, bei dem sehr geringe Ansprüche an das Vokabular und die Grammatik, wie etwa die Übersetzung von Wetterberichten, gestellt wurden. In Europa wurde jedoch aufgrund des Bedarfs der Europäischen Kommission weiterhin aktiv geforscht.

Eines der ersten kommerziellen Systeme für die maschinelle Übersetzung nutzte die regelbasierte Technologie, die von SYSTRAN entwickelt wurde. Diese Technologie wird heutzutage jedoch von der statistischen maschinellen Übersetzung ersetzt bzw. verdrängt, die erstmals von Warren Weaver im Jahr 1949 vorgeschlagen und dann später von Forschern bei IBM im Jahr 1991 wieder aufgenommen und weiterverfolgt wurde. Google Translate wechselte von einem SYSTRAN-basierten System zur statistischen Übersetzungstechnologie im Jahr 2007 und seine API (und die APIs anderer maschinellen Übersetzungen) wird jetzt in den meisten computergestützten Tools eingesetzt. Eine relativ neue Entwicklung ist die Verwendung der neuronalen Netzen in der maschinellen Übersetzung.

„Die Neural Machine Translation arbeitet nach einem ganz anderen Prinzip als andere Ansätze wie etwa die statistikbasierte oder die regelbasierte maschinelle Übersetzung. Die NMT verwendet ein großes neuronales Netz, das mithilfe künstlicher Intelligenz nach dem Modell des menschlichen Gehirns funktioniert. Es ist die fortschrittlichste Methode computergenerierter Übersetzungen und hat dank selbstständigen Lernens auf der Grundlage von künstlicher Intelligenz, Big Data und Deep Learning in den letzten Jahren enorme Fortschritte gemacht. Heutzutage können neuronale Programme maschineller Übersetzung als Basis für professionelle Übersetzungen eingesetzt werden. Das Programm kann sowohl akkurate Übersetzungen generieren als auch eine Sprache lernen. Dadurch wird die Qualität der übersetzten Daten kontinuierlich verbessert. Damit die NMT gut funktioniert, muss sie unbedingt von einem Menschen trainiert werden. Das bedeutet, dass das Programm mit einer großen Menge an Daten gespeist werden muss, um die Zuverlässigkeit der Endergebnisse zu verbessern. Der Mensch kann das Programm außerdem so trainieren, dass es die spezifischen Bedürfnisse einzelner Sektoren wie etwa dem Justiz-, Finanz- oder Medizinbereich, die alle ein eigenes Fachvokabular verwenden, erfüllt. Zwei Unternehmen der GAFAM haben diese Art der überprüften maschinellen Übersetzung bereits integriert: Google mit Google Neural Machine Translation (GNMT): ein in 8 Sprachen verfügbares neuronales Netz Microsoft mit der App Microsoft Translator: Dokumente können in mehr als 60 verschiedene Sprachen übersetzt werden Skype verfügt über seinen Skype Translator, mit dem Gruppenunterhaltungen mit bis zu 100 Teilnehmenden ermöglicht werden. Die NMT ist also in zahlreichen Bereichen nützlich, vor allem im E-Commerce. Damit zufriedenstellende Ergebnisse erzielt werden können, ist es jedoch wichtig, dass einige Kriterien erfüllt sind: Es braucht eine ausreichende Anzahl von Wiederholungen, ein hinlängliches Volumen spezifischer Daten, um das Programm entsprechend zu trainieren, sowie eine große Menge an Texten zum Übersetzen.“

https://de.textmaster.com/blog/neuronale-maschinelle-ubersetzung-was-sie-wissen-mussen/

Vertraulichkeit

Allerdings gibt es Bedenken, dass maschinelle Übersetzungen zu einem Verstoß gegen die Vertraulichkeit führen könnten. Zum Beispiel:

Confidentiality is a fundamental value in translation, which is compromised by those MT tools that store information online. The information fed into an online MT tool remains stored in the engine and can be accessed and used by others. Thus, access to proprietary information could be in the hands of third parties alien to the duty of confidentiality that binds a translator with a client.” [IAPTI]

Google über die Vertraulichkeit

Die Aussagen von Google zum Thema Vertraulichkeit sind vom jeweiligenLand abhängig. Die deutsche Version der ‚Nutzungbedingungen’ klingt harmlos und lautet:

 „Indem Sie urheberrechtlich oder sonst rechtlich geschützte Inhalte in unsere Dienste einstellen, räumen Sie Google und den zur Google Gruppe gehörenden Unternehmen sowie den Vertragspartnern von Google unentgeltlich die notwendigen, nicht ausschließlichen, weltweiten und zeitlich unbegrenzten Rechte ein, diese Inhalte ausschließlich zum Zweck der Erbringung des jeweiligen Dienstes und lediglich in dem dafür nötigen Umfang zu nutzen. Damit Google den jeweiligen Dienst anbieten kann, müssen die Inhalte zum Beispiel gespeichert und auf Servern gehostet werden. Das Nutzungsrecht umfasst daher insbesondere das Recht, die Inhalte technisch zu vervielfältigen“.

 Allerdings erlaubt Google in den englischen ‚Terms of Service’ ausdrücklich ’solche Inhalte zu kommunizieren, zu veröffentlichen, öffentlich aufzuführen, öffentlich darzustellen und zu verteilen‘:

 “When you upload, submit, store, send or receive content to or through our Services, you give Google (and those we work with) a worldwide license to use, host, store, reproduce, modify, create derivative works (such as those resulting from translations, adaptations or other changes we make so that your content works better with our Services), communicate, publish, publicly perform, publicly display and distribute such content. The rights you grant in this license are for the limited purpose of operating, promoting, and improving our Services, and to develop new ones”.

Fazit

Die Besorgnis im Hinblick auf die Möglichkeiten zur Verletzung der Vertraulichkeit durch die Nutzung von online maschinellen Übersetzung ist daher verständlich. Allerdings werden die meisten Dokumente, die zwischen Kunden, Agenturen und Übersetzern gesandt werden, per E-Mail geschickt. Es ist bekannt, dass E-Mails kein vertrauliche Art der Kommunikation sind, aber sie haben nicht annähernd den gleichen Grad an Besorgnis im Hinblick auf ihre Vertraulichkeit als maschinelle Übersetzungen erhalten.