Quelle Nummer 228
Rubrik 10 : SPRACHE Unterrubrik 10.02 : SPRACHWISSENSCHAFT
AUTOMATISCHE UEBERSETZUNG
KLAUS BROCKHAUS
AUTOMATISCHE UEBERSETZUNG
SCHRIFTEN ZUR LINGUISTIK BAND 2
FRIEDERICH VIEWEG UND SOHN GMBH, BRAUNSCHWEIG 1971
S. 1-
001 Einleitung. Historischer Abriss. Die
002 Bemühungen um eine automatische Übersetzung natürlicher
003 Sprachen sind, wenn man von einigen zwar wissenschaftsgeschichtlich
004 bemerkenswerten, aber für die heutige Problemstellung unwichtigen
005 Vorläufern absieht, etwa 20 Jahre alt. Sie begannen gerade zu
006 der Zeit, als die Entwicklung der Datenverarbeitungsanlagen
007 erkennen liess, dass eine Realisierung von automatischen
008 Übersetzungsprojekten nicht mehr aus technologischen Gründen von
009 vornherein unmöglich ist. Seit etwa 1950 beschäftigte sich, zum
010 Teil angeregt durch ein Memorandum von Warren Weaver, eine
011 allmählich wachsende Zahl von Wissenschaftlern mit Fragen der
012 maschinellen Übersetzung. Der ursprüngliche Optimismus
013 hinsichtlich der Erreichbarkeit einer vollautomatischen
014 Übersetzung von guter Qualität machte nach einigen Jahren einer
015 skeptischeren oder realistischeren Einstellung Platz. Im
016 allgemeinen wurden die aufgetretenen Schwierigkeiten zum Anlass
017 genommen, einzelne Fragen aus dem Problemkreis der maschinellen
018 Übersetzung detailliert zu untersuchen, um dadurch zu einer
019 schrittweisen Lösung der Aufgabe beizutragen. Darüber hinaus
020 wurde das Ziel selbst vorsichtiger formuliert; statt einer
021 vollautomatischen wurde zunächst eine teilweise automatische
022 Übersetzung ins Auge gefasst, die Anforderungen an die
023 Übersetzungsqualität wurden gesenkt, die zu übersetzenden Texte
024 wurden ganz bestimmten Gebieten entnommen. Der augenglickliche
025 Stand der Forschung auf dem Gebiet der automatischen Übersetzung
026 lässt sich etwa folgendermassen beschreiben: eine einwandfreie,
027 vollautomatische Übersetzung ist als praktisch unerreichbar erkannt;
028 Übersetzungsverfahren, die fehlerhafte, aber verständliche
029 Resultate für bestimmte Zwecke produzieren, existieren füe
030 einige Sprachenpaare; Arbeiten zur Entwicklung besserer
031 Verfahren oder zur Verbesserung existierender Verfahren sind
032 einmal aus praktischen Gründen sinnvoll, zum anderen aber können
033 sie dazu dienen, linguistische Erkenntnisse über die beteiligten
034 Sprachen und die Zusammenhänge zwischen diesen Sprachen zu
035 gewinnen. Probleme und Lösungsmethoden. Eine
036 ausführliche Übersicht über die bisher veröffentlichten
037 Untersuchungen aus dem Gebiet der automatischen Übersetzung ist
038 im Rahmen der vorliegenden Arbeit nicht möglich und insofern auch
039 nicht erforderlich, als es eine Reihe von Monographien und
040 Aufsatzsammlungen gibt, in denen die wichtigsten Ergebnisse
041 zusammengestellt sind. Deshalb sollen an dieser Stelle nur einige
042 Probleme und die zu ihrer Lösung vorgeschlagenen Methoden kurz
043 behandelt werden. Ausgangspunkt für die automatische Übersetzung
044 war die Wort-für-Wort-Übersetzung mithilfe eines
045 Wörterbuchs, dessen einzelne Eintragungen automatisch aufgerufen
046 werden, und das zu jedem vorgelegten Wort eine oder mehrere
047 Übersetzungsmöglichkeiten angibt. Die Beschränkungen dieses
048 Verfahrens sind offenkundig; da die Wörter verschiedener
049 Sprachen einander nicht eindeutig zugeordnet sind, können so nur
050 sehr mangelhafte Resultate erzielt werden, durch die allenfalls die
051 Arbeit eines menschlichen Übersetzers erleichtert werden kann.
052 Bedingt verständliche Übersetzungen spezieller Texte kann man
053 erhalten, wenn diese Texte vor Anwendung des Wort-für-
054 Wort-Verfahrens präpariert und nachher geglättet werden.
055 Diese halbautomatische Übersetzung ist jedoch unter theoretischem
056 Aspekt nur von geringem Wert. Durch Zerlegung der Wörter in
057 Stamm und Endung und Auswertung der in den Endungen enthaltenen
058 syntaktischen Informationen lassen sich unter günstigen
059 Bedingungen einfache syntaktische Beziehungen zwischen den
060 Wörtern eines Satzes ermitteln, so daß ein Wort in
061 Abhängigkeit von solchen Beziehungen zu seiner Umgebung in
062 verschiedener Weise übersetzt werden kann. Die bei dieser
063 Methode erzielbaren resultate sind besser als die der Wort-für
064 -Wort-Übersetzung, aber noch keineswegs zufriedenstellend,
065 insbesondere in bezug auf Probleme der Wortordnung,
066 Mehrdeutigkeit, Idiomatik und ähnliches. Erst der Übergang
067 von der einfachen oder modifizierten Wort-für Wort-
068 Übersetzung zur Satz-für-Satz-Übersetzung
069 eröffnete neue Perspektiven. Bei dieser Methode werden die zu
070 übersetzenden Sätze in einem ersten Schritt des automatischen
071 Verfahrens vollständig syntaktisch analysiert, so daß die
072 syntaktische Rolle jedes einzelnen Wortes innerhalb des Satzes
073 bekannt ist. Unter Verwendung der dadurch gewonnenen
074 Informationen erfolgt dann die Übersetzung. Sowohl für die
075 syntaktische Analyse als auch für die eigentliche Übersetzung
076 sind zahlreiche, in Einzelheiten sehr unterschiedliche Verfahren
077 erarbeitet worden, die aber fast alle auf der Beschreibung der
078 beteiligten Sprachen durch generative Syntaxen oder dazu
079 äquivalente Deskriptionssysteme beruhen. Durch die Konzeption
080 der Satz-für-Satz-Übersetzung ist das Problem der
081 automatischen Übersetzung natürlich noch nicht gelöst. Diese
082 Methode erfordert vielmehr eine intensive Detailarbeit sowohl im
083 Bereich der theoretischen Grundlagen als auch hinsichtlich der
084 konkreten Ausarbeitung von maschinell verwendbaren Syntaxen.
085 Resultate der Untersuchung. Auf der Grundlage spezieller
086 generativer Syntaxen für einen Teilbereich der englischen und der
087 deutschen Sprache ist ein in beiden Richtungen anwendbares
088 Übersetzungsverfahren entwickelt worden, das englische oder
089 deutsche Sätze, sofern sie zu dem erfaßten Teilbereich gehören,
090 im allgemeinen korrekt übersetzt. Falsche Übersetzungen sind
091 selten; etwas häufiger kann es vorkommen, daß die Übersetzung
092 eines Satzes abgebrochen wird, wenn es sich während des
093 Übersetzungsvorgangs herausstellt, daß die Übersetzungsregeln
094 nicht vollständig sind. Die erforderlichen Ergänzungen oder auch
095 Korrekturen der Übersetzungsregeln lassen sich jedoch meist in
096 einfacher Weise vornehmen. Die Übersetzung von Sätzen, die
097 nicht in dem erfaßten Teilbereich liegen, wird von dem Verfahren
098 gar nicht versucht. Jedoch ist das Verfahren so eingerichtet,
099 daß die Teilbereiche schrittweise erweitert werden können. Die
100 wesentlichen theoretischen Ergebnisse der Arbeit bestehen darin,
101 daß erstens eine Methode entwickelt und erfolgreich angewandt
102 worden ist, die es gestattet, sehr differenzierte generative
103 Syntaxen in einer formal einfachen und trotzdem relativ
104 anschaulichen Weise zu formulieren. Zweitens ist der Begriff der
105 Übersetzungssyntax eingeführt und als System von strukturellen
106 Zuordnungsregeln konkretisiert worden. Darin stellt sich der
107 Übersetzungsvorgang dar als ein durch die Struktur des zu
108 übersetzenden Satzes gesteuerter Aufbau der Struktur des
109 Übersetzungsresultats. Drittens ist die Übersetzungssyntax um
110 eine formal-semantische Komponente erweitert worden, wodurch
111 die Beschreibungskapazität wesentlich vergrößert wird.
112 Schließlich ist das entwickelte Übersetzungsverfahren von den
113 Sprachen Englisch und Deutsch vollkommen ablösbar, so daß es im
114 Prinzip für die Übersetzung zwischen beliebigen Sprachen zu
115 gebrauchen ist. Insofern stellt es einen Beitrag zu einer
116 allgemeinen Theorie der Übersetzung dar. Allgemeiner
117 Teil. Ziele der Untersuchung Linguistische
118 Erkenntnisse.. Die meisten Projekte zur automatischen
119 Übersetzung natürlicher Sprachen sind darauf ausgerichtet,
120 Verfahren zu entwickeln, mit denen sich Texte, meist spezielle
121 Arten von Texten, für praktische Zwecke übersetzen lassen.
122 Die Übersetzungsprogramme sollen unter ökonomischem Aspekt mit
123 menschlichen Übersetzern konkurrieren können oder ihnen überlegen
124 sein. Wichtige Faktoren sind dabei Kosten, Schnelligkeit und
125 Qualität. Die automatische Übersetzung braucht die menschliche
126 nicht unbedingt in bezug auf sämtliche Faktoren zu übertreffen;
127 es ist denkbar, daß beispielsweise schlechtere Qualität und sogar
128 höhere Kosten in kauf genommen werden, wenn andererseits die
129 schnelle Verfügbarkeit großer Textmengen gewährleistet ist.
130 Dieser Gesichtspunkt der praktischen Verwendbarkeit spielt bei der
131 vorliegenden Untersuchung keine entscheidende Rolle. Es kommt
132 vielmehr darauf an, bei der Entwicklung des
133 Übersetzungsverfahrens und bei der Aufbereitung der beteiligten
134 Sprachen für die automatische Übersetzung linguistische
135 Erkenntnisse über die Form der Beschreibung natürlicher
136 Sprachen und des Zusammenhangs zwischen natürlichen Sprachen zu
137 gewinnen. Der Erwartung, daß dieses Ziel im Rahmen der
138 Beschäftigung mit dem Problem der automatischen Übersetzung
139 erreicht werden kann, liegt die Annahme zugrunde, daß der Zwang
140 zu einer formalen, automatischen Bearbeitungen zugänglichen
141 Darstellung der sprachlichen Fakten dazu führt, daß Begriffe
142 schärfer definiert, Probleme klarer erkannt und Fragen
143 verbindlicher beantwortet werden. Idealisierung der
144 Sprachen. Ein Übersetzungsverfahren mit der soeben
145 beschriebenen linguistischen Zielsetzung ist der Notwendigkeit
146 enthoben, vorgegebene Texte recht oder schlecht zu übersetzen.
147 Es ist vielmehr bei dieser Aufgabenstellung möglich, daß in
148 empirischen Disziplinen bei der Erforschung komplexer Sachverhalte
149 bewährte Mittel der Idealisierung anzuwenden. Wie bei der
150 Formulierung der Fallgesetze der Luftwiderstand zunächst
151 unberücksichtigt bleibt oder in der kinetischen Gastheorie ein
152 " ideales " Gas hypostasiert wird, lassen sich in natürlichen
153 Sprachen durch eine Beschränkung ihres Ausdrucksreichtums
154 idealisierte Teilsprachen abgrenzen. Auf diese Weise können
155 einzelne sprachliche Phänomene isoliert untersucht werden;
156 allerdings ist darauf zu achten, daß die so gewonnenen Ergebnisse
157 miteinander verträglich sind und zu einer Beschreibung der
158 komplexen, natürlichen Sprache integriert werden können.
159 Vorrang der Syntax. Die Methode der Bildung einer
160 idealisierten Teilsprache aus einer natürlichen Sprache wird in
161 dieser Arbeit angewandt und zu einem Approximationsprozess
162 ausgebaut. Und zwar werden zunächst die syntaktischen
163 Möglichkeiten in der Weise eingeschränkt, daß nur einfache
164 Aussagesätze mit gewissen Ergänzungen konstruierbar sind.
165 Später ist es dann im Prinzip möglich, die vorläufig
166 ausgeschlossenen syntaktischen Mittel nach und nach wieder
167 zuzulassen und in die Untersuchung einzubeziehen, so daß die
168 behandelte Teilsprache sich allmählich immer weniger von der
169 natürlichen Sprache unterscheidet, aus der sie durch
170 Idealisierung gewonnen wurde. Noch stärker als die Syntax wird
171 das Lexikon beschränkt; einmal wird nur eine relativ kleine
172 Anzahl von Wörtern in den Wortschatz der Teilsprache aufgenommen,
173 zum anderen werden die aufgenommenen Wörter nur mit einem Teil
174 ihrer Verwendungsmöglichkeiten und Bedeutungen berücksichtigt.
175 Die Teilsprachen werden also in semantischer Hinsicht wesentlich
176 stärker idealisiert als in syntaktischer, und zwar deswegen, weil
177 anzunehmen ist, daß die schwierigeren semantischen Probleme sich
178 nur auf der Grundlage einer hinreichend weit ausgebauten Syntax mit
179 Aussicht auf Erfolg angreifen lassen werden. Ein nach diesen
180 Gesichtspunkten entwickeltes Übersetzungsverfahren kann keine
181 Texte bearbeiten, die in einer realen Kommunikationssituation
182 produziert werden, weil fast in jedem Satz eines solchen Textes
183 sprachliche Mittel benutzt werden, die in der Teilsprache nicht
184 erlaubt sind. Die Texte zur Erprobung des Verfahrens müssen
185 also unter Berücksichtigung der syntaktischen und lexikalischen
186 Beschränkungen konstruiert werden und haben deswegen große
187 Ähnlichkeit mit Übungssätzen von Schulgrammatiken. Unter
188 linguistischem Aspekt scheint jedoch diese Vorgehensweise den
189 textorientierten Ansätzen überlegen zu sein, weil sie einerseits
190 die Gegenüberstellung von Problemen und deren Lösung erleichtert,
191 andererseits ungelöste Übersetzungsprobleme zu isolieren erlaubt.
192 Beschränkung auf normale Sprache. Innerhalb einer
193 natürlichen Sprache lassen sich verschiedene Sprachvarianten
194 unterscheiden, wie Dialekte, Soziolekte, wissenschaftliche
195 Fachsprachen und derleichen. Die Bildung einer Teilsprache durch
196 Idealisierung hat den Sinn, die Komplexität der natürlichen
197 Sprache zu reduzieren; deshalb ist es nichtzweckmäßig, bei der
198 Abgrenzung einer Teilsprache zu versuchen, alle diese Varianten
199 gleichmäßig, wenn auch in vereinfachter Form, in der
200 Teilsprache zu repräsentieren. Stattdessen wird die Teilsprache
201 an die in vager, aber verständlicher Weise als normale Sprache zu
202 bezeichnende Variante angelehnt. Genau genommen ist dieses
203 Prinzip bei der Erarbeitung bon Gramatiken und Wörterbüchern
204 natürlicher Sprachen immer angewandt worden, wenn auch in einer
205 abgeschwächten Weise. Satzübersetzung. Zur
206 korrekten Übersetzung eines Satzes, der Bestandteil eines
207 größeren Textes ist, werden im allgemeinen Informationen aus dem
208 umgebenden Text benötigt. Insbesondere enthalten Sätze oft
209 semantische Mehrdeutigkeiten, die von den vorangehenden oder
210 folgenden Sätzen her aufgelöst werden können. Regeln, nach
211 denen eine solche Auflösung erfolgt, sind jedoch bisher kaum
212 formuliert worden. Deswegen sind die zu einer Automatisierung
213 dieses Prozesses erforderlichen Vorarbeiten erst noch zu leisten.
214 Eine Syntax wird im allgemeinen als Satzsyntax entwickelt, die
215 keinen über die Satzgrenzen hinausgehenden Kontex berücksichtigt.
216 Das Problem einer Textsyntax ist zwar in neuerer Zeit erkannt
217 worden, aber es liegen noch keine in einem maschinellen Verfahren
218 verwendbaren Resultate vor. Aus diesem Grund wird das
219 Übersetzungsverfahren als Verfahren zur Übersetzung isolierter
220 Satze entwickelt. Geschriebene Sprache. Als
221 Ausgangsmaterial für die automatische Übersetzung wird
222 geschriebene Sprache benutzt. Unterscheidungen in der gesprochenen
223 Sprache, die sich nicht in der verwendeten Schrift niederschlagen,
224 wie Intonation und dergleichen, können deswegen in einem
225 maschinellen Übersetzungsverfahren nicht berucksichtigt werden.
226 Der Informationsverlust, der oft mit dem Übergang von
227 gesprochener zu geschriebener Sprache verbunden ist, kann vermieden
228 werden, wenn ein differenzierteres Notationssystem verwendet wird.
229 Prinzipiell kann ein Übersetzungsverfahren für beliebige
230 Notationssysteme eingerichtet werden. In dieser Arbeit wird
231 jedoch die übliche orthographische Notation benutzt. Wenn das
232 entwickelte Übersetzungsverfahren aufgrund dieser Wahl nicht in
233 der Lage ist, gewisse Merkmale der gesprochenen Sprache zu
234 berücksichtigen, so ist dies nicht dem Verfahren, sondern der
235 Notation anzulasten. In einem Punkt weicht die benutzte Notation
236 von der gewöhnlichen Schrift ab: Interpunktionszeichen werden
237 weggelassen. Diese Entscheidung wird als unwesentlich angesehen;
238 sie kann als Teil der Idealisierung betrachtet werden, wenngleich
239 sie nicht nur vereinfachende Wirkung hat. Englisch und
240 Deutsch als Beispielsprachen. Englisch und Deutsch weisen
241 aufgrund ihrer Verwandtschaft große syntaktische und semantische
242 Ähnlichkeit auf. Jedoch gibt es eine Reihe von Unterschieden,
243 deren korrekte Behandlung an ein automatisches
244 Übersetzungsverfahren erhebliche Anforderungen stellt. Deshalb
245 wird es für zweckmässig und lohnend gehalten, Üntersuchungen zur
246 automatischen Übersetzung zunächst anhand dieser Sprachen
247 durchzuführen. Es ist zu erwarten, daß die dabei gewonnenen
248 Erfahrungen und Erkenntnisse auch bei der Behandlung von Sprachen
249 verwertet werden können, die nicht oder nur sehr entfernt
250 miteinander verwandt sind, obwohl andererseits solche Sprachen
251 sicher neue Probleme aufwerfen. Von besonderem Interesse ist eine
252 automatische Übersetzung vom Englischen ins Deutsche insofern,
253 als die Flexion im Deutschen wesentlich stärker ausgeprägt ist
254 als im Englischen. Die Informationen, die zur Bildung der
255 korrekten Flexionsformen in der deutschen Übersetzung eines
256 englischen Satzes erforderlich sind, können also nicht aus
257 entsprechenden Flexionsformen im englischen Satz, sondern nur aus
258 dessen gesamter Struktur gewonnen werden. Methoden der
259 Untersuchung. Theoretische Fundierung. Die
260 Entwicklung eines automatischen Übersetzungsverfahrens wird nicht
261 als autonomes Ziel dieser Untersuchung angesehen. Sie ist
262 vielmehr zu verstehen als ein Beitrag zur Theorie der
263 Sprachbeschreibung und zur Theorie der Übersetzung. Es wird
264 allerdings für notwendig gehalten, solche Theorien in enger
265 Verbindung mit ihrer praktischen Erprobung zu entwickeln, damit in
266 jedem Stadium erkannt werden kann, in welchen Punkten die Theorie
267 zur effektiven Beschreibung der Sprachfakten nicht ausreicht und
268 ergänzt oder geändert werden muß. Die automatische Übersetzung
269 ist insofern ein geeignetes Mittel der praktischen Erprobung, als
270 sie hohe Anforderungen an die Präzision der theoretischen
271 Begriffsbildungen stellt.
Zum Anfang dieser Seite