Limas: Hauptseite · Inhalt · Suchen · Feedback · Korpora.org · LINSE

Quelle Nummer 228

Rubrik 10 : SPRACHE Unterrubrik 10.02 : SPRACHWISSENSCHAFT

AUTOMATISCHE UEBERSETZUNG
KLAUS BROCKHAUS
AUTOMATISCHE UEBERSETZUNG
SCHRIFTEN ZUR LINGUISTIK BAND 2
FRIEDERICH VIEWEG UND SOHN GMBH, BRAUNSCHWEIG 1971
S. 1-

001  Einleitung. Historischer Abriss. Die
002  Bemühungen um eine automatische Übersetzung natürlicher
003  Sprachen sind, wenn man von einigen zwar wissenschaftsgeschichtlich
004  bemerkenswerten, aber für die heutige Problemstellung unwichtigen
005  Vorläufern absieht, etwa 20 Jahre alt. Sie begannen gerade zu
006  der Zeit, als die Entwicklung der Datenverarbeitungsanlagen
007  erkennen liess, dass eine Realisierung von automatischen
008  Übersetzungsprojekten nicht mehr aus technologischen Gründen von
009  vornherein unmöglich ist. Seit etwa 1950 beschäftigte sich, zum
010  Teil angeregt durch ein Memorandum von Warren Weaver, eine
011  allmählich wachsende Zahl von Wissenschaftlern mit Fragen der
012  maschinellen Übersetzung. Der ursprüngliche Optimismus
013  hinsichtlich der Erreichbarkeit einer vollautomatischen
014  Übersetzung von guter Qualität machte nach einigen Jahren einer
015  skeptischeren oder realistischeren Einstellung Platz. Im
016  allgemeinen wurden die aufgetretenen Schwierigkeiten zum Anlass
017  genommen, einzelne Fragen aus dem Problemkreis der maschinellen
018  Übersetzung detailliert zu untersuchen, um dadurch zu einer
019  schrittweisen Lösung der Aufgabe beizutragen. Darüber hinaus
020  wurde das Ziel selbst vorsichtiger formuliert; statt einer
021  vollautomatischen wurde zunächst eine teilweise automatische
022  Übersetzung ins Auge gefasst, die Anforderungen an die
023  Übersetzungsqualität wurden gesenkt, die zu übersetzenden Texte
024  wurden ganz bestimmten Gebieten entnommen. Der augenglickliche
025  Stand der Forschung auf dem Gebiet der automatischen Übersetzung
026  lässt sich etwa folgendermassen beschreiben: eine einwandfreie,
027  vollautomatische Übersetzung ist als praktisch unerreichbar erkannt;
028  Übersetzungsverfahren, die fehlerhafte, aber verständliche
029  Resultate für bestimmte Zwecke produzieren, existieren füe
030  einige Sprachenpaare; Arbeiten zur Entwicklung besserer
031  Verfahren oder zur Verbesserung existierender Verfahren sind
032  einmal aus praktischen Gründen sinnvoll, zum anderen aber können
033  sie dazu dienen, linguistische Erkenntnisse über die beteiligten
034  Sprachen und die Zusammenhänge zwischen diesen Sprachen zu
035  gewinnen. Probleme und Lösungsmethoden. Eine
036  ausführliche Übersicht über die bisher veröffentlichten
037  Untersuchungen aus dem Gebiet der automatischen Übersetzung ist
038  im Rahmen der vorliegenden Arbeit nicht möglich und insofern auch
039  nicht erforderlich, als es eine Reihe von Monographien und
040  Aufsatzsammlungen gibt, in denen die wichtigsten Ergebnisse
041  zusammengestellt sind. Deshalb sollen an dieser Stelle nur einige
042  Probleme und die zu ihrer Lösung vorgeschlagenen Methoden kurz
043  behandelt werden. Ausgangspunkt für die automatische Übersetzung
044  war die Wort-für-Wort-Übersetzung mithilfe eines
045  Wörterbuchs, dessen einzelne Eintragungen automatisch aufgerufen
046  werden, und das zu jedem vorgelegten Wort eine oder mehrere
047  Übersetzungsmöglichkeiten angibt. Die Beschränkungen dieses
048  Verfahrens sind offenkundig; da die Wörter verschiedener
049  Sprachen einander nicht eindeutig zugeordnet sind, können so nur
050  sehr mangelhafte Resultate erzielt werden, durch die allenfalls die
051  Arbeit eines menschlichen Übersetzers erleichtert werden kann.
052  Bedingt verständliche Übersetzungen spezieller Texte kann man
053  erhalten, wenn diese Texte vor Anwendung des Wort-für-
054  Wort-Verfahrens präpariert und nachher geglättet werden.
055  Diese halbautomatische Übersetzung ist jedoch unter theoretischem
056  Aspekt nur von geringem Wert. Durch Zerlegung der Wörter in
057  Stamm und Endung und Auswertung der in den Endungen enthaltenen
058  syntaktischen Informationen lassen sich unter günstigen
059  Bedingungen einfache syntaktische Beziehungen zwischen den
060  Wörtern eines Satzes ermitteln, so daß ein Wort in
061  Abhängigkeit von solchen Beziehungen zu seiner Umgebung in
062  verschiedener Weise übersetzt werden kann. Die bei dieser
063  Methode erzielbaren resultate sind besser als die der Wort-für
064  -Wort-Übersetzung, aber noch keineswegs zufriedenstellend,
065  insbesondere in bezug auf Probleme der Wortordnung,
066  Mehrdeutigkeit, Idiomatik und ähnliches. Erst der Übergang
067  von der einfachen oder modifizierten Wort-für Wort-
068  Übersetzung zur Satz-für-Satz-Übersetzung
069  eröffnete neue Perspektiven. Bei dieser Methode werden die zu
070  übersetzenden Sätze in einem ersten Schritt des automatischen
071  Verfahrens vollständig syntaktisch analysiert, so daß die
072  syntaktische Rolle jedes einzelnen Wortes innerhalb des Satzes
073  bekannt ist. Unter Verwendung der dadurch gewonnenen
074  Informationen erfolgt dann die Übersetzung. Sowohl für die
075  syntaktische Analyse als auch für die eigentliche Übersetzung
076  sind zahlreiche, in Einzelheiten sehr unterschiedliche Verfahren
077  erarbeitet worden, die aber fast alle auf der Beschreibung der
078  beteiligten Sprachen durch generative Syntaxen oder dazu
079  äquivalente Deskriptionssysteme beruhen. Durch die Konzeption
080  der Satz-für-Satz-Übersetzung ist das Problem der
081  automatischen Übersetzung natürlich noch nicht gelöst. Diese
082  Methode erfordert vielmehr eine intensive Detailarbeit sowohl im
083  Bereich der theoretischen Grundlagen als auch hinsichtlich der
084  konkreten Ausarbeitung von maschinell verwendbaren Syntaxen.
085  Resultate der Untersuchung. Auf der Grundlage spezieller
086  generativer Syntaxen für einen Teilbereich der englischen und der
087  deutschen Sprache ist ein in beiden Richtungen anwendbares
088  Übersetzungsverfahren entwickelt worden, das englische oder
089  deutsche Sätze, sofern sie zu dem erfaßten Teilbereich gehören,
090  im allgemeinen korrekt übersetzt. Falsche Übersetzungen sind
091  selten; etwas häufiger kann es vorkommen, daß die Übersetzung
092  eines Satzes abgebrochen wird, wenn es sich während des
093  Übersetzungsvorgangs herausstellt, daß die Übersetzungsregeln
094  nicht vollständig sind. Die erforderlichen Ergänzungen oder auch
095  Korrekturen der Übersetzungsregeln lassen sich jedoch meist in
096  einfacher Weise vornehmen. Die Übersetzung von Sätzen, die
097  nicht in dem erfaßten Teilbereich liegen, wird von dem Verfahren
098  gar nicht versucht. Jedoch ist das Verfahren so eingerichtet,
099  daß die Teilbereiche schrittweise erweitert werden können. Die
100  wesentlichen theoretischen Ergebnisse der Arbeit bestehen darin,
101  daß erstens eine Methode entwickelt und erfolgreich angewandt
102  worden ist, die es gestattet, sehr differenzierte generative
103  Syntaxen in einer formal einfachen und trotzdem relativ
104  anschaulichen Weise zu formulieren. Zweitens ist der Begriff der
105  Übersetzungssyntax eingeführt und als System von strukturellen
106  Zuordnungsregeln konkretisiert worden. Darin stellt sich der
107  Übersetzungsvorgang dar als ein durch die Struktur des zu
108  übersetzenden Satzes gesteuerter Aufbau der Struktur des
109  Übersetzungsresultats. Drittens ist die Übersetzungssyntax um
110  eine formal-semantische Komponente erweitert worden, wodurch
111  die Beschreibungskapazität wesentlich vergrößert wird.
112  Schließlich ist das entwickelte Übersetzungsverfahren von den
113  Sprachen Englisch und Deutsch vollkommen ablösbar, so daß es im
114  Prinzip für die Übersetzung zwischen beliebigen Sprachen zu
115  gebrauchen ist. Insofern stellt es einen Beitrag zu einer
116  allgemeinen Theorie der Übersetzung dar. Allgemeiner
117  Teil. Ziele der Untersuchung Linguistische
118  Erkenntnisse.. Die meisten Projekte zur automatischen
119  Übersetzung natürlicher Sprachen sind darauf ausgerichtet,
120  Verfahren zu entwickeln, mit denen sich Texte, meist spezielle
121  Arten von Texten, für praktische Zwecke übersetzen lassen.
122  Die Übersetzungsprogramme sollen unter ökonomischem Aspekt mit
123  menschlichen Übersetzern konkurrieren können oder ihnen überlegen
124  sein. Wichtige Faktoren sind dabei Kosten, Schnelligkeit und
125  Qualität. Die automatische Übersetzung braucht die menschliche
126  nicht unbedingt in bezug auf sämtliche Faktoren zu übertreffen;
127  es ist denkbar, daß beispielsweise schlechtere Qualität und sogar
128  höhere Kosten in kauf genommen werden, wenn andererseits die
129  schnelle Verfügbarkeit großer Textmengen gewährleistet ist.
130  Dieser Gesichtspunkt der praktischen Verwendbarkeit spielt bei der
131  vorliegenden Untersuchung keine entscheidende Rolle. Es kommt
132  vielmehr darauf an, bei der Entwicklung des
133  Übersetzungsverfahrens und bei der Aufbereitung der beteiligten
134  Sprachen für die automatische Übersetzung linguistische
135  Erkenntnisse über die Form der Beschreibung natürlicher
136  Sprachen und des Zusammenhangs zwischen natürlichen Sprachen zu
137  gewinnen. Der Erwartung, daß dieses Ziel im Rahmen der
138  Beschäftigung mit dem Problem der automatischen Übersetzung
139  erreicht werden kann, liegt die Annahme zugrunde, daß der Zwang
140  zu einer formalen, automatischen Bearbeitungen zugänglichen
141  Darstellung der sprachlichen Fakten dazu führt, daß Begriffe
142  schärfer definiert, Probleme klarer erkannt und Fragen
143  verbindlicher beantwortet werden. Idealisierung der
144  Sprachen. Ein Übersetzungsverfahren mit der soeben
145  beschriebenen linguistischen Zielsetzung ist der Notwendigkeit
146  enthoben, vorgegebene Texte recht oder schlecht zu übersetzen.
147  Es ist vielmehr bei dieser Aufgabenstellung möglich, daß in
148  empirischen Disziplinen bei der Erforschung komplexer Sachverhalte
149  bewährte Mittel der Idealisierung anzuwenden. Wie bei der
150  Formulierung der Fallgesetze der Luftwiderstand zunächst
151  unberücksichtigt bleibt oder in der kinetischen Gastheorie ein
152  " ideales " Gas hypostasiert wird, lassen sich in natürlichen
153  Sprachen durch eine Beschränkung ihres Ausdrucksreichtums
154  idealisierte Teilsprachen abgrenzen. Auf diese Weise können
155  einzelne sprachliche Phänomene isoliert untersucht werden;
156  allerdings ist darauf zu achten, daß die so gewonnenen Ergebnisse
157  miteinander verträglich sind und zu einer Beschreibung der
158  komplexen, natürlichen Sprache integriert werden können.
159  Vorrang der Syntax. Die Methode der Bildung einer
160  idealisierten Teilsprache aus einer natürlichen Sprache wird in
161  dieser Arbeit angewandt und zu einem Approximationsprozess
162  ausgebaut. Und zwar werden zunächst die syntaktischen
163  Möglichkeiten in der Weise eingeschränkt, daß nur einfache
164  Aussagesätze mit gewissen Ergänzungen konstruierbar sind.
165  Später ist es dann im Prinzip möglich, die vorläufig
166  ausgeschlossenen syntaktischen Mittel nach und nach wieder
167  zuzulassen und in die Untersuchung einzubeziehen, so daß die
168  behandelte Teilsprache sich allmählich immer weniger von der
169  natürlichen Sprache unterscheidet, aus der sie durch
170  Idealisierung gewonnen wurde. Noch stärker als die Syntax wird
171  das Lexikon beschränkt; einmal wird nur eine relativ kleine
172  Anzahl von Wörtern in den Wortschatz der Teilsprache aufgenommen,
173  zum anderen werden die aufgenommenen Wörter nur mit einem Teil
174  ihrer Verwendungsmöglichkeiten und Bedeutungen berücksichtigt.
175  Die Teilsprachen werden also in semantischer Hinsicht wesentlich
176  stärker idealisiert als in syntaktischer, und zwar deswegen, weil
177  anzunehmen ist, daß die schwierigeren semantischen Probleme sich
178  nur auf der Grundlage einer hinreichend weit ausgebauten Syntax mit
179  Aussicht auf Erfolg angreifen lassen werden. Ein nach diesen
180  Gesichtspunkten entwickeltes Übersetzungsverfahren kann keine
181  Texte bearbeiten, die in einer realen Kommunikationssituation
182  produziert werden, weil fast in jedem Satz eines solchen Textes
183  sprachliche Mittel benutzt werden, die in der Teilsprache nicht
184  erlaubt sind. Die Texte zur Erprobung des Verfahrens müssen
185  also unter Berücksichtigung der syntaktischen und lexikalischen
186  Beschränkungen konstruiert werden und haben deswegen große
187  Ähnlichkeit mit Übungssätzen von Schulgrammatiken. Unter
188  linguistischem Aspekt scheint jedoch diese Vorgehensweise den
189  textorientierten Ansätzen überlegen zu sein, weil sie einerseits
190  die Gegenüberstellung von Problemen und deren Lösung erleichtert,
191  andererseits ungelöste Übersetzungsprobleme zu isolieren erlaubt.
192  Beschränkung auf normale Sprache. Innerhalb einer
193  natürlichen Sprache lassen sich verschiedene Sprachvarianten
194  unterscheiden, wie Dialekte, Soziolekte, wissenschaftliche
195  Fachsprachen und derleichen. Die Bildung einer Teilsprache durch
196  Idealisierung hat den Sinn, die Komplexität der natürlichen
197  Sprache zu reduzieren; deshalb ist es nichtzweckmäßig, bei der
198  Abgrenzung einer Teilsprache zu versuchen, alle diese Varianten
199  gleichmäßig, wenn auch in vereinfachter Form, in der
200  Teilsprache zu repräsentieren. Stattdessen wird die Teilsprache
201  an die in vager, aber verständlicher Weise als normale Sprache zu
202  bezeichnende Variante angelehnt. Genau genommen ist dieses
203  Prinzip bei der Erarbeitung bon Gramatiken und Wörterbüchern
204  natürlicher Sprachen immer angewandt worden, wenn auch in einer
205  abgeschwächten Weise. Satzübersetzung. Zur
206  korrekten Übersetzung eines Satzes, der Bestandteil eines
207  größeren Textes ist, werden im allgemeinen Informationen aus dem
208  umgebenden Text benötigt. Insbesondere enthalten Sätze oft
209  semantische Mehrdeutigkeiten, die von den vorangehenden oder
210  folgenden Sätzen her aufgelöst werden können. Regeln, nach
211  denen eine solche Auflösung erfolgt, sind jedoch bisher kaum
212  formuliert worden. Deswegen sind die zu einer Automatisierung
213  dieses Prozesses erforderlichen Vorarbeiten erst noch zu leisten.
214  Eine Syntax wird im allgemeinen als Satzsyntax entwickelt, die
215  keinen über die Satzgrenzen hinausgehenden Kontex berücksichtigt.
216  Das Problem einer Textsyntax ist zwar in neuerer Zeit erkannt
217  worden, aber es liegen noch keine in einem maschinellen Verfahren
218  verwendbaren Resultate vor. Aus diesem Grund wird das
219  Übersetzungsverfahren als Verfahren zur Übersetzung isolierter
220  Satze entwickelt. Geschriebene Sprache. Als
221  Ausgangsmaterial für die automatische Übersetzung wird
222  geschriebene Sprache benutzt. Unterscheidungen in der gesprochenen
223  Sprache, die sich nicht in der verwendeten Schrift niederschlagen,
224  wie Intonation und dergleichen, können deswegen in einem
225  maschinellen Übersetzungsverfahren nicht berucksichtigt werden.
226  Der Informationsverlust, der oft mit dem Übergang von
227  gesprochener zu geschriebener Sprache verbunden ist, kann vermieden
228  werden, wenn ein differenzierteres Notationssystem verwendet wird.
229  Prinzipiell kann ein Übersetzungsverfahren für beliebige
230  Notationssysteme eingerichtet werden. In dieser Arbeit wird
231  jedoch die übliche orthographische Notation benutzt. Wenn das
232  entwickelte Übersetzungsverfahren aufgrund dieser Wahl nicht in
233  der Lage ist, gewisse Merkmale der gesprochenen Sprache zu
234  berücksichtigen, so ist dies nicht dem Verfahren, sondern der
235  Notation anzulasten. In einem Punkt weicht die benutzte Notation
236  von der gewöhnlichen Schrift ab: Interpunktionszeichen werden
237  weggelassen. Diese Entscheidung wird als unwesentlich angesehen;
238  sie kann als Teil der Idealisierung betrachtet werden, wenngleich
239  sie nicht nur vereinfachende Wirkung hat. Englisch und
240  Deutsch als Beispielsprachen. Englisch und Deutsch weisen
241  aufgrund ihrer Verwandtschaft große syntaktische und semantische
242  Ähnlichkeit auf. Jedoch gibt es eine Reihe von Unterschieden,
243  deren korrekte Behandlung an ein automatisches
244  Übersetzungsverfahren erhebliche Anforderungen stellt. Deshalb
245  wird es für zweckmässig und lohnend gehalten, Üntersuchungen zur
246  automatischen Übersetzung zunächst anhand dieser Sprachen
247  durchzuführen. Es ist zu erwarten, daß die dabei gewonnenen
248  Erfahrungen und Erkenntnisse auch bei der Behandlung von Sprachen
249  verwertet werden können, die nicht oder nur sehr entfernt
250  miteinander verwandt sind, obwohl andererseits solche Sprachen
251  sicher neue Probleme aufwerfen. Von besonderem Interesse ist eine
252  automatische Übersetzung vom Englischen ins Deutsche insofern,
253  als die Flexion im Deutschen wesentlich stärker ausgeprägt ist
254  als im Englischen. Die Informationen, die zur Bildung der
255  korrekten Flexionsformen in der deutschen Übersetzung eines
256  englischen Satzes erforderlich sind, können also nicht aus
257  entsprechenden Flexionsformen im englischen Satz, sondern nur aus
258  dessen gesamter Struktur gewonnen werden. Methoden der
259  Untersuchung. Theoretische Fundierung. Die
260  Entwicklung eines automatischen Übersetzungsverfahrens wird nicht
261  als autonomes Ziel dieser Untersuchung angesehen. Sie ist
262  vielmehr zu verstehen als ein Beitrag zur Theorie der
263  Sprachbeschreibung und zur Theorie der Übersetzung. Es wird
264  allerdings für notwendig gehalten, solche Theorien in enger
265  Verbindung mit ihrer praktischen Erprobung zu entwickeln, damit in
266  jedem Stadium erkannt werden kann, in welchen Punkten die Theorie
267  zur effektiven Beschreibung der Sprachfakten nicht ausreicht und
268  ergänzt oder geändert werden muß. Die automatische Übersetzung
269  ist insofern ein geeignetes Mittel der praktischen Erprobung, als
270  sie hohe Anforderungen an die Präzision der theoretischen
271  Begriffsbildungen stellt.

Zum Anfang dieser Seite

Korpora.org