Velingua – die Termextrakt die so schön hat geprickelt in mein Bauchnabel
Bald ist es soweit: Das neue Terminologie-Extraktionssystem von Acolada mit dem verführerischen Namen “Velingua” wird bei beo zum Einsatz kommen. Ich freue mich schon darauf und möchte euch kurz aufzeigen, warum durch dieses Ereignis auch alle Projektmanager, Übersetzer, QA-Leute und fast alle sonstigen beos in Freudentaumel verfallen werden.
Das alte Termextraktformular – “Aua Mama, mach’s weg!”
Velingua basiert auf einer linguistischen Software und wurde auf unsere Anforderungen bei beo zugeschnitten. Der Einsatz der linguistischen Regeln und sonstigen Funktionen von Velingua bringt vor allem folgende Verbesserungen mit sich:
- Es werden weniger Textteile extrahiert, die eigentlich keine Wörter sind. Folglich muss man weniger Zeug aus den Termextraktformularen entfernen, das eigentlich keine Terminologie ist.
- Wenn flektierte Benennungen extrahiert werden, wie z.B. eine Benennung im Plural, dann erstellt Velingua automatisch die Grundform und schreibt diese als Kandidaten in das Word-Formular. Das klappt ersten Tests zufolge im Deutschen in ca. 70 % der Fälle. Nicht schlecht, wie ich finde. Es müssen deswegen weniger flektierte Benennungen in die Grundform umgewandelt werden.
- Velingua extrahiert nicht nur die Benennung selbst, sondern auch den Satz, in dem die Benennung vorkommt. Hier spricht der Fachmann auch von “Key Word In Context”, kurz “KWIC”. Mit dem KWIC habt ihr in vielen Fällen einen Kontext, anhand dessen man besser einschätzen kann, ob es sich bei dem Termkandidaten wirklich um Terminologie handelt, oder ob man ihn beruhigt löschen kann.
- Nach der Einführung der neuen Terminologie-Datenbank, die ebenfalls von Acolada entwickelt wird, werden wir die KWICs auch in die Terminologie-Datenbanken der Kunden einspielen. So können sich Übersetzer in Studio zusätzlich zu den Terminologie-Treffern auch die KWICs einblenden lassen und wissen dadurch häufiger als bisher, ob die vorgeschlagene zielsprachliche Benennung zu ihrem Ausgangstext passt.
Mit der Einführung von Velingua wollen wir auch gleich ein optisch und inhaltlich überarbeitetes Termextraktformular mit Anweisungen für Übersetzer verwenden (jetzt im hochmodernen 16:9 Breitbildformat!). Dabei werden wir auch die automatisch eingefügten Sprachenkürzel in den Tabellenköpfen und Dateinamen zu Studio-Sprachenkürzeln vereinheitlichen. Das sorgt ebenfalls für Zeitersparnis bei allen Beteiligten, da weniger manuelle Eingriffe nötig sind.
Vorläufiger Entwurf des neuen Termextraktformulars
– weil zu viel rot macht gute Laune tot (oder so …)
Alles wird gut. Wir müssen uns nur noch ein bisschen gedulden, denn bevor wir in den Genuss dieser Neuerungen kommen, müssen wir Velingua in unsere Systemumgebung einbinden und an einem ausgewählten Kunden testen.
Neben Velingua ist noch einiges mehr an “terminologischen” Neuerungen in Arbeit:
- Skripte zur Unterstützung bei der Terminologie-Bereinigung
- Eine neue Terminologie-Datenbank von Acolada
- Ein Skript für die Qualitätsprüfung von Terminologie
- Styleguides für Benennungen in verschiedenen Sprachen
- Das eine oder andere Webinar zu unser aller Erleuchtung
- …
Haltet also weiter Ausschau nach Blog-Beiträgen!