Transkriptionskonzepte - dataflow_designer - spectrum_quality_1 - 23 - 23.1

Spectrum Data Quality-Handbuch

Product type
Software
Portfolio
Verify
Product family
Spectrum
Product
Spectrum > Qualität > Spectrum Quality
Version
23.1
Language
Deutsch
Product name
Spectrum Data Quality
Title
Spectrum Data Quality-Handbuch
First publish date
2007
Last updated
2023-10-25
Published on
2023-10-25T06:24:19.942092

Es gibt eine Reihe allgemeiner erwünschter Eigenschaften bei der Transkription von Schriften. Eine gute Transkription sollte über folgende Eigenschaften verfügen:

  • Abgeschlossen
  • vorhersagbar
  • aussprechbar
  • eindeutig

Diese Eigenschaften werden selten gleichzeitig erfüllt. Der Transliterator-Schritt versucht daher, eine gute Balance zu finden.

Abgeschlossen

Jede wohlgeformte Zeichenfolge der Quellschrift sollte in eine Zeichenfolge der Zielschrift transkribiert werden.

vorhersagbar

Die Buchstaben selbst sollten (ohne Kenntnis der Sprachen, die in dieser Schrift geschrieben werden), basierend auf einer relativ kleinen Anzahl von Regeln, für die Transkription ausreichend sein. So kann die Transkription mechanisch durchgeführt werden.

aussprechbar

Die Transkription ist weniger nützlich, wenn der Prozess die Zeichen einfach zuordnet, ohne ihre Aussprache zu beachten. Das einfache Mapping von „αβγδεζηθ...“ zu „abcdefgh...“ würde Zeichenfolgen ergeben, die möglicherweise vollständig und eindeutig sind, aber nicht ausgesprochen werden können.

Standardmäßige Transkriptionsmethoden befolgen oft nicht die Ausspracheregeln einer bestimmten Sprache in der Zielschrift. Das japanische Hepburn-System verwendet beispielsweise ein „j“ mit dem englischen Lautwert (im Gegensatz zum deutschen, französischen oder spanischen Lautwert), jedoch auch Vokale, die nicht den englischen Standardklang aufweisen. Eine Transkriptionsmethode könnte auch besondere Kenntnisse erfordern, um die korrekte Aussprache zu erreichen. Beispielsweise wird im japanischen Kunrei-Siki-System „tu“ als „tsu“ ausgesprochen. Ähnlich verhält es sich in Situationen, in denen unterschiedliche Sprachen dieselbe Schrift verwenden. Ein sachkundiger Leser wird beispielsweise beim Wort „Vase“ als deutsches Wort das „V“ wie ein „W“ aussprechen.

In einigen Fällen kann die Transkription stark von Traditionen beeinflusst sein. Beispielsweise klingt der Buchstabe „beta“ (β ) des modernen Griechisch wie ein „w“, doch könnte eine Transformation weiterhin ein „b“ wie in „Biologie“ verwenden. In diesem Fall müssten Benutzer wissen, dass ein „b“ im transkribierten Wort „beta“ (β ) entspricht und in modernem Griechisch als „w“ ausgesprochen werden muss. Buchstaben können auch je nach Kontext unterschiedlich transkribiert werden, um die Aussprache vorhersagbarer zu gestalten. Da zum Beispiel die griechische Folge „GAMMA GAMMA“ (γγ ) als „ng“ ausgesprochen wird, kann das erste „GAMMA“ als „n“ transkribiert werden.

Anmerkung: Im Allgemeinen erzeugt englischer Text keine phonetischen Ergebnisse, um bei der Transkription lateinischer Schrift in andere Schriften vorhersagbare Ergebnisse zu liefern. Der Grund liegt darin, dass die englische Aussprache nicht einfach aus den Buchstaben eines Worts vorhergesagt werden kann. Beispielsweise enden die Wörter „grove“, „move“ und „love“ alle mit „ove“, werden aber unterschiedlich ausgesprochen.

eindeutig

Es sollte immer möglich sein, den Text in der Quellschrift aus der Transkription in die Zielschrift wiederherzustellen. Beispielsweise sollte es möglich sein, von „Elláda“ wieder zurück zum ursprünglichen Wort Ελλάδα zu gelangen. Bei der Transkription können jedoch mehrere Zeichen Zweideutigkeiten erzeugen. Der griechische Buchstabe „PSI“ (ψ ) wird beispielsweise „ps“ zugeordnet, doch könnte „ps“ auch aus der Folge „PI SIGMA“ (πσ ) stammen, da „PI“ (π ) zu „p“ und „SIGMA“ (σ ) zu „s“ zugeordnet ist.

Um dem Problem der Zweideutigkeit Rechnung zu tragen, verwendet Transliterator ein Apostroph, um Zeichenfolgen eindeutig zu machen. Der griechischen Zeichenfolge „PI SIGMA“ (πσ ) wird bei diesem Verfahren „p's“ zugeordnet. Wenn im Japanischen eine zweideutige Folge in der Zielschrift nicht aus einem einzelnen Buchstaben resultiert, verwendet die Transformation ein Apostroph, um Eindeutigkeit zu schaffen. Durch dieses Verfahren wird zum Beispiel zwischen „man'ichi“ und „manichi“ unterschieden.

Anmerkung: Einige Zeichen einer Zielschrift sind normalerweise nicht außerhalb eines gewissen Kontexts zu finden. Zum Beispiel steht das kleine japanische Zeichen „ya“ wie in „kya“ (キャ ) normalerweise nicht alleine. Zur Verarbeitung von solchen Zeichen verwendet Transliterator eine Tilde. Beispielsweise würde die Eingabe „~ya“ ein isoliertes kleines „ya“ erzeugen. Bei der Transkription in Griechisch würde die Eingabe „a~s“ ein nicht am Ende stehendes griechisches „sigma“ (ασ ) am Ende eines Worts erzeugen. Ähnlich würde die Eingabe „~sa“ ein am Ende stehendes „sigma“ an einer mittleren Position (ςα ) erzeugen.

Bei der allgemeinen Schrifttransformation besteht eine gebräuchliche Technik zur Reversibilität darin, zusätzliche Akzente zu verwenden, um Buchstaben zu unterscheiden, die möglicherweise nicht anders unterschieden werden können. Im Folgenden finden Sie beispielsweise einen griechischen Text der voll reversibler lateinischer Schrift zugeordnet wurde: