Conceptos de transcripción - dataflow_designer - spectrum_quality_1 - 23.1

Guía de Spectrum Data Quality

Product type
Portfolio
Verify
Product family
Spectrum
Product
Spectrum > Quality > Spectrum Quality
Version
23.1
Language
Español (México)
Product name
Spectrum Data Quality
Title
Guía de Spectrum Data Quality
First publish date
2007
Last updated
2024-02-07
Published on
2024-02-07T17:21:06.785000

Existe una serie de características que, por lo general, son recomendables para las transcripciones de alfabetos. Una buena transcripción debe ser:

  • Finalizado
  • Predecible
  • Pronunciable
  • Inequívoca

Rara vez se satisfacen simultáneamente todas estas características, por eso la etapa Transliterator intenta equilibrar estos requerimientos.

Finalizado

Toda secuencia de caracteres bien formada en el sistema de escritura de origen debe transcribirse a una secuencia de caracteres del sistema de escritura de destino.

Predecible

Las letras por sí mismas (sin conocimiento alguno de los idiomas escritos en ese alfabeto) deben ser suficientes para la transcripción, de acuerdo con una cantidad relativamente pequeño de reglas. De esa forma, es posible que la transcripción se realice mecánicamente.

Pronunciable

La transcripción no es tan útil si el proceso simplemente asigna los caracteres independientemente de su pronunciación. Tan solo asignar “αβγδεζηθ…” a “abcdefgh…” produciría cadenas que pueden estar completas y ser ambiguas, pero que no se pueden pronunciar.

Con frecuencia, los métodos de transcripción estándar no siguen las reglas de pronunciación de ningún idioma en particular en el sistema de escritura de destino. Por ejemplo, el sistema Hepburn japonés utiliza una "j" que tiene el valor fonético del inglés (en oposición al del francés, el alemán o el español), pero utiliza vocales que no tienen los sonidos estándares del inglés. Un método de transcripción también puede requerir cierto conocimiento especial para lograr la pronunciación correcta. Por ejemplo, en el sistema japonés kunrei-siki, "tu" se pronuncia "tsu". Es similar a las situaciones en las que existen diferentes idiomas dentro del mismo alfabeto. Por ejemplo, si se sabe que la palabra Gewalt proviene del alemán, un lector entendido pronunciará la "w" como una "v".

En algunos casos, la transcripción puede ser fuertemente influenciada por la tradición. Por ejemplo, la letra griega moderna beta (β ) suena como una “v”, pero puede que una transformación siga utilizándola como una “b” (como en “biología”). En ese caso, el usuario debería saber que una “b” en la palabra transcrita corresponde a beta (β ) y que se pronuncia como una “v” en griego moderno. Las letras también pueden ser transcritas de forma diferente de acuerdo con el contexto para hacer que la pronunciación sea más predecible. Por ejemplo, puesto que la secuencia del griego GAMMA GAMMA (γγ ) se pronuncia como “ng”, la primera GAMMA puede transcribirse como una “n”.

Nota: En general, para producir resultados predecibles en la transcripción de alfabetos latinos a otros alfabetos, el texto en inglés no producirá resultados fonéticos. Ello se debe a que la pronunciación del inglés no puede ser predicha fácilmente a partir de las letras que conforman una palabra. Por ejemplo, las palabras "grove", "move" y "love" terminan con las letras "ove", pero se pronuncian de maneras muy diferentes.

Inequívoca

Siempre debería ser posible recuperar el texto en el tipo de escritura de origen a partir de la transcripción en el tipo de escritura de destino. Por ejemplo, debería poder volver de Elláda al original Ελλάδα . Sin embargo, en la transcripción muchos caracteres pueden producir ambigüedades. Por ejemplo, el carácter griego PSI (ψ ) se asigna a ps, pero ps también podría ser el resultado de la secuencia PI, SIGMA (πσ ) ya que PI (π ) se asigna a p y SIGMA (σ ) se asigna a s.

Para solucionar el problema de la ambigüedad, Transliterator utiliza un apóstrofo para desambiguar las secuencias de caracteres. Mediante este procedimiento, el carácter del griego PI SIGMA (πσ ) se asigna a p's. En japonés, cuando una secuencia ambigua en el sistema de escritura de destino no proviene de una única letra, la transcripción utiliza un apóstrofo para desambiguarla. Por ejemplo, utiliza este procedimiento para distinguir entre man'ichi y manichi.

Nota: Algunos caracteres del sistema de escritura de destino, por lo general, no se encuentran fuera de ciertos contextos. Por ejemplo, el carácter japonés pequeño “ya”, por ejemplo en “kya” (キャ ), no suele encontrarse solo. Para marcar una distinción entre esos caracteres, Transliterator utiliza una tilde. Por ejemplo, la entrada "~ya" produciría una "ya" pequeña aislada. Cuando se transcribe al griego, la entrada “a~s” produce una sigma (ασ ) no final del griego al final de una palabra. De la misma manera, la entrada “~sa” produciría una sigma final en una posición no final (ςα ).

Para las transformaciones generales de alfabetos, una técnica frecuente a fin de lograr la reversibilidad es utilizar acentos que distingan letras que, de lo contrario, no podrían distinguirse. Por ejemplo, el siguiente ejemplo muestra texto en griego que se asigna al latín y es completamente reversible: