Metodología de desarrollo léxico del Globasa

Paso Preliminar: Antes de apresurarse a expandir el diccionario de Globasa con una nueva palabra raíz, determine si la palabra deseada puede expresarse potencialmente a través de una palabra raíz ya establecida o mediante un método de formación de palabras (mediante afijos o palabras compuestas). Con base en esa determinación, decida si propone o no una nueva palabra raíz.

Metodología en tres partes:

(1) Establecer la fuente etimológica de la palabra

(2) Determinar la semántica de la palabra

(3) Determinar la forma exacta (letras) de la palabra

Establecimiento de la fuente etimológica

Advertencias

Las siguientes advertencias deben tenerse en cuenta durante el proceso de selección de fuentes. Siempre que sea necesario, se debe hacer un esfuerzo para adaptar las formas de las palabras en función de las advertencias a continuación utilizando la fuente etimológica más internacional. Sin embargo, si esto no es posible, se debe utilizar una fuente internacional menos amplia.

  • Nunca adopte pares mínimos con v y w, s y z, o con m y n en posición final de palabra

  • A menos que no haya absolutamente ninguna otra opción y se haya investigado a fondo por posibles problemas con las palabras adjuntas, nunca adopte pares mínimos con más/menos una consonante o vocal al principio/final de las palabras.

  • Siempre que sea posible, evitar parejas mínimas con l y r, b y p, f y p, c y j, c y x, h y r o pares mínimos con más/menos una vocal al principio/final de las palabras.

  • Siempre que sea posible, evitar cualquier par mínimo: Siempre que haya más de una opción de forma de palabra más o menos igual, elegir la forma que no crea un par mínimo.

  • Siempre que sea posible, evitar palabras monosílabas y palabras de más de tres sílabas: Siempre que haya más de una opción de fuente más o menos igual, elegir la fuente de dos o tres sílabas, o añadir una vocal a posteriori para producir una palabra de dos sílabas. Además, tenga en cuenta que Globasa prefiere las palabras de tres sílabas a las de dos sílabas.

  • Siempre que sea posible, evitar palabras que parezcan llevar afijos: Siempre que haya más de una opción de forma de palabra más o menos igual, elegir la forma que no parezca llevar afijos.

Algoritmo de selección de fuente

  • Verifique los siguientes idiomas en fuentes en línea como Google Translate, Wiktionary y Wikipedia, y use diccionarios impresos como apoyo en caso de duda.: inglés, francés, alemán, ruso, español, mandarín, japonés, coreano, vietnamita, hindi, télugu, árabe, swahili, persa, turco, indonesio, filipino. También puede probar la aplicación Globasa Etymology Helper.

    • Seleccione la fuente con la mayor cantidad de familias lingüísticas representadas.

      • El inglés, el francés, el alemán, el ruso y el español se consideran una sola familia.
      • El indonesio y filipino pertenecen a la misma familia.
      • El mandarín, coreano, japonés, vietnamita, hindi, télugu, árabe, swahili, persa y turco pertenecen a diferentes familias.
    • En caso de empate en el número de familias representadas, el orden de prioridad para la selección de la fuente es el siguiente:

      • Dos o más de los idiomas asiáticos: mandarín, japonés, coreano, vietnamita
      • Árabe, compatible con cualquier otro idioma o idiomas (persa o swahili, por ejemplo)
      • Hindi, compatible con cualquier otro idioma o idiomas (télugu, indonesio o cualquier idioma europeo, por ejemplo)
      • Idiomas europeos, compatibles con cualquier otro idioma o idiomas (indonesio, filipino o turco, por ejemplo)
      • persa y turco
    • Si no hay concordancia, haz una búsqueda más exhaustiva con otras clases de palabra o con sinónimos.

    • Si aún no hay acuerdo, elija la fuente más adecuada en función del siguiente orden de prioridad.

      • indonesio y filipino
      • árabe
      • swahili
      • mandarín
      • hindi
    • Tenga en cuenta que las advertencias anteriores siempre prevalecen sobre las pautas de selección de fuentes.

Determinar la semántica de la palabra

En este paso, se debe determinar si la nueva palabra raíz será una palabra sustantivo/verbo o una palabra adj/adv. Otras consideraciones deben ser si la nueva palabra raíz denotará una persona o una herramienta, o si la palabra que denota una persona o una herramienta se derivará de la nueva palabra raíz.

  • La clase de palabra generalmente se determina por la que parece ser más útil (es decir, la que se usa con más frecuencia en la práctica).

  • En algunos casos, la clase de palabra que parece más útil no está bien respaldada por los idiomas de origen, en cuyo caso, la clase de palabra se selecciona en función de la mayor compatibilidad en los idiomas de origen.

  • En algunos casos, se selecciona la clase de palabra que se usa con menos frecuencia para acomodar mejor las palabras derivadas. Por ejemplo, Globasa tiene termo (calor) como sustantivo, en lugar de algo como garme (caliente) para usar fácilmente termo en palabras científicas compuestas como termodinámica, así como para derivar más fácilmente palabras como termodo (calentado), a diferencia de garmegido.

  • En el caso de palabras que denotan personas, existen pautas específicas para determinar la palabra raíz. Algunas palabras que denotan profesiones se derivan con -yen o -kef, mientras que otras son palabras raíz. Las palabras derivadas que denotan profesiones se derivan de palabras raíz que denotan verbo/práctica, equipo o establecimiento (pero no la oficina del profesional). De lo contrario, la palabra que denota una profesión suele ser una palabra raíz: biskopo (obispo), etc.

    • verbo/practica

      • ato (acto) -- atoyen (actor)
      • medis (medicina) -- medisyen (médico)
      • injeneri (ingeniería) -- injeneriyen (ingeniero)
      • arkitetur (arquitectura) -- arkiteturyen (arquitecto)
      • jasusi (espionaje) -- jasusiyen (espía)
    • equipo

      • polisi (policía) -- polisiyen (oficial de policía)
      • askeri (ejército) -- askeriyen (soldado)
      • senato (senado) -- senatoyen (senador)
    • establecimiento

      • banko (banco) -- bankoyen (banquero)
      • eskol (escuela) -- eskolkef (director)
    • oficina del profesional

      • sekretari (secretario) -- sekretaridom (secretaría)

Determinar la forma exacta de la palabra

  • Aplicar las advertencias anteriores.

  • Intente encontrar un término medio al crear una mezcla entre las palabras en los distintos idiomas. Sin embargo, tenga en cuenta que las palabras provenientes de idiomas europeos tienden a favorecer la ortografía (consulte los detalles a continuación). Se debe hacer un esfuerzo para mantener las mezclas lo más naturales posible. Es decir, debería haber una diferencia de un solo fonema con respecto a la forma de cualquier lengua natural. Una diferencia de dos fonemas también es aceptable si los fonemas se aproximan a los de cualquier lengua natural.

  • Se debe hacer un esfuerzo para evitar palabras sustantivo/verbo que comiencen con las sílabas le-, xa-, nun-, ger-, be- y du- para evitar confusiones con las partículas verbales.

  • Seleccionar consonantes y vocales que sean las menos comunes en Globasa.

    • Si todo lo demás es más o menos igual, elija e en vez de a, e en vez de i, o en vez de cualquier otra vocal excepto u (u sobre o).
    • Si todo lo demás es más o menos igual, elige m en vez de n, l en vez de r, h en vez de k, g en vez de k, d en vez de t, p en vez de b.
    • Sin embargo, siendo todo lo demás más o menos igual, elige s en vez de z y w en vez de v.
  • Las raíces de las palabras en Globasa tienden a terminar en una vocal, preferiblemente una vocal a posteriori que se encuentra en al menos uno de los principales idiomas o familias de idiomas.

    • Ejemplos de vocales finales a posteriori: palabras en español que terminan en -o o -a, palabras en swahili que terminan en -i o -u, o palabras en japonés que terminan en -u.

    • Advertencias:

      • Advertencia 1: Si la palabra constara de cuatro o más sílabas, no se agrega la vocal si hay al menos un idioma que tenga la palabra terminada en consonante: estrutur, etc.
        • Sin embargo, los sustantivos/verbos que terminan en -ation/-ate en inglés siempre agregan -a en Globasa, independientemente de la longitud de la palabra: diskrimina, etc.
        • Además, las palabras que terminan en -ia/-io en español, en -aire/-oire en francés y en -y en inglés suelen terminar en -i en Globasa independientemente de la longitud de la palabra: ordinari, teritori, sekretari, etc.
      • Advertencia 2: En unas pocas palabras seleccionadas y muy comunes, no se agrega una vocal final para mantener la palabra en dos sílabas: eskol, alim, muhim, etc. Esto ahora es una advertencia cerrada, ya que se han agregado todas las palabras suficientemente comunes.
      • Advertencia 3: Si la etimología de una palabra incluye ocho o más idiomas y la palabra en cuestión termina en consonante, la palabra en Globasa no agrega una vocal final. Por ejemplo, ver tufan y salun. Comparar con safe, taru y jusu.
    • Una vocal a priori sólo debe agregarse si la última consonante es una que las reglas fonotácticas no permiten en la posición final de palabra (b, c, d, g, h, j, k, p, t, v, z) o para crear una palabra de dos sílabas si la palabra de origen consta de una sílaba (por ejemplo, consulte pole, que agrega -e para evitar pares mínimos con bol y pul). Para seleccionar una vocal a priori, utilice las siguientes pautas:

      • Indoeuropeo (romance, eslavo, germánico, hindi, persa): -i para verbos ingleses, de lo contrario -e.
      • Todos los demás (mandarín, japonés, coreano y vietnamita; árabe; indonesio y filipino): -u.
  • Se añade la vocal inicial a posteriori o a priori e- a grupos de consonantes iniciales no permitidos por la fonotáctica de Globasa: espageti, Esrilanka, Exkiperi, etc.

Palabras provenientes de idiomas europeos

  • Las palabras provenientes de idiomas europeos tienden a favorecer la ortografía tanto de consonantes como de vocales.

  • Las consonantes ⟨c⟩, ⟨g⟩ y ⟨s⟩, en particular, se mantienen intactas si existe al menos una lengua europea que las pronuncie como /tʃ/, /g/ y /s/ respectivamente: centro, geo, visita, etc.

  • Esta regla general es especialmente importante cuando se trata de la forma en que se traducen las vocales en idiomas que han tomado prestadas palabras europeas a través del inglés. Por ejemplo, la palabra para ron se traduce como /ram/ en muchos idiomas, como una aproximación del inglés /rʌm/. A pesar de que esta /a/ es más frecuente, Globasa conserva ⟨u⟩ en la ortografía original: rum.

  • Las palabras que terminan en -tion o -(s)sion en inglés y sus equivalentes en otros idiomas se representan de la siguiente forma: las palabras de dos sílabas terminan en -syon; las palabras más largas terminan en -si. Sin embargo, los verbos que terminan en -ate en inglés no llevan ni -syon ni -si, y simplemente terminan en -a.

Palabras provenientes del inglés

Las palabras que provienen principalmente del inglés se representan en Globasa según la siguiente regla general: si un fonema en inglés se puede representar fielmente con el inventario de Globasa, se favorece la pronunciación. De lo contrario, la forma de la palabra en Globasa favorece la ortografía inglesa. Advertencias: /oʊ/, como en post, note y boat, se convierte en ⟨o⟩; /ʊ/, como en foot, se convierte en ⟨u⟩; /z/ como en visit permanece como ⟨s⟩. Para ilustrar mejor:

  • Se favorece la ortografía de las llamadas vocales cortas así como de las vocales simples reducidas a /ə/: Alaska, Nevada, Misisipi, Boston, Konetikut, etc.

  • Se favorece la ortografía de ⟨er⟩, ⟨ir⟩ y ⟨ur⟩ pronunciados como /ɜr/: hamburger (hamburguesa), hamuster (hámster), eskirti (falda), etc.

  • Se favorece la ortografía de ⟨au⟩: Awgusta (Augusta)

  • La pronunciación tiene la preferencia en la mayoría de los grupos de vocales: Finiks (Phoenix), Wudrow (Woodrow), Tenesi (Tennessee)

  • Se favorece la pronunciación para ⟨are⟩: Delawer (Delaware)

  • Se favorece la pronunciación de las llamadas vocales largas, a excepción de la o larga, en cuyo caso se favorece la ortografía: beykon (bacon), eskeyti (skate), Aydaho (Idaho), Yuta (Utah); o larga: Ohayo (Ohio), etc.

  • Se favorece la pronunciación de la mayoría de las consonantes, excepto s cuando se pronuncia como /z/, en cuyo caso se favorece la ortografía: Misuri (Missouri)

Palabras provenientes del mandarín

Las palabras provenientes del mandarín generalmente se mezclan con sus respectivas formas en japonés, coreano y vietnamita. Por lo general, se hace un intento de simplificar la fonotáctica del mandarín cuando lo admiten los otros idiomas de Asia oriental, en particular el japonés.

  • La sílaba -ang del Pinyin a menudo se convierte en ⟨o⟩ en Globasa, como en japonés.

  • Las combinaciones de consonante más semivocal a menudo se reducen a la consonante.

  • Asimismo, los diptongos suelen reducirse a una vocal simple.

Palabras provenientes del árabe

  • El diptongo /au̯/ a menudo se reduce a ⟨o⟩, como se ve en swahili o persa: soti, etc.

  • El diptongo /aj/ en ocasiones se reduce a ⟨e⟩, como se ve en swahili: rehani, etc.

  • A menos que haya una opción naturalista diferente respaldada por el persa, el swahili, el turco, el indonesio o el hindi, las palabras sustantivo/verbo provenientes del árabe generalmente terminan en -u, como podemos ver el tiempo presente de los verbos en árabe.