x
1

Frecuencia de aparición de letras



El cálculo de la frecuencia de letras en una lengua es difícil y está sujeto a la interpretación. Se cuenta la frecuencia de las letras de un texto arbitrariamente largo, pero en los resultados influyen varios parámetros:

Si estos parámetros tienen un impacto espectacular en los símbolos menos frecuentes, es también sensible incluso para las letras más frecuentes.

Porcentaje de aparición de letras en español:[1]

Ordenadas de mayor a menor frecuencia de aparición obtenemos: E, A , O, S, R, N, I, D, L, C, T, U, M, P, B, G, V, Y, Q, H, F, Z, J, Ñ, X, K, W.

A partir de los datos anteriores, se puede decir que:

El texto del Quijote contiene 1.640.502 letras:

La Regenta

Se ha incluido la frecuencia del "espacio" o separador de palabras, así como las de los signos de puntuación " . ,  ;  : "

Hay que señalar los siguientes resultados: [2]

1. El separador o espacio es el signo más abundante, casi duplicando a la letra más frecuente.

2. La letra “a” es algo más abundante que la letra “e”.

3. Los signos de puntuación “,” y “.” son más abundantes que la letra “q” y siguientes. En cambio, como cabía esperar, los signos “;” y “:” son menos abundantes, aunque el "punto y coma" supera a la “ñ” y los "dos puntos" a la “k”.

Total 1 734 699 [2]

Si se cuenta la frecuencia de aparición en un diccionario, la letra más frecuente resulta ser la A, pero en el lenguaje escrito hay una gran cantidad de palabras cortas (que, le, se, etc.) que contienen la E, por lo que el recuento en textos esta letra suele ser más abundante, aunque no siempre, como en el caso de la novela La Regenta antes citado.

El alineamiento de las letras en una máquina linotipia es ETAOIN SHRDLU, que corresponde aproximadamente a las doce letras más frecuentes en inglés.



Escribe un comentario o lo que quieras sobre Frecuencia de aparición de letras (directo, no tienes que registrarte)


Comentarios
(de más nuevos a más antiguos)


Aún no hay comentarios, ¡deja el primero!