IDENTIFICAÇÃO DE CLASSES

Revendo a diferença fundamental entre cifras de substituição e cifras de transposição, observa-se que

O termo Distribuição de Frequência Uniliteral - DFU (Uniliteral Frequency Distribution - UFD) é utilizado para identificar uma cifra de substituição simples.

* Observação: é uniLITERAL e não unilateral. Uni de "um" e literal, que significa "expresso por letras". Daí, uniliteral = expresso por apenas uma letra.

Três propriedades podem ser observadas através de uma DFU aplicada a um texto cifrado composto por letras e de tamanho médio:

CLASSE DE CIFRA

Como a cifra de transposição rearranja o texto original sem alterar as entidades do mesmo, o número de vogais (A, E, I, O, U, Y), de consoantes de alta frequência (C, D, N, M, R, S, T), de consoantes de frequência média (B, F, G, H, L, P, Q, V) e, especialmente as consoantes de baixa frequência (J, K, W, X, Z), são exatamente as mesmas no texto cifrado e no texto original. Numa cifra de substituição, as porcentagens convencionais de vogais e consoantes são alteradas no texto cifrado.

À medida que o tamanho das mensagens cifradas diminui, existe uma maior probabilidade de desvios da proporção normal de vogais e consoantes. À medida que o tamanho dos textos cifrados aumenta, os desvios se tornam cada vez menores.

Com 1.000 letras ou mais, praticamente não existe diferença entre as proporções teóricas e as reais. Friedman mostra uma tabela mostrando a expectativa normal para vogais, consoantes de frequência alta, média e baixa, além da expectativa de brancos (blanks).

Por exemplo, numa mensagem de 100 letras em Português devem existir cerca de 48 vogais(A, E, I, O, U), aproximadamente 37 consoantes de alta frequência (S, R, N, D, M, T, C) e cerca de 13 consoantes de frequência média (L, P, V, G, H, Q, B, F). Ainda se espera 2 consoantes de frequência baixa (Z, J, X, K, W, Y).

Uma classe de cifra é considerada como de transposição se o texto cifrado estiver dentro dos limites acima citados. Será considerada como sendo de substituição se os valores encontrados estiverem fora dos limites convencionados para o comprimento da mensagem. [Friedman1/ p32-39]

DISTRIBUIÇÃO DE FREQUÊNCIA UNILITERAL - DFU

A distribuição de frequência uniliteral (DFU) pode ser utilizada para indicar a monoalfabeticidade. A distribuição normal mostra cristas (elevaçõess) e vales (depressões) devido a dois fatores:

O mapeamento da correspondência um-para-um entre a mensagem original e a mensagem cifrada mostrará uma DFU deslocada, com posições absolutas dos cristas e vales diferentes do normal.

Cristas e vales evidentes na DFU de um criptograma é indicativo de que se trata de uma cifra monoalfabética. Este é um dos testes para a cifra de substituição mono/polialfabética.

Numa DFU, a ausência de cristas e vales evidentes indica uma forma complexa de substituição. O aspecto achatado da distribuição é um dos critérios para a rejeição da hipótese de uma substituição monoalfabética.

TESTE LAMBDA DA EXPECTATIVA DE BRANCOS - LB^

Friedman mostra uma tabela com os resultados de um teste LB^ para brancos em mensagens em Inglês até 200 letras. [Friedman1] Soloman Kullback deriva o teste Lambda e mostra uma dados detalhados de probabilidade em Inglês, Francês, Alemão, Italiano, Japonês, Português, Russo e Espanhol. [Kullback]

Estudos estatísticos mostram que o número de ocorrência de brancos em uma mensagem original normal é previsível. A tabela de Friedman mostra que os limites do texto original (P) e da expectativa randômica (R) são uma função do tamanho da mensagem. Nesta tabela, uma coleção randômica de letras corresponde a uma mensagem cifrada polialfabética.

O número de alfabetos utilizados é grande o suficiente para aproximar uma DFU idêntica a uma distribuição de letras tomadas ao acaso.

TESTE PHI PARA MONOALFABETICIDADE

Este teste compara o valor PHI(o) observado para a distribuição que esteja sendo testada com o valor PHI(r) randômico e o valor PHI(p) esperado no texto original. Para textos militares em Inglês os valores são:

onde N é o número de elementos na distribuição. A constante .0385 é o equivalente decimal de 1/26 e a constante .0667 é a soma dos quadrados das probabilidades de ocorrência de cada uma das letras no texto original em Inglês. [Friedman3]

Exemplo 1

Teste PHI do seguinte criptograma:

OWQWZ AEDTD QHHOB AWFTZ WODEQ
TUWRQ BDQRO XHQDA GTBDH PZRDK


f 3 3 7 2 1 1 4 1 4 1 6 3 4 1 5 1 3
TC A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
f(f-1) 6 6 42 2 0 0 12 0 12 0 30 6 12 0 20 0 6

Onde:

Como valor observado PHI(o) = 154 se aproxima mais do valor esperado no texto original PHI(p) = 163 do que do valor randômico PHI(r) = 94, existe uma corroboração matemática da hipótese de que o texto cifrado seja monoalfabético.

Exemplo 2

Na distribuição do texto cifrado indicada abaixo:

f 1 1 1 2 1 1 1 3 1 1 1 2 1 1 1 1 2 3
TC A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
f(f-1) 0 0 0 2 0 0 0 6 0 0 0 2 0 0 0 0 2 6

Como o valor observado PHI(o) está mais próximo do valor randômico PHI(r), então esta distribuição de letras NÃO é monoalfabética.


Antes de tirar conclusões apressadas e considerar este teste como perfeito, faça o PHI com "a quick brown fox jumps over the lazy dog".

f 2 1 1 1 2 1 1 1 1 1 1 1 1 1 4 1 1 2 1 1 1 1 1 1 1 2
TC A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
f(f-1) 2 0 0 0 2 0 0 0 0 0 0 0 0 0 12 0 0 2 0 0 0 0 0 0 0 2

Como o valor observado PHI(o) é menos que a metade do valor randômico PHI(r), isto sugere que as letras desta frase não poderiam estar em texto original e inteligível em qualquer língua. E agora? Se você não encontrou uma explicação racional para este último exemplo, aguarde a derivação simplificada de Sinkov.

TABELAS DE KULLBACK

Textos monoalfabéticos e digrâmicos para oito línguas:

Língua Texto Monoalfabético Texto Digrâmico
Inglês 0.0661N(N-1) 0.0069N(N-1)
Francês 0.0778N(N-1) 0.0093N(N-1)
Alemão 0.0762N(N-1) 0.0112N(N-1)
Italiano 0.0738N(N-1) 0.0081N(N-1)
Japonês 0.0819N(N-1) 0.0116N(N-1)
Português 0.0791N(N-1)
Russo 0.0529N(N-1) 0.0058N(N-1)
Espanhol 0.0775N(N-1) 0.0093N(N-1

Texto Randômico
Monogrâmico Digrâmico Trigrâmico
0.038N(N-1) 0.0015N(N-1) 0.000057N(N-1)

ÍNDICE DE COINCIDÊNCIA OU TESTE KAPPA DE FRIEDMAN

É de Friedman o famoso Índice de Coincidência. É mais um método para expressar a monoalfabeticidade de um criptograma. Compara-se o I.C. teórico com o I.C. obtido.

O I.C. é definido como sendo a razão entre PHI(o)/PHI(r). Utilizando o exemplo 1 descrito acima, pode-se calcular o I.C.=154/94=1.64. O I.C. teórico para o Inglês é 1.73 (ou .0667/.0385). O I.C. de um texto randômico é igual a 1 (ou .0385/.0385).

Em 1920 Friedman escreveu um texto intitulado "O Índice de Coincidência e sua Aplicação na Criptografia" ("The Index of Coincidence and Its Application in Cryptography") que é, talvez, o tratado mais importante na história da criptografia. [Friedman2]

ALFABETOS CIFRANTES - PADRÃO OU DESORDENADOS

Partindo de premissa de que uma DFU seja monoalfabética, observa-se as cristas e os vales da distribuição. Se as cristas e os vales ocuparem posições deslocadas em relação à DFU normal, então o alfabeto tem toda probabilidade de ser ordenado ou padrão (A, B, C,...). Se isto não ocorrer, o texto cifrado foi preparado utilizando-se um alfabeto desordenado. A direção em que as cristas e vales progredirem, da esquerda para a direita ou da direita para a esquerda, indica se o alfabeto é padrão ou reverso (Z, Y, X, ...)

REFERÊNCIAS BIBLIOGRÁFICAS

[FRIEDMAN1] Friedman, William F. and Callimahos, Lambros D., Military Cryptanalytics Part I - Volume 1, Aegean Park Press, Laguna Hills, CA, 1985.
[FRIEDMAN2] Friedman, William F., The Index of Coincidence and Its Applications In Cryptography, Publication 22, The Riverbank Publications, Aegean Park Press, Laguna Hills, CA, 1979.
[KULLBACK] Kullback, Solomon, Statistical Methods in Cryptanalysis, Agean Park Press, Laguna Hills, Ca. 1976.
[LANAKI] LANAKI e suas aulas de Criptografia Clássica.


Esta página


Notice: Undefined variable: imgL in /home/numaboa.com.br/public_html/criptologia/footCript.php on line 30

Notice: Undefined variable: fecha in /home/numaboa.com.br/public_html/criptologia/footCript.php on line 30

Notice: Undefined variable: fecha in /home/numaboa.com.br/public_html/criptologia/footCript.php on line 49
Análise de Frequência Criptologia Criptoanálise
Notice: Undefined variable: indica in /home/numaboa.com.br/public_html/criptologia/footCript.php on line 175
Identificação de Classes Exemplo 1 de Criptoanálise
Créditos: LANAKI, tradução vovó Vicki do Gabinete Negro NumaBoa de parte da 2a. Aula do Curso de Criptografia Clássica.
| Roteiro Abre em nova janela 47 | Indique aos amigos | Fale com a mestre da teia | Voltar
Notice: Undefined variable: fecha in /home/numaboa.com.br/public_html/criptologia/footCript.php on line 196
| Sobre a autora |

sobMedida by vickiSoft - /criptologia/analise/classe.php Versão
Notice: Undefined variable: ver in /home/numaboa.com.br/public_html/criptologia/footCript.php on line 206
1.2 de 05.09.02 - Atualizada em 26.08.03
Licença Creative Commons 1998-2006 Aldeia NumaBoa
Exceto onde especificamente declarado, todo material deste site é disponibilizado de acordo com a Licença Creative Commons.