Homenews - homenews.com.br
Informática
Quinta - 26 de Agosto de 2004 às 08:57

    Imprimir


_________________________________________________________________




Poucas pessoas poderiam prever que quando Crick e Watson descobriram o DNA ajudariam a criar uma ferramenta para combater spams (e-mails indesejados que entopem as caixas de entradas dos usuários de correio eletrônico).

Os "biólogos de computação" do Centro de Pequisas TJ Watson, da IBM, desenvolveram um filtro antispam baseado na forma como cientistas analisam seqüências genéticas.

Batizada de chung-kwei, como o caractere do feng shui, a fórmula automaticamente aprende padrões do "vocabulário dos spams" e se mostrou 96,5% eficiente.

Em testes, o filtro deixou de identificar corretamente como spam apenas uma mensagem em 6 mil.

Algoritmo

Isidore Rigoutsos e Tien Huynh, da IBM, começaram a desenvolver a fórmula - ou algoritmo - pouco mais de um ano atrás.

O chung-kwei resultou de um outro algoritmo chamado de teiresias, que os pesquisadores estavam usando para descoberta de padrões em seqüenciamento biológico, especificamente em observação de proteínas.

O algoritmo ajudou a determinar automaticamente as propriedades de uma proteína, como funcionamento e estrutura, diretamente de uma seqüência.

"Obviamente algoritmos que funcionam para a descoberta de padrões são aplicáveis a um grande número de problemas", disse à Rigoutsos à BBC.

Em vez de procurar por seqüências de proteínas, o chung-kwei identifica trechos de seqüências que aparecem em spams, mas nunca em e-mails que não são spams.

A dupla usou em seu trabalho o grande volume de spams que recebem em seus próprios computadores no escritório.

"Uma das propriedades do algoritmo é que ele vai detectar duas ou mais ocorrências, não importando em que lugar da mensagem elas estejam.

Filtro

O algoritmo pode ser treinado a não ser enganado por trocas de S por $, um artifício usado por empresas e pessoas que enviam spams para burlar filtros convencionais.

O chung-kwei adiciona novos padrões à base de dados que ele já conhece.

Ele compara o seu vocabulário com o de e-mails que não contêm spams. Uma mensagem que chega na caixa de entradas do computador vai ser rejeitada se contiver uma grande proporção do mesmo padrão de vocabulário.

Vários softwares anti-spam usam técnicas para identificar e rejeitar spams, mas a IBM acredita que o algoritmo chung-kwei é a única ferramenta que trabalha desta forma.

Espada

O chung-kwei é um caractere do feng shui que é representado carregando um bastão e também segurando uma espada.

Alguns softwares analisam o caminho percorrido pelo e-mail e sua origem. Outros envolvem verificação de identidade e listas de e-mails que devem ser ou não aceitos.

Outros ainda usam combinações bayesianas de palavras que estatisticamente fazem parte de spams.

O sistema ainda vai passar por mais estudos e testes. A pesquisa foi publicada na revista New Scientist.




BBC




URL Fonte: https://homenews.com.br/noticia/2468/visualizar/