SpamLookup

| | Comentarios (0)
| TrackBacks (0) | del.icio.us | Meneame

Spam_closeup.png

El Spam que llega a un blog es realmente impresionante, por ejemplo, en las últimas cuatro horas han llegado a "La Opinión Alternativa" 200 intentos de Spam. Estos 200 mensajes fallidos se componían de publicidad de casinos online, medicamentos variados, tonos para teléfonos móviles, préstamos, escaleras para perros (¡Si como lo oís!) y los que simplemente buscan que pongas en tu lista negra a Google o Yahoo sin darte cuenta. Apasionante.
MovableType 3.2 se defiende del Spam con un módulo llamado SpamLookup. Este módulo filtra los comentarios y los elimina si detecta alguna característica de Spam:
- Si la dirección IP se encuentra en su "lista negra" de Spammers conocidos.
- Si tiene un número de enlaces superior al indicado por mí.
- Si encuentra en su contendio alguna palabra o expresión que yo haya previamente indicado como Spam.
Por ejemplo alguna de las siguientes:
4u adipex advicer baccarrat blackjack booker byob car-rental-e-site car-rentals-e-site carisoprodol casino casinos chatroom celebrex cialis credit-report-4u cwas cyclen cyclobenzaprine dating-e-site day-trading debt-consolidation-consultant discreetordering duty-free dutyfree equityloans fioricet flowers-leading-site freenet-shopping gambling health-insurancedeals-4u homeequityloans homefinance holdem holdempoker holdemsoftware holdemtexasturbowilson hotel-dealse-site hotele-site hotelse-site incest insurance-quotesdeals-4u insurancedeals-4u jrcreations kasino levitra loan macinstruct mortgage-4-u mortgagequotes online-gambling onlinegambling-4u ottawavalleyag ownsthis palm-texas-holdem-game paxil penis pharmacy phentermine poker poker-chip poze rental-car-e-site roulette shemale shoes slot-machine slot taboo teen texas-holdem thorcarlson top-site top-e-site tramadol trim-spa ultram valeofglamorganconservatives viagra vioxx xanax zolus zyban
Aunque pudiera parecer que este módulo es una parte esencial del funcionamiento de Movable Type, la documentación al respecto casi brilla por su ausencia. ¿Cómo se hace un regex que permita buscar muchas palabras automáticamente? ¿Qué trucos permiten detectar a Spammers listos que camuflan sus intenciones? Tras pasarme bastantes ratos buscando información al respecto, me parace una buena idea recopilar aquí los tres sitios donde pude encontrar información aceptable sobre el tema.
¬ Making the most of SpamLookup
Completa explicación del funcionamiento de SpamLookup. Recomendaciones y trucos.
¬ SpamLookup's Keyword Filter Explained
Aquí se explica como usar y configurar expresiones en perl que permitan buscar las palabras clave dentro de URLs. Para una mejor comprensión de las expresiones en perl, ver: Regular expressions in Perl.
Por ejemplo, estas son las mías.
# Patterns are Perl regular expressions.
/<h/i 2
/poker/i 4
/casino/i 4
/blackjack/i 4
/acroduke/i 4
/https?:\/\/[^\s\'"<>]*(?:online|poker|casino)[^\s\'"<>]*/i 2
/https?:\/\/[^\s\'"<>]*(?:blackjack|roulette|slots|backgammon|craps|gambling)[^\s\'"<>]*/i 2
/https?:\/\/[^\s\'"<>]*(?:texas[\w\-_.]*hold[\w\-_.]*em)[^\s\'"<>]*/i 2
/https?:\/\/[^\s\'"<>]*(?:ringtone|loan|buy|funds)[^\s\'"<>]*/i 2
/https?:\/\/[^\s\'"<>]*(?:viagra|prozac|forex|zyban|pharmacy)[^\s\'"<>]*/i 2
/https?:\/\/[^\s\'"<>]*(?:doggie|doggy|staircase|doggieramp|carpeted|steps)[^\s\'"<>]*/i 2
/-?itsok/i 2

¬ Pong Prevention and the Mysteries of Movable Type Spam
Otra buena explicación que nos indica cómo eliminar Trackbacks duplicados.

Artículos relacionados:

    » Sphere beta. Escrita el 16 de Noviembre 2005 2:54 PM.
    » MT 3.2. Escrita el 27 de Agosto 2005 11:38 PM.

0 TrackBacks

Páginas que hacen referencia a este artículo: SpamLookup.

TrackBack URL: http://www.junjan.org/cgi-bin/mt/mt-t.cgi/1350

Escribe un comentario

Para controlar el Spam, escribe la letra "s" en el campo inferior:

Sobre este artículo

Esta página fue escrita por Junjan el 14 de Enero 2006 7:10 PM.

Anterior artículo: Justicia aérea.

Siguiente artículo: Memorias de Robert Fisk.

Encuentra lo útimo en la página principal o mira el archivo general.

Licencia

Creative Commons License
Esta página se publica con una licencia Creative Commons.

Pensamiento Crítico

Powered by Movable Type 4.21-en

Trackbacks