SpamLookup

MovableType 3.2 se defiende del Spam con un módulo llamado SpamLookup. Este módulo filtra los comentarios y los elimina si detecta alguna característica de Spam:
- Si la dirección IP se encuentra en su "lista negra" de Spammers conocidos.
- Si tiene un número de enlaces superior al indicado por mí.
- Si encuentra en su contendio alguna palabra o expresión que yo haya previamente indicado como Spam.
Por ejemplo alguna de las siguientes:
4u adipex advicer baccarrat blackjack booker byob car-rental-e-site car-rentals-e-site carisoprodol casino casinos chatroom celebrex cialis credit-report-4u cwas cyclen cyclobenzaprine dating-e-site day-trading debt-consolidation-consultant discreetordering duty-free dutyfree equityloans fioricet flowers-leading-site freenet-shopping gambling health-insurancedeals-4u homeequityloans homefinance holdem holdempoker holdemsoftware holdemtexasturbowilson hotel-dealse-site hotele-site hotelse-site incest insurance-quotesdeals-4u insurancedeals-4u jrcreations kasino levitra loan macinstruct mortgage-4-u mortgagequotes online-gambling onlinegambling-4u ottawavalleyag ownsthis palm-texas-holdem-game paxil penis pharmacy phentermine poker poker-chip poze rental-car-e-site roulette shemale shoes slot-machine slot taboo teen texas-holdem thorcarlson top-site top-e-site tramadol trim-spa ultram valeofglamorganconservatives viagra vioxx xanax zolus zybanAunque pudiera parecer que este módulo es una parte esencial del funcionamiento de Movable Type, la documentación al respecto casi brilla por su ausencia. ¿Cómo se hace un regex que permita buscar muchas palabras automáticamente? ¿Qué trucos permiten detectar a Spammers listos que camuflan sus intenciones? Tras pasarme bastantes ratos buscando información al respecto, me parace una buena idea recopilar aquí los tres sitios donde pude encontrar información aceptable sobre el tema.
¬ Making the most of SpamLookup
Completa explicación del funcionamiento de SpamLookup. Recomendaciones y trucos.
¬ SpamLookup's Keyword Filter Explained
Aquí se explica como usar y configurar expresiones en perl que permitan buscar las palabras clave dentro de URLs. Para una mejor comprensión de las expresiones en perl, ver: Regular expressions in Perl.
Por ejemplo, estas son las mías.
# Patterns are Perl regular expressions. /<h/i 2 /poker/i 4 /casino/i 4 /blackjack/i 4 /acroduke/i 4 /https?:\/\/[^\s\'"<>]*(?:online|poker|casino)[^\s\'"<>]*/i 2 /https?:\/\/[^\s\'"<>]*(?:blackjack|roulette|slots|backgammon|craps|gambling)[^\s\'"<>]*/i 2 /https?:\/\/[^\s\'"<>]*(?:texas[\w\-_.]*hold[\w\-_.]*em)[^\s\'"<>]*/i 2 /https?:\/\/[^\s\'"<>]*(?:ringtone|loan|buy|funds)[^\s\'"<>]*/i 2 /https?:\/\/[^\s\'"<>]*(?:viagra|prozac|forex|zyban|pharmacy)[^\s\'"<>]*/i 2 /https?:\/\/[^\s\'"<>]*(?:doggie|doggy|staircase|doggieramp|carpeted|steps)[^\s\'"<>]*/i 2 /-?itsok/i 2
¬ Pong Prevention and the Mysteries of Movable Type Spam
Otra buena explicación que nos indica cómo eliminar Trackbacks duplicados.
Artículos relacionados:
- » Spamlookup y TinyTuring. Escrita el 2 de Diciembre 2006 6:37 PM.
- » Sphere beta. Escrita el 16 de Noviembre 2005 2:54 PM.
- » MT 3.2. Escrita el 27 de Agosto 2005 11:38 PM.
- » Movable Type 3.35. Escrita el 28 de Abril 2007 10:40 AM.
0 TrackBacks
Páginas que hacen referencia a este artículo: SpamLookup.
TrackBack URL: http://www.junjan.org/cgi-bin/mt/mt-t.cgi/1350


Escribe un comentario