inicio
salta!
archivo
categorias
fotoblog
tumblelog
sa.bros.us
últimos comentarios
contacto
acerca
 
 
 
entradas
comentarios
fotoblog
Agregar a Feedness
 
buscar

Agrega b3co.com al firefox
 
 
 
 
 

la lista completa
 
 
 

 Bitacoras.com

Blogalaxia

Licencia de los textos:

Creative Commons License


Licencia de las fotografias:

Creative Commons License
 
Análisis del SPAM
spam b3co
Algunos datos aislados del SPAM que ha cadio en este sitio. Pinche SPAM!

Después de varios ataques puedo sacar algunas cocnlusiones, algunas inesperadas.

- Los spammers clonan las formas, y ya con las formas clonadas mandan el request desde su servidor. Esto lo noté cuando borré un artículo y seguían llegándole comentarios, posteriormente empecé a rastrear los referers.

- El 97.2% de los mensajes tienen 2 ó más ligas

- El 89.2% de los mensajes contienen al menos una de las siguientes palabras: buy, cheap, order, poker, discount. Aquí tengo que agradecer que el blog sea en español.

Con estos dos últimos hallazgos puedo correr el siguiente query cada n minutos y librar bastante bien el puto SPAM:

UPDATE blog_coments SET [......]
WHERE ( coment LIKE '%buy%' OR coment LIKE '%cheap%'
OR comment LIKE '%order%' OR coment LIKE '%poker%' OR coment LIKE '%discount%' )
AND comment LIKE '%a href=%a href=%';


Como se podrán dar cuenta, uso un UPDATE en vez de un DELETE pues intento tener (a mediano-largo plazo) un repositorio público con datos centrales de spammers.

Nota: todos los comentarios que concuerden con estos criterios serán considerados spam (eeeelmoooo !!!)  
 
EnvÌa a: del.icio.us enchÌlame
Envía este artículo a un amigo
Funcionalidad en fase b3ta
su email:
tu nombre:
comentario (opcional):
 
Comentarios (18)...
 
#1 »|AhIoRoS| hace 34 meses(2.8333333333333 años) [7-11-05 02:46:43] escribió:
Excelente idea
...pero también ha comentado por aca →
 
#2 »Nacho hace 34 meses(2.8333333333333 años) [7-11-05 03:52:57] escribió:
Oye y que le vas a hacer a los comentarios catalogados como spam? no publicarlos pero mantenerlos en la base de datos para analizarlos despues o que onda?

Es una idea muy similar a la que usa Word Press
...pero también ha comentado por aca →
 
#3 »beco hace 34 meses(2.8333333333333 años) [7-11-05 04:19:38] escribió:
AhIoRoS, muchas gracias, veamos cómo va jalando.

Nacho, exacto analizarlas para publicar todo lo que se saque de alli.
...pero también ha comentado por aca →
 
#4 »spam test hace 34 meses(2.8333333333333 años) [7-11-05 06:08:02] escribió:
Esta es solo una prueba "I want to buy cheap crap"
 
#5 »spam test hace 34 meses(2.8333333333333 años) [7-11-05 06:08:27] escribió:
Esta es solo una prueba "I want to buy cheap crap"
 
#6 »Rafael hace 34 meses(2.8333333333333 años) [7-11-05 11:48:53] escribió:
Está muy chida tu técnica; y parece ser que es una solución a largo plazo, pues el spam no va a cambiar mucho pronto.
...pero también ha comentado por aca →
 
#7 »Prueba hace 34 meses(2.8333333333333 años) [8-11-05 01:58:49] escribió:
Probando Artículo chido cheap
 
#8 »elmo hace 34 meses(2.8333333333333 años) [8-11-05 08:42:54] escribió:
Pues al parecer no borra nada, por que no utilizas la tecnica que te sugeri, se ve mas simple.
 
#9 »beco hace 34 meses(2.8333333333333 años) [8-11-05 08:55:16] escribió:
Lo que pasa es que no ha borrado nada porque ninguno cumple los requisitos, una o mas de las palabras y tener dos o más ligas

No uso la prueba que me dijiste por la misma razón que no uso el kaptcha, no me gustaría hacer "tedioso" poner un comentario, aunque de ser necesario después de agotar las posibilidades, lo usaré.
...pero también ha comentado por aca →
 
#10 »Nacho hace 34 meses(2.8333333333333 años) [8-11-05 09:19:03] escribió:
Jaló bien el que yo puse... si se updateo...
Ya no se despliega pero supongo que lo tienes guardado

cual es la solución que propuso elmer?
y la que yo propuse que te pareció? añadir la condición que si un usuario está poniendo comentarios en una ventana de 5 segundos en el mismo post categorizarlos como spam
...pero también ha comentado por aca →
 
#11 »beco hace 34 meses(2.8333333333333 años) [8-11-05 09:33:54] escribió:
En efecto, el comentario se queda guardado con una bandera de spam, guardando toda la informacion: articulo al que corresponde, referer, mail, ...

La cuestion de la ventrana de 5 segundos es buena aunque complicada, pues como php no tiene un proceso (daemon) corriendo, ni mysql tirgers no es tan fácil monitorear los procesos.
...pero también ha comentado por aca →
 
#12 »spam test hace 34 meses(2.8333333333333 años) [8-11-05 09:38:23] escribió:
Esta es solo una prueba "I want to buy cheap crap"
Artículo chido
"I want to buy cheap crap"
 
#13 »Nacho hace 34 meses(2.8333333333333 años) [8-11-05 09:42:46] escribió:
Como que no entendieron cual era el método de prueba
...pero también ha comentado por aca →
 
#14 »Grajeda hace 34 meses(2.8333333333333 años) [8-11-05 09:14:41] escribió:
No deberías adicionar tambien las palabras:

enlarge penis
viagra
Hi, my name is Dyannah and I want to talk with you...

bueno... es lo que más spam genera... al menos a todos los hombres con mail(que segun yo son algunos cuantos millones)
...pero también ha comentado por aca →
 
#15 »Mahomedalid Pacheco hace 34 meses(2.8333333333333 años) [9-11-05 07:59:28] escribió:
comprar barato
...pero también ha comentado por aca →
 
#16 »un punalin hace 26 meses(2.1666666666667 años) [18-07-06 01:25:28] escribió:
holaprueba de ventas
 
#17 »jsdj hll hace 13 meses [22-07-07 06:09:27] escribió:
land rover Forums
...pero también ha comentado por aca →
 
#18 »jsdj hll hace 13 meses [7-08-07 10:44:04] escribió:
%%url%%
...pero también ha comentado por aca →
 
Hazte leer...
 
nombre:
mail:
web site:
comentario: (consejos)
Suscribirme a la conversación. Sin SPAM, créeme, odiamos el spam.
 
Este es un espacio abierto, puedes escribir lo que gustes respetando los siguientes puntos:
1.- Lo que escribas esté relacionado con el post, si gustas contactarme puedes hacerlo aqui.
2.- Todo es cuestionable, aunque ten en cuenta que existen formas de hacerlo, evita las agresiones.
3.- Siempre hay tres verdades: tu verdad, mi verdad y la verdad, por lo que opiniones diferentes no necesariamente son equivocadas.
4.- Los comentarios son una forma de discusión abierta, por lo que al publicar uno, implícitamente entras a una discusión, con todo lo que esto representa (ser debatido, ser cuestionado, se te responda) por cualquier persona.
5.- Recuerda que puedes usar html, para poner una liga escribe:
<a href="http://loquesea.com/articulo_hido.html">Artículo chido</a>.
6.- Si quieres que cada vez que escribas aparezca un avatar con la imagen que gustes, como este:

lee este artículo.
7.- Me reservo el derecho de modificar la aplicación de mi política acerca del rel=nofollow, una cosa es dar la mano y otra que te agarren hasta las amígdalas...
Por si se te hizo tarde…
» Insisto...  [7]
» Toledo  [14]
» Cuidado con lo que deseas...  [6]
» Para esperar  [10]
» Fotos de National Geographic  [3]
» El mar  [8]
» Recuperando el equilibrio  [5]
» Rulfo y Borges  [7]
» Auto off  [5]
» Remember The Milk  [9]
» La exposición  [11]
» Arrieros somos...  [15]
» Reducción al absurdo [corregido]  [6]
» ¿Qué tan seguro es tu password?  [7]
» La Casa de Cristal  [2]

--


¿Qué es esto?
Estás leyendo el blog (o bitácora) personal de beco, en donde periódicamente escribo cualquier cantidad de tonterías que me interesan, sobre todo de internet, matemáticas, fotografía, algo de código y muchas, muchas pendejadas.

Puedes buscar, saltar, revisar las categorías o quitar el polvo de los archivos cronológicamente ordenados.

Puedes suscribirte a los nuevos contenidos de este sitio via RSS agregando esta liga a tu lector preferido de feeds, o si lo prefieres, puedes suscribirte agregando aqui tu dirección de correo electrónico para que te lleguen automáticamente las actualizaciones. Puedes dejar tu dirección de correo tranquilo, créeme, aqui odiamos el spam.


M + 120