?Qu¨¦ es el scraping? El hackeo que le ha costado a Meta una multa de 265 millones de euros
Te contamos en qu¨¦ consiste la pr¨¢ctica que han usado los malhechores para hacerse con los datos de 533 millones de cuetas de Facebook.
El mundo de Internet es muy amplio y no siempre te vas a encontrar con la mejor de las situaciones all¨¢ donde vayas. Los piratas inform¨¢ticos acechan constantemente, especialmente en esos sitios tan populares que hay por la cantidad de personas que la utilizan. Eso se convierten en datos que los malhechores intentan obtener y una de las t¨¦cnicas que utilizan es el llamado scraping.
?Qu¨¦ es y en qu¨¦ consiste el scraping?
Son muchas las t¨¦cnicas que utilizan los hackers para conseguir datos en Internet. Algunos son muy sofisticados y son capaces de romper hasta las medidas m¨¢s consistentes de seguridad inform¨¢tica si cuentan con las herramientas adecuadas. Por supuesto, muchos se dedican a la creaci¨®n de software que facilita y automatiza este procedimiento, como aquellos que usan la t¨¦cnica del scraping.
Para quien no lo sepa, que puede haber bastantes en la sala, el scraping es una t¨¦cnica que se el conoce como ¡®raspado web¡¯ y se utiliza para extraer contenido de un sitio web as¨ª como de su base de datos. Se utiliza a trav¨¦s de un software que hace una copia del contenido de un sitio y, adem¨¢s, tiene dos vertientes de seguridad.
Y decimos esto porque muchas compa?¨ªas utilizan estros robots de forma legal para obtener datos o incluso clasificarlos. Por ejemplo, si este Black Friday has utilizado alg¨²n comparador de precios has usado este software. Y es que estas p¨¢ginas se encargan de obtener los datos clasificados como precio de las webs para m¨¢s tarde ofrecerte el sitio m¨¢s barato donde comprar un producto.
En qu¨¦ casos es malo el scraping
Como te hemos comentado, hay dos formas de hacer un scraping. El ¡®bueno¡¯ ya te lo hemos contado, aunque tambi¨¦n se identifica porque los robots que extraen el c¨®digo HTML de una p¨¢gina se identifican por la empresa que los lanza y, adem¨¢s, respetan un archivo que toda web tiene que es el robot.txt, el cual delimita el uso de estos programas a ciertas p¨¢ginas del site.
El caso malo, que es el motivo por el que a Meta le han puesto una multa por el filtrado de datos de 533 cuentas, tiene que ver con el resto de pr¨¢cticas. Es decir, la seguridad de una compa?¨ªa se ve vulnerada cuando los robots o usuarios que hacen el raspado no est¨¢n debidamente identificados, as¨ª como que los datos que se reciben acaban en un servidor no autorizado.
De hecho, hay hackers que lo que hacen es infectar otros equipos con el fin de distribuir los datos obtenidos en m¨¢s sitios, por lo que es m¨¢s dif¨ªcil encontrarlos.
?Se puede evitar el scraping?
Como te dec¨ªamos ayer, Meta ha recibido una multa por el gran volumen de datos filtrados adem¨¢s de no disponer de las medidas necesarias para evitar estos problemas. Por eso, la respuesta es que si se puede evitar el scraping en Internet. Por supuesto, mejorar el el archivo robot.txt de tu site no es suficiente como puedes ver, pero s¨ª que lo puede ser una mejora del firewall de los servidores donde se aloja.
Tambi¨¦n se pueden usar las famosas listas negras para bloquear ciertas IP que solicitan acceso al raspado, as¨ª como limitar el n¨²mero de estas. Tambi¨¦n puedes cambiar el c¨®digo de tu p¨¢gina para que sea m¨¢s inaccesible a este tipo de software, pero el que m¨¢s llama la atenci¨®n es el uso de los llamados Honeypots o ¡®tarros de miel¡¯ en espa?ol. Estos redireccionan a esos programas a un sitio web sin datos, ralentizando as¨ª su trabajo y ayud¨¢ndote a evitar estos problemas.