El grupo de investigación de malware vx-underground, que dice tener la mayor colección de código fuente de malware, dijo en una publicación en X que su archivo de datos asciende a unos 30 terabytes.
Una respuesta de Bernardo Quintero, fundador de VirusTotal, un servicio en línea que escanea archivos en busca de malware en múltiples motores antivirus a la vez, dijo que su servicio tiene alrededor de 31 petabytes de muestras de malware que los usuarios han contribuido hasta la fecha. (Un petabyte es ~1000 veces más grande que un terabyte).
En ambos casos, son muchos datos. En contexto, las empresas de ciberseguridad, los investigadores de inteligencia artificial y las empresas de inteligencia sobre amenazas consideran que los repositorios como estos son fundamentales para entrenar modelos de detección y comprender cómo evolucionan los ataques. Pero esto nos hizo preguntarnos: ¿qué significarían estos enormes conjuntos de datos? de hecho ¿Parece que están apilados como discos duros uno encima del otro y uno al lado del otro? ¿Y cómo se compararían con, digamos, la Torre Eiffel?
Alguien en nuestra sala de redacción le hizo esta pregunta a un chatbot de IA y respondió increíblemente mal.
En lugar de eso, hicimos algunos cálculos aproximados para calcular qué tan altos serían estos bancos de datos. Dado que vx-underground y VirusTotal tienen “aproximadamente” esa cantidad de datos cada uno, “aproximadamente” es suficiente para nosotros en este caso.
Digamos que estamos usando discos duros internos de 1 terabyte de capacidad, ya que generalmente están diseñados para tener el mismo tamaño físico y caber dentro de cualquier computadora. Estos discos duros internos estandarizados de 3,5 pulgadas tienen 1 pulgada de altura, que para apilar uno encima del otro es realmente lo que queremos saber aquí.
También asumimos que los discos duros que usamos en este ejemplo son exactamente 1 terabyte, porque en realidad la capacidad total de archivos utilizable de un disco duro es generalmente algo menor.
Usando esta herramienta de conversión en línea, parece que los 30 terabytes de datos de malware de vx-underground podrían llenar 30 discos duros apilados uno encima del otro, alcanzando 30 pulgadas, o alrededor de 2,5 pies de alto.
Como referencia, este reportero mide 6 pies de altura. (Vea la imagen a continuación, y sí, terrible opsec, lo sé).
Con esa misma lógica, los 31 petabytes de datos enviados por VirusTotal llenarían 31.744 discos duros, que apilados uno encima de otro alcanzarían aproximadamente 2.645 pies.
El edificio más alto del mundo, el Burj Khalifa en Dubai, es ligeramente más alto con 2722 pies.
La Torre Eiffel tiene 1.083 pies de altura. Según esa lógica, VirusTotal tiene aproximadamente dos torres Eiffel y media en datos.
Cuando compra a través de enlaces en nuestros artículos, podemos ganar una pequeña comisión. Esto no afecta nuestra independencia editorial.



