- Los investigadores han logrado un gran avance para permitir comunicaciones encubiertas «perfectamente seguras» por primera vez.
- El método utiliza nuevos avances en los métodos de la teoría de la información para ocultar una parte del contenido dentro de otra de manera indetectable.
- Esto puede tener fuertes implicaciones para la seguridad de la información, además de otras aplicaciones de compresión y almacenamiento de datos.
Un grupo de investigadores ha logrado un gran avance en las comunicaciones seguras al desarrollar un algoritmo que oculta información confidencial con tanta eficacia que es imposible detectar si algo se ha ocultado.
El equipo, dirigido por la Universidad de Oxford en estrecha colaboración con la Universidad Carnegie Mellon, predice que este método pronto podría usarse ampliamente en las comunicaciones humanas digitales, incluidas las redes sociales y la mensajería privada. En particular, la capacidad de enviar información perfectamente segura puede empoderar a grupos vulnerables como disidentes, periodistas de investigación y trabajadores humanitarios.
El algoritmo se aplica a una configuración llamada esteganografía: la práctica de ocultar información confidencial dentro de contenido inocuo. La esteganografía se diferencia del cifrado en que la información confidencial se oculta de tal manera que oscurece el hecho de que algo se ha ocultado. Un ejemplo podría ser ocultar un poema de Shakespeare dentro de una imagen de un gato generada por IA.
A pesar de haber sido estudiado durante más de 25 años, los enfoques de esteganografía existentes a menudo tienen una seguridad imperfecta, lo que significa que las personas que usan estos métodos corren el riesgo de ser detectadas. Esto se debe a que los algoritmos de esteganografía anteriores cambiarían sutilmente la distribución de contenido inocuo.
Para superar esto, el equipo de investigación utilizó avances recientes en la teoría de la información, específicamente el acoplamiento de mínima entropía, que permite unir dos distribuciones de datos de tal manera que se maximiza su información mutua pero se preservan las distribuciones individuales.
Como resultado, con el nuevo algoritmo, no hay diferencia estadística entre la distribución de contenido inocuo y la distribución de contenido que codifica información sensible.
El algoritmo se probó utilizando varios tipos de modelos que producen contenido generado automáticamente, como GPT-2, un modelo de lenguaje de código abierto y WAVE-RNN, un convertidor de texto a voz. Además de ser perfectamente seguro, el nuevo algoritmo mostró hasta un 40 % más de eficiencia de codificación que los métodos de esteganografía anteriores en una variedad de aplicaciones, lo que permite ocultar más información en una determinada cantidad de datos. Esto puede hacer que la esteganografía sea un método atractivo incluso si no se requiere una seguridad perfecta debido a los beneficios de la compresión y el almacenamiento de datos.
El equipo de investigación ha presentado una patente para el algoritmo, pero tiene la intención de distribuirlo bajo una licencia gratuita a terceros para un uso no comercial responsable. Esto incluye el uso académico y humanitario y las auditorías de seguridad de terceros de confianza. Los investigadores publicaron este trabajo como un documento de preimpresión en arXiv, además de abrir una implementación ineficiente de su método en Github. También presentarán el nuevo algoritmo en la principal conferencia de IA, la Conferencia Internacional 2023 sobre Representaciones de Aprendizaje en mayo.
El contenido generado por IA se usa cada vez más en las comunicaciones humanas ordinarias, impulsado por productos como ChatGPT, Snapchat AI-stickers y filtros de video TikTok. Como resultado, la esteganografía puede generalizarse, ya que la mera presencia de contenido generado por IA ya no generará sospechas.
Coautor Dr. Christian Schroeder de Witt (Departamento de Ciencias de la Ingeniería, Universidad de Oxford) dijo: “Nuestro método se puede aplicar a cualquier software que genere contenido automáticamente, por ejemplo, filtros de video probabilísticos o generadores de memes. Esto puede ser muy valioso, por ejemplo, para periodistas y trabajadores humanitarios en países donde el cifrado es ilegal. Sin embargo, los usuarios aún deben tener cuidado, ya que cualquier técnica de cifrado puede ser vulnerable a los ataques de canal lateral, como la detección de una aplicación de esteganografía en el teléfono del usuario”.
El coautor principal, Samuel Sokota (Departamento de Aprendizaje Automático, Universidad Carnegie Mellon) dijo: «La principal contribución del trabajo es mostrar una conexión profunda entre un problema llamado acoplamiento de entropía mínima y la esteganografía perfectamente segura. Aprovechando esta conexión, presentamos una nueva familia de algoritmos de esteganografía con perfectas garantías de seguridad”.
El autor colaborador, el profesor Jakob Foerster (Departamento de Ciencias de la Ingeniería, Universidad de Oxford), dijo: “Este artículo es un gran ejemplo de investigación sobre los fundamentos del aprendizaje automático que conduce a descubrimientos revolucionarios en áreas de aplicación cruciales. Es maravilloso ver que Oxford, y nuestro joven laboratorio en particular, está a la vanguardia de todo esto”.
Referencia: “Esteganografía perfectamente segura usando acoplamiento de entropía mínima” por Christian Schroeder de Witt, Samuel Sokota, J. Zico Kolter, Jakob Foerster y Martin Strohmeier, 6 de marzo de 2023, arXiv.
DOI: 10.48550/arXiv.2210.14889
Además de la Dra. Christian Schroeder de Witt, Samuel Sokota y el profesor Jakob Foerster, el estudio involucró al Prof. Zico Kolter de la Universidad Carnegie Mellon, EE. UU., y el Dr. Martin Strohmeier de Armasuisse Science+Technology, Suiza. El trabajo fue financiado en parte por un fondo de impacto doctoral EPSRC IAA organizado por el profesor Philip Torr, Torr Vision Group, Universidad de Oxford.