Mad Libs, la nueva técnica de procesamiento de textos de Amazon para proteger la privacidad
- El sistema sustituye las palabras del texto original por otras, reescribiéndolo pero conservando su significado
Ante lo delicado del asunto y teniendo en cuenta que la sociedad cada vez se presta más interés a la privacidad, a los gigantes de la industria no les queda otra alternativa que ofrecer medidas que den garantías a los usuarios. La última novedad al respecto la vemos de la mano de Amazon, quien ha anunciado Mad Libs, una técnica capaz de analizar textos con lenguaje natural protegiendo la seguridad y la privacidad de los usuarios.
Según un estudio elaborado por el Instituto Tecnológico de Massachusetts (MIT), la mayor parte de las técnicas de anonimización actuales están expuestas a ataques en los que los cibercriminales comparen la información con datos de otras fuentes, identificando así a las personas. Sin embargo, el nuevo sistema de Amazon es capaz de ofrecer a nivel de privacidad unos resultados hasta 20 veces mejores que en la actualidad, según la propia compañía estadounidense.
Mad Libs no introduce ruido en las bases de datos y en su lugar sustituye las palabras del texto original por otras, reescribiéndolo pero conservando su significado. Para ello, el sistema renueva las técnicas de anonimización actuales a través de lo que Amazon ha denomincado como ‘privacidad diferencial métrica’, que permite en vez de cambiar siempre en el mismo grado las palabras modificar el texto en mayor o menor medida en función del parecido entre su base de datos y el texto del usuario.
Amazon explica que este proceso se hace manteniendo el sentido original de los textos. En el caso de localizaciones físicas, por ejemplo, estas se cambian por otras cercanas, mientras que el sistema también es capaz de detectar palabras más generales y más concretas dentro de un mismo campo semántico.
Compartido