PWNEDCR 0x3

Private Machine Learning
2020-12-06, 13:15–14:05, Main Track

La Inteligencia Artificial y uno de sus campos mas populares, el Machine Learning, son usados frecuentemente en el mundo de hoy para el procesamiento de datos de usuarios, con el fin de proveer ciertos servicios que van desde el entretenimiento hasta la medicina. Estos datos son en muchos casos recolectados abusivamente o almacenados de forma insegura, lo que viola la privacidad de sus legítimos dueños, los usuarios. En esta charla exploraremos un conjunto de técnicas que permiten procesar datos cifrados, usarlos como datos de entrenamiento para un algoritmo de ML, y retornar un resultado cifrado al usuario, de manera que su privacidad no es violada mientras obtiene un servicio legítimo.


El machine learning (ML) es un conjunto de técnicas computacionales que permiten entrenar un algoritmo para realizar predicciones automatizadas con base en un conjunto de datos. Este conjunto de técnicas se ha ido popularizando en la industria y son usadas en muchos casos para el procesamiento de información sensible de usuarios. Más allá de los casos abusivos donde empresas colectan indiscriminadamente la información de sus usuarios, existen casos de uso donde las personas podrían beneficiarse del uso de ML, sin tener que entregar sus datos y comprometer su privacidad. En esta charla exploraremos un conjunto emergente de técnicas criptográficas, como el Homomorphic Encryption (HE) y Secure Multi-Party Computation (SMPC), además de algunas librerías para el procesamiento de datos cifrados con ML, en donde el proveedor del análisis no tiene acceso a los datos en texto claro, mientras los resultados se devuelven en forma cifrada al usuario. De esta manera el usuario puede obtener beneficios de un servicio cuando no posee suficiente poder de procesamiento, mientras mantiene su información protegida.