Reclutamiento, Consentimiento Informado y Perspectivas de los Pacientes
Viabilidad de la reidentificación de individuos en grandes bases nacionales de datos sobre actividad física de las que, con ayuda del aprendizaje automático, se había eliminado la información de salud protegida
Liangyuan Na, Cong Yang; Chi-Cheng Lo, et al
JAMA Netw Open. 2018;1(8):e186040. doi:10.1001/jamanetworkopen.2018.6040
https://es.jamanetwork.com/journals/jamanetworkopen/fullarticle/2719130 De libre acceso en inglés
Puntos clave
Pregunta. ¿Es posible reidentificar datos de actividad física de la que se ha eliminado información de salud protegida mediante el uso del aprendizaje automático?
Conclusiones. Este estudio transversal utilizó datos de actividad física a nivel nacional pertenecientes a 14 451 individuos de las Encuestas Nacionales de Evaluación sobre Nutrición y Salud de 2003-2004 y 2005-2006. La máquina de vectores de soporte lineal y los bosques aleatorios reidentificaron los datos sobre actividad física a un nivel de 20 minutos de aproximadamente el 80 % de los niños y el 95 % de los adultos.
Significado. Las conclusiones de este estudio sugieren que las prácticas actuales para desidentificar los datos sobre actividad física son insuficientes para mantener la privacidad y que la desidentificación debe agregar los datos sobre actividad física de muchas personas para asegurar la privacidad de los individuos.
El resto del artículo en ingles se puede abrir en el enlace de arriba
Nota de Salud y Fármacos: Esto podría afectar a los ensayos clínicos que utilizan grandes bases de datos. En este caso, los investigadores lograron identificar a los individuos a partir de la información sobre actividad física. En este momento, en EE UU, los datos de actividad física no están protegidos por las leyes de confidencialidad. Los investigadores utilizaron una base anonimizada de datos que contenía información de actividad física y datos sociodemográficos, y utilizando estrategias de inteligencia artificial lograron identificar a quién pertenecían los datos. Es decir, que algunas bases de datos de salud que se consideran anonimizadas podrían someterse a procesos similares y se podría re-identificar al individuo.