¿Dónde puedo encontrar datos CGM de muestra para entrenar el aprendizaje automático?

Investigué esto hace un momento, y lamentablemente los datos son muy difíciles de encontrar en el tamaño necesario para entrenar buenos modelos. Medtronic ha estado recolectando datos de pacientes durante años, tanto en pump como en su MCG, y por un tiempo lo estuvieron poniendo a disposición de investigadores académicos a petición especial, pero no sé qué terminó sucediendo con ese esfuerzo. Escuché de aquellos que trataron de acceder que fue un esfuerzo infructuoso.

La mejor apuesta hoy en día sería acercarse a los dos esfuerzos de código abierto:

(1) Nightscout ha creado un software que permite a las personas recopilar sus propios datos de dispositivos propietarios. Hablé con ellos hace un par de años, y estaban muy interesados ​​en establecer una plataforma para anonimizar los datos y ponerlos a disposición de los investigadores, aunque en ese momento eso aún no existía. Podrías seguir con ellos y ver dónde está eso, o qué podrías hacer para ayudarlo.

(2) Tidepool es una organización sin fines de lucro dedicada a ayudar a las personas con diabetes a recopilar y analizar sus datos, y han creado herramientas multidispositivo para la carga de datos. Están interesados ​​en trabajar con investigadores, aunque no sé hasta qué punto los datos están disponibles y listos para funcionar. Etiquetando a Howard Look, Brandon Arbiter y Jana Beck, que sabrían más sobre los esfuerzos de Tidepool en esta área.

¡Buena suerte!

Solo para dar seguimiento a la publicación hecha por Karmel Allison, Nightscout acaba de lanzar su repositorio de datos al acceder a los recursos comunes de datos de NightCout.