¿Cómo se puede aplicar el aprendizaje profundo a la genómica del cáncer?

En definitiva, el cáncer es una expresión de la genómica. Aunque los factores ambientales pueden desencadenar este proceso, el cáncer es 100% el resultado de la incapacidad de los genes para regular el crecimiento celular.

El aprendizaje automático profundo puede, en teoría, establecer el mecanismo preciso por el cual el SNP individual, cambios genéticos más amplios o incluso cambios epigenéticos provocan cambios en los pliegues de proteínas que permiten que se forme el cáncer, obtenga nutrientes y se disemine por todo el cuerpo.

Actualmente, como especie estamos abrumados por el alcance de este desafío / oportunidad, porque (1) los datos son tan difíciles de obtener, y (2) los desafíos informáticos son tan enormes. Con respecto al primer problema, una de mis empresas (MedGenome) está trabajando para obtener datos excelentes que pueden ayudar con el problema. ¿Puede MedGenome usar la genética para predecir el cáncer? Los capitalistas de riesgo apuestan $ 4M en eso. En la segunda pregunta, verá una serie de esfuerzos inteligentes como SolveBio trabajando en ello.

Hasta cierto punto, ya está aplicado. Hay un número de plataformas que proporcionan herramientas de código abierto para encontrar conexiones funcionales entre los datos genómicos y ciertos fenotipos de una enfermedad. Tome el mapa de conectividad http://www.broadinstitute.org/cmap/ por ejemplo. Es capaz de predecir opciones de terapia adecuadas para una enfermedad maligna basada en perfiles de expresión. Puedes encontrar otros buenos ejemplos en The Cancer Scientist

Todas esas herramientas son, sin embargo, muy limitadas. Esto se debe a la complejidad del tema. Nos falta cierta información de los fondos sobre la biología del cáncer. Solo si ponemos nuestros esfuerzos en la investigación básica del cáncer podremos aplicar el aprendizaje profundo a este campo. En este momento hay demasiados puntos blancos en el mapa para obtener buenos resultados con este enfoque.

El aprendizaje profundo podría mapear las vías genéticas conocidas y las alteraciones (mutaciones) de genes que causan cáncer. Esto puede extraerse de la base de datos de literatura de Medline u otras bases de datos genómicas sobre cáncer. Esto ya se está haciendo en IBM bajo Watson.