¿Por qué los ejemplos de cáncer son populares en estadística / aprendizaje automático?

También utilicé un conjunto de datos de cáncer de mama en la enseñanza, porque es un buen ejemplo para un problema de clasificación binaria muy desequilibrado, en términos de ML. Esto es genial porque se puede mostrar muy bien el caso sobre cómo ajustar un clasificador.

Sin embargo, su pregunta me hizo consciente de que el sujeto tiene una relación con la vida real que puede causar incomodidad y estrés innecesarios en los estudiantes, lo que tendré en cuenta al seleccionar conjuntos de datos de ejemplo la próxima vez. Viniendo de las matemáticas, la mayoría de las veces veo números realmente, así que es algo que no pensaría yo mismo.

Además, no debe preocuparse por sus prospectos de trabajo: la mayoría de los conjuntos de datos en la vida real no son de * ese * tipo.