Solo un modelo para probar, pero recolectaría datos y entrenaría un bosque al azar en R. Podría asignar 0/1 para cada comida según su reacción (por ejemplo, 1 para una reacción alérgica).
Arreglé un registro de alimentos falsificado al construir 42 comidas aleatorias con alimentos separados por comas en Excel y luego exporté un csv. Debe ser coherente con los nombres de los alimentos. Los contenidos csv siguen.
Respuesta, comida
0, “papa, pollo, pera”
0, “pollo, almendras, yogurt”
0, “papa, apio, tomate, fresa”
0, “papa, pan, pollo, manzana”
0, “pescado, papa, apio, pan, cacahuetes, tomate, pera”
0, “pescado, yogurt, manzana”
0, “apio, almendras, yogurt, manzana”
0, “pan, cacahuetes, manzana”
0, “pescado, pan, pollo, almendras, yogurt, pera”
0, “papa, pan, cacahuetes, yogurt, manzana”
1, “patata, carne de res, cacahuetes, fresa”
0, “carne de res, almendras, tomate”
0, “pan, manzana, pera”
0, “pescado, carne de res, pollo, yogur, tomate, pera”
0, “apio, pan, cacahuetes, almendras, tomate, manzana”
1, “pescado, carne, tomate, fresa”
1, “apio, cacahuetes, fresa”
0, “apio, carne de res, yogurt”
1, “pescado, pan, cacahuetes, yogurt”
1, “pescado, apio, pan, carne de res, tomate, pera, fresa”
0, “papa, carne de res, tomate”
0, “carne de res, yogur, manzana”
0, “pan, pollo, pera”
0, “pan, carne de res, cacahuetes, yogurt, manzana”
0, “apio, cacahuetes, almendras, tomate”
0, carne de vacuno
0, “pescado, carne de res, pollo, cacahuetes, yogur, tomate, manzana”
1, “cacahuetes, tomate, fresa”
0, “papa, apio, carne de res, almendras”
1, “patata, carne de vacuno, fresa”
0, “pan, pollo, manzana”
0, pescado
1, “apio, pan, carne de res, cacahuetes, fresa”
0, “apio, carne de res, almendras, manzana”
0, “pescado, carne de res, pollo, cacahuetes”
0, “pan, pollo, tomate, pera, fresa”
0,
0, “papa, apio, yogurt, tomate, pera”
0, “pescado, apio, manzana, fresa”
1, “pan, carne de res, cacahuetes, manzana”
0, carne de vacuno
1, “papa, ternera, pollo, almendras, fresa”
Luego utilicé el siguiente guión R para construir un Forest aleatorio y trazar la importancia de cada característica (alimento).
La salida de la trama sigue.
Cuando desarrollé el conjunto de datos original, lo configuro para que devuelva un 1 si hubo una respuesta de fresa o una respuesta de maní. P (respuesta) dada fresa fue del 70% y P (respuesta) dado cacahuetes fue del 30%. La trama de importancia muestra esto bastante bien. Con datos reales será más ruidoso y la consistencia del etiquetado es fundamental.