¿La diferencia entre muestra y caso en el aprendizaje automático y las estadísticas?

Aug 15 2020

Encuentro que en esta pregunta y esta API de Keras una muestra significa un caso en estadísticas ya que la documentación de esa API establece que:

Matriz Numpy opcional de pesos para las muestras de prueba, que se utiliza para ponderar la función de pérdida. Puede pasar una matriz plana (1D) Numpy con la misma longitud que las muestras de entrada (mapeo 1: 1 entre pesos y muestras), o en el caso de datos temporales, puede pasar una matriz 2D con forma (samples, sequence_length ), para aplicar un peso diferente a cada paso de tiempo de cada muestra. Este argumento no es compatible cuando x es un conjunto de datos; en su lugar, pase los pesos de muestra como el tercer elemento de x.

Según tengo entendido, la muestra aquí se alinea muy bien con la de la pregunta antes mencionada, entonces mi pregunta es ¿por qué nos referimos a una muestra en aprendizaje automático como un caso en estadística? En estadística, una muestra compromete varios casos y es parte de una población.

Respuestas

2 RichardHardy Aug 15 2020 at 17:07

Creo que la explicación principal es simplemente diferentes tradiciones. Comenzaron casi al azar con terminología diferente y simplemente continúan. No creo que haya una explicación filosófica profunda. Por cierto, la terminología en las aplicaciones de las estadísticas y el aprendizaje automático también varía según los campos; algunos (¿biología?) probablemente también usan muestras en lugar de muestras para problemas estadísticos, ya que simplemente copian los términos de su dominio.