La différence entre échantillon et cas dans l'apprentissage automatique et les statistiques?
Je trouve que dans cette question et cette API de Keras, un exemple signifie un cas dans les statistiques car la documentation de cette API indique que:
Tableau Numpy facultatif de poids pour les échantillons de test, utilisé pour pondérer la fonction de perte. Vous pouvez passer un tableau Numpy plat (1D) avec la même longueur que les échantillons d'entrée (mappage 1: 1 entre les poids et les échantillons), ou dans le cas de données temporelles, vous pouvez passer un tableau 2D avec forme (échantillons, sequence_length ), pour appliquer un poids différent à chaque pas de temps de chaque échantillon. Cet argument n'est pas pris en charge lorsque x est un ensemble de données, transmettez à la place des exemples de poids comme troisième élément de x.
Si je comprends bien, l'exemple ici correspond très bien à celui de la question susmentionnée, alors ma question est de savoir pourquoi nous nous référons à un échantillon en apprentissage automatique d'un cas en statistique? En statistique, un échantillon compromet plusieurs cas et fait partie d'une population.
Réponses
Je pense que l'explication principale est simplement des traditions différentes. Ils ont commencé à peu près au hasard avec une terminologie différente et ils continuent simplement. Je ne pense pas qu'il y ait d'explication philosophique profonde. À propos, la terminologie des applications des statistiques et de l'apprentissage automatique varie également selon les domaines; certains (biologie?) utilisent probablement des échantillons plutôt que des échantillons pour des problèmes statistiques, car ils ne font que copier le (s) terme (s) de leur domaine.