A diferença entre amostra e caso em aprendizado de máquina e estatística?

Aug 15 2020

Acho que nesta pergunta e nesta API de Keras uma amostra significa um caso nas estatísticas, pois a documentação dessa API afirma que:

Matriz Numpy opcional de pesos para as amostras de teste, usada para ponderar a função de perda. Você pode passar uma matriz plana (1D) Numpy com o mesmo comprimento que as amostras de entrada (mapeamento 1: 1 entre pesos e amostras), ou no caso de dados temporais, você pode passar uma matriz 2D com forma (amostras, comprimento_de_sequência ), para aplicar um peso diferente a cada intervalo de tempo de cada amostra. Este argumento não é suportado quando x é um conjunto de dados, em vez disso, passe os pesos da amostra como o terceiro elemento de x.

Pelo que entendi, o exemplo aqui se alinha muito bem com o da pergunta mencionada, então minha pergunta é por que nos referimos a um exemplo em aprendizado de máquina um caso em estatística? Nas estatísticas, uma amostra compromete vários casos e faz parte de uma população.

Respostas

2 RichardHardy Aug 15 2020 at 17:07

Acho que a principal explicação são simplesmente tradições diferentes. Eles começaram de forma bastante aleatória com terminologia diferente e simplesmente continuam. Não acho que haja uma explicação filosófica profunda. A propósito, a terminologia em aplicativos de estatística e aprendizado de máquina também varia entre os campos; alguns (biologia?) provavelmente usam amostras em vez de amostras para problemas estatísticos também, pois eles apenas copiam o (s) termo (s) de seu domínio.