Séries temporais - Bibliotecas Python
Python tem uma popularidade estabelecida entre os indivíduos que realizam aprendizado de máquina por causa de sua estrutura de código fácil de escrever e entender, bem como uma ampla variedade de bibliotecas de código aberto. Algumas dessas bibliotecas de código aberto que usaremos nos próximos capítulos foram apresentadas a seguir.
NumPy
Numerical Python é uma biblioteca usada para computação científica. Ele funciona em um objeto de matriz N-dimensional e fornece funcionalidade matemática básica, como tamanho, forma, média, desvio padrão, mínimo, máximo, bem como algumas funções mais complexas, como funções algébricas lineares e transformada de Fourier. Você aprenderá mais sobre isso à medida que avançarmos neste tutorial.
Pandas
Esta biblioteca fornece estruturas de dados altamente eficientes e fáceis de usar, como séries, dataframes e painéis. Ele aprimorou a funcionalidade do Python, desde a simples coleta e preparação de dados até a análise de dados. As duas bibliotecas, Pandas e NumPy, tornam muito simples qualquer operação em conjuntos de dados pequenos a muito grandes. Para saber mais sobre essas funções, siga este tutorial.
SciPy
Science Python é uma biblioteca usada para computação científica e técnica. Oferece funcionalidades para otimização, processamento de sinais e imagens, integração, interpolação e álgebra linear. Esta biblioteca é útil ao executar o aprendizado de máquina. Discutiremos essas funcionalidades à medida que avançarmos neste tutorial.
Scikit Learn
Esta biblioteca é um kit de ferramentas SciPy amplamente utilizado para modelagem estatística, aprendizado de máquina e aprendizado profundo, pois contém vários modelos personalizáveis de regressão, classificação e agrupamento. Funciona bem com Numpy, Pandas e outras bibliotecas, o que o torna mais fácil de usar.
Statsmodels
Como o Scikit Learn, esta biblioteca é usada para exploração de dados estatísticos e modelagem estatística. Ele também funciona bem com outras bibliotecas Python.
Matplotlib
Esta biblioteca é usada para visualização de dados em vários formatos, como gráfico de linha, gráfico de barra, mapas de calor, gráficos de dispersão, histograma, etc. Ela contém todas as funcionalidades relacionadas ao gráfico necessárias desde a plotagem até a rotulagem. Discutiremos essas funcionalidades à medida que avançarmos neste tutorial.
Essas bibliotecas são essenciais para iniciar o aprendizado de máquina com qualquer tipo de dado.
Ao lado das discutidas acima, outra biblioteca especialmente significativa para lidar com séries temporais é -
Data hora
Esta biblioteca, com seus dois módulos - datetime e calendar, fornece todas as funcionalidades datetime necessárias para ler, formatar e manipular o tempo.
Estaremos usando essas bibliotecas nos próximos capítulos.