Python Pandas - Introdução
Pandas é uma biblioteca Python de código aberto que fornece manipulação de dados de alto desempenho e ferramenta de análise usando suas poderosas estruturas de dados. O nome Pandas é derivado da palavra Panel Data - uma Econometria de dados multidimensionais.
Em 2008, o desenvolvedor Wes McKinney começou a desenvolver pandas quando precisava de uma ferramenta flexível de alto desempenho para análise de dados.
Antes do Pandas, Python era usado principalmente para preparação e preparação de dados. Teve muito pouca contribuição para a análise de dados. O Pandas resolveu esse problema. Usando o Pandas, podemos realizar cinco etapas típicas no processamento e análise de dados, independentemente da origem dos dados - carregar, preparar, manipular, modelar e analisar.
Python com Pandas é usado em uma ampla variedade de campos, incluindo domínios acadêmicos e comerciais, incluindo finanças, economia, estatística, análise, etc.
Principais recursos do Pandas
- Objeto DataFrame rápido e eficiente com indexação padrão e personalizada.
- Ferramentas para carregar dados em objetos de dados na memória de diferentes formatos de arquivo.
- Alinhamento de dados e tratamento integrado de dados ausentes.
- Remodelagem e rotação de conjuntos de datas.
- Fatiamento baseado em rótulo, indexação e subconjunto de grandes conjuntos de dados.
- As colunas de uma estrutura de dados podem ser excluídas ou inseridas.
- Agrupe por dados para agregação e transformações.
- Mesclagem e junção de dados de alto desempenho.
- Funcionalidade de série temporal.