Análise de dados - Visão geral

A Análise de Dados é um processo de inspeção, limpeza, transformação e modelagem de dados com o objetivo de descobrir informações úteis, sugerir conclusões e apoiar a tomada de decisões

.

Tipos de análise de dados

Existem várias técnicas de análise de dados abrangendo vários domínios, como negócios, ciências, ciências sociais, etc., com uma variedade de nomes. As principais abordagens de análise de dados são -

  • Mineração de dados
  • Business Intelligence
  • Análise Estatística
  • Análise preditiva
  • Análise de Texto

Mineração de dados

Data Mining é a análise de grandes quantidades de dados para extrair padrões de dados interessantes e anteriormente desconhecidos, dados incomuns e as dependências. Observe que o objetivo é a extração de padrões e conhecimento de grandes quantidades de dados e não a extração de dados em si.

A análise de mineração de dados envolve métodos de ciência da computação na interseção da inteligência artificial, aprendizado de máquina, estatísticas e sistemas de banco de dados.

Os padrões obtidos da mineração de dados podem ser considerados como um resumo dos dados de entrada que podem ser usados ​​em análises posteriores ou para obter resultados de predição mais precisos por um sistema de suporte à decisão.

Business Intelligence

As técnicas e ferramentas de Business Intelligence são para aquisição e transformação de grandes quantidades de dados de negócios não estruturados para ajudar a identificar, desenvolver e criar novas oportunidades estratégicas de negócios.

O objetivo da inteligência de negócios é permitir a fácil interpretação de grandes volumes de dados para identificar novas oportunidades. Ele ajuda a implementar uma estratégia eficaz com base em percepções que podem fornecer às empresas uma vantagem competitiva de mercado e estabilidade de longo prazo.

Análise Estatística

Estatística é o estudo de coleta, análise, interpretação, apresentação e organização de dados.

Na análise de dados, duas metodologias estatísticas principais são utilizadas -

  • Descriptive statistics - Na estatística descritiva, os dados de toda a população ou amostra são resumidos com descritores numéricos, como -

    • Média, Desvio Padrão para Dados Contínuos

    • Frequência, porcentagem para dados categóricos

  • Inferential statistics- Ele usa padrões nos dados da amostra para fazer inferências sobre a população representada ou contabilizar a aleatoriedade. Essas inferências podem ser -

    • respondendo perguntas sim / não sobre os dados (teste de hipótese)

    • estimar características numéricas dos dados (estimativa)

    • descrevendo associações dentro dos dados (correlação)

    • modelagem de relacionamentos dentro dos dados (por exemplo, análise de regressão)

Análise preditiva

O Predictive Analytics usa modelos estatísticos para analisar dados atuais e históricos para previsões (previsões) sobre eventos futuros ou de outra forma desconhecidos. Nos negócios, a análise preditiva é usada para identificar riscos e oportunidades que auxiliam na tomada de decisões.

Análise de Texto

Text Analytics, também conhecido como Text Mining ou Text Data Mining, é o processo de derivar informações de alta qualidade de texto. A mineração de texto geralmente envolve o processo de estruturar o texto de entrada, derivando padrões dentro dos dados estruturados usando meios como aprendizado de padrão estatístico e, finalmente, avaliação e interpretação da saída.

Processo de Análise de Dados

A Análise de Dados é definida pelo estatístico John Tukey em 1961 como “Procedimentos de análise de dados, técnicas de interpretação dos resultados de tais procedimentos, formas de planejar a coleta de dados para tornar sua análise mais fácil, precisa ou precisa, e todo o maquinário e resultados de estatísticas (matemáticas) que se aplicam à análise de dados. ”

Assim, a análise de dados é um processo para obter dados grandes e não estruturados de várias fontes e convertê-los em informações úteis para -

  • Respondendo a perguntas
  • Hipóteses de teste
  • Decision-making
  • Desmentindo teorias

Análise de dados com Excel

O Microsoft Excel fornece vários meios e maneiras de analisar e interpretar dados. Os dados podem ser de várias fontes. Os dados podem ser convertidos e formatados de várias maneiras. Ele pode ser analisado com os comandos, funções e ferramentas relevantes do Excel - abrangendo formatação condicional, intervalos, tabelas, funções de texto, funções de data, funções de tempo, funções financeiras, subtotais, análise rápida, auditoria de fórmula, ferramenta de consulta, análise de variações hipotéticas, Solucionadores, modelo de dados, PowerPivot, PowerView, PowerMap, etc.

Você aprenderá essas técnicas de análise de dados com o Excel como parte de duas partes -

  • Análise de dados com Excel e
  • Análise Avançada de Dados com Excel