Анализ данных - Обзор

Анализ данных - это процесс проверки, очистки, преобразования и моделирования данных с целью обнаружения полезной информации, предложения выводов и поддержки принятия решений.

.

Типы анализа данных

Существует несколько методов анализа данных, охватывающих различные области, такие как бизнес, наука, общественные науки и т. Д. С различными названиями. Основные подходы к анализу данных:

  • Сбор данных
  • Бизнес-аналитика
  • Статистический анализ
  • Прогностическая аналитика
  • Текстовая аналитика

Сбор данных

Data Mining - это анализ больших объемов данных для извлечения ранее неизвестных интересных шаблонов данных, необычных данных и зависимостей. Обратите внимание, что целью является извлечение шаблонов и знаний из больших объемов данных, а не извлечение самих данных.

Анализ интеллектуального анализа данных включает в себя методы информатики на стыке систем искусственного интеллекта, машинного обучения, статистики и баз данных.

Шаблоны, полученные в результате интеллектуального анализа данных, можно рассматривать как сводку входных данных, которые можно использовать в дальнейшем анализе или для получения более точных результатов прогнозирования системой поддержки принятия решений.

Бизнес-аналитика

Методы и инструменты бизнес-аналитики предназначены для сбора и преобразования больших объемов неструктурированных бизнес-данных, чтобы помочь выявлять, развивать и создавать новые стратегические возможности для бизнеса.

Цель бизнес-аналитики - облегчить интерпретацию больших объемов данных для выявления новых возможностей. Это помогает в реализации эффективной стратегии, основанной на знаниях, которые могут обеспечить предприятиям конкурентное рыночное преимущество и долгосрочную стабильность.

Статистический анализ

Статистика - это изучение сбора, анализа, интерпретации, представления и организации данных.

При анализе данных используются две основные статистические методологии:

  • Descriptive statistics - В описательной статистике данные по генеральной совокупности или выборке суммируются с помощью числовых дескрипторов, таких как -

    • Среднее, стандартное отклонение для непрерывных данных

    • Частота, процент для категориальных данных

  • Inferential statistics- Он использует шаблоны в выборочных данных, чтобы делать выводы о представленной совокупности или учитывать случайность. Эти выводы могут быть -

    • ответы на вопросы да / нет о данных (проверка гипотез)

    • оценка числовых характеристик данных (оценка)

    • описание ассоциаций в данных (корреляция)

    • моделирование взаимосвязей в данных (например, регрессионный анализ)

Прогностическая аналитика

Predictive Analytics использует статистические модели для анализа текущих и исторических данных для прогнозирования (предсказаний) будущих или других неизвестных событий. В бизнесе прогнозная аналитика используется для выявления рисков и возможностей, которые помогают в принятии решений.

Текстовая аналитика

Анализ текста, также называемый интеллектуальным анализом текста или интеллектуальным анализом текстовых данных, - это процесс получения высококачественной информации из текста. Интеллектуальный анализ текста обычно включает в себя процесс структурирования входного текста, получение шаблонов в структурированных данных с использованием таких средств, как статистическое изучение шаблонов, и, наконец, оценка и интерпретация результатов.

Процесс анализа данных

Статистик Джон Тьюки в 1961 году определил анализ данных как «Процедуры анализа данных, методы интерпретации результатов таких процедур, способы планирования сбора данных, чтобы сделать их анализ более простым, точным или более точным, и все механизмы». и результаты (математической) статистики, которые применяются для анализа данных ».

Таким образом, анализ данных - это процесс получения больших неструктурированных данных из различных источников и преобразования их в информацию, которая полезна для:

  • Отвечая на вопросы
  • Проверить гипотезы
  • Decision-making
  • Опровергая теории

Анализ данных с помощью Excel

Microsoft Excel предоставляет несколько средств и способов анализа и интерпретации данных. Данные могут быть из разных источников. Данные можно преобразовать и отформатировать несколькими способами. Его можно анализировать с помощью соответствующих команд, функций и инструментов Excel, включая условное форматирование, диапазоны, таблицы, текстовые функции, функции даты, функции времени, финансовые функции, промежуточные итоги, быстрый анализ, аудит формул, инструмент запроса, анализ «что, если», Решатели, модель данных, PowerPivot, PowerView, PowerMap и т. Д.

Вы изучите эти методы анализа данных с помощью Excel в рамках двух частей:

  • Анализ данных с помощью Excel и
  • Расширенный анализ данных с помощью Excel