ビッグデータ分析-データサイエンティスト
データサイエンティストの役割は通常、予測モデリング、セグメンテーションアルゴリズムの開発、レコメンダーシステム、A / Bテストフレームワークなどのタスクに関連付けられており、多くの場合、生の非構造化データを処理します。
彼らの仕事の性質上、数学、応用統計、プログラミングについての深い理解が必要です。データアナリストとデータサイエンティストに共通するスキルがいくつかあります。たとえば、データベースにクエリを実行する機能などです。どちらもデータを分析しますが、データサイエンティストの決定は、組織に大きな影響を与える可能性があります。
これは、データサイエンティストが通常持つ必要のある一連のスキルです-
- R、Python、SAS、SPSS、Juliaなどの統計パッケージでのプログラミング
- さまざまなソースからのデータをクリーンアップ、抽出、および探索できる
- 統計モデルの調査、設計、および実装
- 統計、数学、コンピューターサイエンスに関する深い知識
ビッグデータ分析では、人々は通常、データサイエンティストの役割とデータアーキテクトの役割を混同します。実際には、違いは非常に単純です。データアーキテクトはデータが保存されるツールとアーキテクチャを定義しますが、データサイエンティストはこのアーキテクチャを使用します。もちろん、データサイエンティストは、アドホックプロジェクトに必要な場合は新しいツールをセットアップできるはずですが、インフラストラクチャの定義と設計は彼のタスクの一部であってはなりません。