AWS Quicksight - Korzystanie ze źródeł danych

AWS Quicksight przyjmuje dane z różnych źródeł. Po kliknięciu „New Dataset” na stronie głównej dostępne są opcje dotyczące wszystkich źródeł danych, których można użyć.

Poniżej znajdują się źródła zawierające listę wszystkich źródeł wewnętrznych i zewnętrznych -

Przejdźmy przez połączenie Quicksight z niektórymi z najczęściej używanych źródeł danych -

Wgrywanie pliku z systemu

Umożliwia wprowadzanie tylko plików w formacie .csv, .tsv, .clf, .elf.xlsx i Json. Po wybraniu pliku Quicksight automatycznie rozpoznaje plik i wyświetla dane. Po kliknięciuUpload a File musisz podać lokalizację pliku, którego chcesz użyć do utworzenia zbioru danych.

Korzystanie z pliku w formacie S3

Ekran pojawi się jak poniżej. W polu Nazwa źródła danych można wprowadzić nazwę, która będzie wyświetlana dla utworzonego zestawu danych. Wymagałoby to również przesłania pliku manifestu z systemu lokalnego lub podania lokalizacji S3 pliku manifestu.

Plik manifestu to plik w formacie json, który określa adres URL / lokalizację plików wejściowych i ich format. Możesz wprowadzić więcej niż jeden plik wejściowy, pod warunkiem, że format jest taki sam. Oto przykład pliku manifestu. Parametr „URI” używany do przekazywania lokalizacji pliku wejściowego to S3.

{
   "fileLocations": [
      {
         "URIs": [
            "url of first file",
            "url of second file",
            "url of 3rd file and so on"
         ]
      },
   
   ],
}
"globalUploadSettings": {
   "format": "CSV",
   "delimiter": ",",
   "textqualifier": "'",
   "containsHeader": "true"
}

Parametry przekazane globalUploadSettingssą domyślne. Możesz zmienić te parametry zgodnie ze swoimi wymaganiami.

MySQL

Musisz wprowadzić informacje o bazie danych w polach, aby połączyć się z bazą danych. Po podłączeniu do bazy danych możesz zaimportować z niej dane.

Podczas łączenia się z dowolną bazą danych RDBMS wymagane są następujące informacje:

Nazwa DSN
Rodzaj połączenia
Nazwa serwera bazy danych
Port
Nazwa bazy danych
Nazwa Użytkownika
Password

Następujące źródła danych oparte na RDBMS są obsługiwane w Quicksight -

Amazon Athena
Amazon Aurora
Amazon Redshift
Amazon Redshift Spectrum
Amazon S3
Amazon S3 Analytics
Apache Spark 2.0 lub nowszy
MariaDB 10.0 lub nowsza
Microsoft SQL Server 2012 lub nowszy
MySQL 5.1 lub nowszy
PostgreSQL 9.3.1 lub nowszy
Presto 0.167 lub nowszy
Snowflake
Teradata 14.0 lub nowsza

Athena

Athena to narzędzie AWS do uruchamiania zapytań na tabelach. Możesz wybrać dowolną tabelę z Athena lub uruchomić niestandardowe zapytanie na tych tabelach i użyć wyników tych zapytań w Quicksight. Aby wybrać źródło danych, należy wykonać kilka kroków

Po wybraniu Ateny pojawi się poniższy ekran. W Quicksight możesz wprowadzić dowolną nazwę źródła danych, którą chcesz nadać źródłu danych. Kliknij“Validate Connection”. Po potwierdzeniu połączenia kliknij plik“Create new source” przycisk

Teraz wybierz nazwę stołu z listy rozwijanej. Lista rozwijana pokaże bazy danych obecne w Athena, co dodatkowo pokaże tabele w tej bazie danych. W przeciwnym razie możesz kliknąć“Use custom SQL” aby uruchomić zapytanie na stołach Athena.

Po zakończeniu możesz kliknąć “Edit/Preview data” lub “Visualize” aby edytować swoje dane lub bezpośrednio wizualizować dane zgodnie z wymaganiami.

Usuwanie źródła danych

Usunięcie źródła danych, które jest używane w dowolnym z pulpitów nawigacyjnych Quicksight, może spowodować, że powiązany zestaw danych stanie się bezużyteczny. Zwykle dzieje się tak, gdy wysyłasz zapytanie do źródła danych opartego na języku SQL.

Podczas tworzenia zbioru danych na podstawie S3, Sales force or SPICE, nie ma to wpływu na możliwość korzystania z dowolnego zbioru danych, ponieważ dane są przechowywane w SPICE; jednak opcja odświeżania nie jest dostępna w tym przypadku.

Aby usunąć źródło danych, wybierz źródło danych. Przejdź do karty Z istniejącego źródła danych podczas tworzenia strony zestawu danych.

Przed usunięciem możesz również potwierdzić szacowany rozmiar tabeli i inne szczegóły źródła danych.