AWS Quicksight - Korzystanie ze źródeł danych
AWS Quicksight przyjmuje dane z różnych źródeł. Po kliknięciu „New Dataset” na stronie głównej dostępne są opcje dotyczące wszystkich źródeł danych, których można użyć.
Poniżej znajdują się źródła zawierające listę wszystkich źródeł wewnętrznych i zewnętrznych -
Przejdźmy przez połączenie Quicksight z niektórymi z najczęściej używanych źródeł danych -
Wgrywanie pliku z systemu
Umożliwia wprowadzanie tylko plików w formacie .csv, .tsv, .clf, .elf.xlsx i Json. Po wybraniu pliku Quicksight automatycznie rozpoznaje plik i wyświetla dane. Po kliknięciuUpload a File musisz podać lokalizację pliku, którego chcesz użyć do utworzenia zbioru danych.
Korzystanie z pliku w formacie S3
Ekran pojawi się jak poniżej. W polu Nazwa źródła danych można wprowadzić nazwę, która będzie wyświetlana dla utworzonego zestawu danych. Wymagałoby to również przesłania pliku manifestu z systemu lokalnego lub podania lokalizacji S3 pliku manifestu.
Plik manifestu to plik w formacie json, który określa adres URL / lokalizację plików wejściowych i ich format. Możesz wprowadzić więcej niż jeden plik wejściowy, pod warunkiem, że format jest taki sam. Oto przykład pliku manifestu. Parametr „URI” używany do przekazywania lokalizacji pliku wejściowego to S3.
{
"fileLocations": [
{
"URIs": [
"url of first file",
"url of second file",
"url of 3rd file and so on"
]
},
],
}
"globalUploadSettings": {
"format": "CSV",
"delimiter": ",",
"textqualifier": "'",
"containsHeader": "true"
}
Parametry przekazane globalUploadSettingssą domyślne. Możesz zmienić te parametry zgodnie ze swoimi wymaganiami.
MySQL
Musisz wprowadzić informacje o bazie danych w polach, aby połączyć się z bazą danych. Po podłączeniu do bazy danych możesz zaimportować z niej dane.
Podczas łączenia się z dowolną bazą danych RDBMS wymagane są następujące informacje:
- Nazwa DSN
- Rodzaj połączenia
- Nazwa serwera bazy danych
- Port
- Nazwa bazy danych
- Nazwa Użytkownika
- Password
Następujące źródła danych oparte na RDBMS są obsługiwane w Quicksight -
- Amazon Athena
- Amazon Aurora
- Amazon Redshift
- Amazon Redshift Spectrum
- Amazon S3
- Amazon S3 Analytics
- Apache Spark 2.0 lub nowszy
- MariaDB 10.0 lub nowsza
- Microsoft SQL Server 2012 lub nowszy
- MySQL 5.1 lub nowszy
- PostgreSQL 9.3.1 lub nowszy
- Presto 0.167 lub nowszy
- Snowflake
- Teradata 14.0 lub nowsza
Athena
Athena to narzędzie AWS do uruchamiania zapytań na tabelach. Możesz wybrać dowolną tabelę z Athena lub uruchomić niestandardowe zapytanie na tych tabelach i użyć wyników tych zapytań w Quicksight. Aby wybrać źródło danych, należy wykonać kilka kroków
Po wybraniu Ateny pojawi się poniższy ekran. W Quicksight możesz wprowadzić dowolną nazwę źródła danych, którą chcesz nadać źródłu danych. Kliknij“Validate Connection”. Po potwierdzeniu połączenia kliknij plik“Create new source” przycisk
Teraz wybierz nazwę stołu z listy rozwijanej. Lista rozwijana pokaże bazy danych obecne w Athena, co dodatkowo pokaże tabele w tej bazie danych. W przeciwnym razie możesz kliknąć“Use custom SQL” aby uruchomić zapytanie na stołach Athena.
Po zakończeniu możesz kliknąć “Edit/Preview data” lub “Visualize” aby edytować swoje dane lub bezpośrednio wizualizować dane zgodnie z wymaganiami.
Usuwanie źródła danych
Usunięcie źródła danych, które jest używane w dowolnym z pulpitów nawigacyjnych Quicksight, może spowodować, że powiązany zestaw danych stanie się bezużyteczny. Zwykle dzieje się tak, gdy wysyłasz zapytanie do źródła danych opartego na języku SQL.
Podczas tworzenia zbioru danych na podstawie S3, Sales force or SPICE, nie ma to wpływu na możliwość korzystania z dowolnego zbioru danych, ponieważ dane są przechowywane w SPICE; jednak opcja odświeżania nie jest dostępna w tym przypadku.
Aby usunąć źródło danych, wybierz źródło danych. Przejdź do karty Z istniejącego źródła danych podczas tworzenia strony zestawu danych.
Przed usunięciem możesz również potwierdzić szacowany rozmiar tabeli i inne szczegóły źródła danych.