Services Web Amazon - Redshift
Amazon Redshiftest un service d'entrepôt de données entièrement géré dans le cloud. Ses ensembles de données vont de 100 gigaoctets à un pétaoctet. Le processus initial de création d'un entrepôt de données consiste à lancer un ensemble de ressources de calcul appelénodes, qui sont organisés en groupes appelés cluster. Après cela, vous pouvez traiter vos requêtes.
Comment configurer Amazon Redshift?
Voici les étapes de configuration d'Amazon Redshift.
Step 1 - Connectez-vous et lancez un cluster Redshift en suivant les étapes suivantes.
Connectez-vous à AWS Management Console et utilisez le lien suivant pour ouvrir la console Amazon Redshift - https://console.aws.amazon.com/redshift/
Sélectionnez la région dans laquelle le cluster doit être créé à l'aide du menu Région dans le coin supérieur droit de l'écran.
Cliquez sur le bouton Lancer le cluster.
La page Détails du cluster s'ouvre. Fournissez les détails requis et cliquez sur le bouton Continuer jusqu'à la page de révision.
Une page de confirmation s'ouvre. Cliquez sur le bouton Fermer pour terminer afin que le cluster soit visible dans la liste Clusters.
Sélectionnez le cluster dans la liste et examinez les informations sur l'état du cluster. La page affichera l'état du cluster.
Step 2- Configurez le groupe de sécurité pour autoriser les connexions client au cluster. L'autorisation d'accès à Redshift dépend du fait que le client autorise ou non une instance EC2.
Suivez ces étapes pour sécuriser le groupe sur la plate-forme EC2-VPC.
Ouvrez Amazon Redshift Console et cliquez sur Clusters dans le volet de navigation.
Sélectionnez le cluster souhaité. Son onglet Configuration s'ouvre.
Cliquez sur le groupe Sécurité.
Une fois la page du groupe de sécurité ouverte, cliquez sur l'onglet Entrant.
Cliquez sur le bouton Modifier. Définissez les champs comme indiqué ci-dessous et cliquez sur le bouton Enregistrer.
Type - Règle TCP personnalisée.
Protocol - TCP.
Port Range- Tapez le même numéro de port utilisé lors du lancement du cluster. Le port par défaut pour Amazon Redshift est 5439.
Source - Sélectionnez IP personnalisée, puis tapez 0.0.0.0/0.
Step 3 - Connectez-vous à Redshift Cluster.
Il existe deux façons de se connecter à Redshift Cluster: directement ou via SSL.
Voici les étapes pour se connecter directement.
Connectez le cluster à l'aide d'un outil client SQL. Il prend en charge les outils clients SQL compatibles avec les pilotes PostgreSQL JDBC ou ODBC.
Utilisez les liens suivants pour télécharger - JDBC https://jdbc.postgresql.org/download/postgresql-8.4-703.jdbc4.jar
ODBC https://ftp.postgresql.org/pub/odbc/versions/msi/psqlodbc_08_04_0200.zip ou http://ftp.postgresql.org/pub/odbc/versions/msi/psqlodbc_09_00_0101x64.zip pour les machines 64 bits
Utilisez les étapes suivantes pour obtenir la chaîne de connexion.
Ouvrez Amazon Redshift Console et sélectionnez Cluster dans le volet de navigation.
Sélectionnez le cluster de votre choix et cliquez sur l'onglet Configuration.
Une page s'ouvre comme indiqué dans la capture d'écran suivante avec l'URL JDBC sous Propriétés de la base de données de cluster. Copiez l'URL.
Utilisez les étapes suivantes pour connecter le cluster à SQL Workbench / J.
Ouvrez SQL Workbench / J.
Sélectionnez le fichier et cliquez sur la fenêtre Connexion.
Sélectionnez Créer un nouveau profil de connexion et remplissez les détails requis tels que le nom, etc.
Cliquez sur Gérer les pilotes et gérer les pilotes La boîte de dialogue s'ouvre.
Cliquez sur le bouton Créer une nouvelle entrée et remplissez les détails requis.
Cliquez sur l'icône du dossier et accédez à l'emplacement du pilote. Enfin, cliquez sur le bouton Ouvrir.
Laissez les champs Nom de classe et Exemple d'URL vides. Cliquez sur OK.
Choisissez le pilote dans la liste.
Dans le champ URL, collez l'URL JDBC copiée.
Entrez le nom d'utilisateur et le mot de passe dans leurs champs respectifs.
Cochez la case Autocommit et cliquez sur Enregistrer la liste des profils.
Caractéristiques d'Amazon Redshift
Voici les fonctionnalités d'Amazon Redshift -
Supports VPC - Les utilisateurs peuvent lancer Redshift dans VPC et contrôler l'accès au cluster via l'environnement de réseau virtuel.
Encryption - Les données stockées dans Redshift peuvent être cryptées et configurées lors de la création de tables dans Redshift.
SSL - Le cryptage SSL est utilisé pour crypter les connexions entre les clients et Redshift.
Scalable- En quelques clics simples, le nombre de nœuds peut être facilement mis à l'échelle dans votre entrepôt de données Redshift selon les besoins. Il permet également d'augmenter la capacité de stockage sans aucune perte de performances.
Cost-effective- Amazon Redshift est une alternative économique aux pratiques traditionnelles d'entreposage de données. Il n'y a pas de coûts initiaux, pas d'engagements à long terme et de structure de prix à la demande.