Apache Presto - Ferramentas Administrativas

Neste capítulo, discutiremos as ferramentas de administração usadas no Presto. Vamos começar com a interface da Web do Presto.

Interface web

Presto oferece uma interface web para monitorar e gerenciar consultas. Ele pode ser acessado a partir do número da porta especificado nas Propriedades de configuração do coordenador.

Inicie o servidor Presto e o Presto CLI. Em seguida, você pode acessar a interface da web a partir do seguinte url -http://localhost:8080/

A saída será semelhante à tela acima.

Aqui, a página principal tem uma lista de consultas junto com informações como ID exclusivo da consulta, texto da consulta, estado da consulta, porcentagem concluída, nome de usuário e fonte de origem da consulta. As consultas mais recentes são executadas primeiro e, em seguida, as consultas concluídas ou não concluídas são exibidas na parte inferior.

Ajustando o desempenho no Presto

Se o cluster Presto estiver tendo algum problema relacionado ao desempenho, altere suas configurações padrão para as seguintes configurações.

Propriedades de configuração

  • task. info -refresh-max-wait - Reduz a carga de trabalho do coordenador.

  • task.max-worker-threads - Divide o processo e atribui a cada nó de trabalho.

  • distributed-joins-enabled - Junções distribuídas baseadas em hash.

  • node-scheduler.network-topology - Define a topologia de rede para o planejador.

Configurações JVM

Altere suas configurações JVM padrão para as configurações a seguir. Isso será útil para diagnosticar problemas de coleta de lixo.

-XX:+PrintGCApplicationConcurrentTime 
-XX:+PrintGCApplicationStoppedTime 
-XX:+PrintGCCause 
-XX:+PrintGCDateStamps 
-XX:+PrintGCTimeStamps 
-XX:+PrintGCDetails 
-XX:+PrintReferenceGC 
-XX:+PrintClassHistogramAfterFullGC 
-XX:+PrintClassHistogramBeforeFullGC 
-XX:PrintFLSStatistics = 2 
-XX:+PrintAdaptiveSizePolicy 
-XX:+PrintSafepointStatistics 
-XX:PrintSafepointStatisticsCount = 1