Agendar consultas do Data Kiosk

Saiba como agendar consultas do Data Kiosk.

Use este guia para saber como fazer chamadas regulares automaticamente para createQuery evitando solicitações de dados redundantes.

📘

Observação

Uma amostra de código completa para esse mecanismo de agendamento está publicada em nosso Repositório de amostras no GitHub.

Visão geral do Data Kiosk

O uso do Data Kiosk envolve as seguintes etapas:

  1. Assine a notificação: Inscrever uma fila SQS no DATA_KIOSK_QUERY_PROCESSING_FINISHED notificação, que notifica você quando o processamento de dados é concluído.
  2. Crie a consulta: Envie uma consulta do GraphQL usando o createQuery operação.
  3. Recupere o documento: Uso dataDocumentId ou errorDocumentId para recuperar detalhes do documento com o getDocument operação. Esses atributos estão na carga útil da notificação. Se você receber errorDocumentId, você pode encontrar o motivo da falha no documento.
  4. Armazene os dados: Recupere e armazene o JSONL arquivo do documentUrl para processamento e acesso adicionais.

📘

Observação

Para obter mais informações sobre fluxos de trabalho do Data Kiosk, consulte:

Tutorial: criar um mecanismo de agendamento para o Data Kiosk

Saiba como fazer consultas automáticas e regulares ao Data Kiosk, evitando chamadas redundantes.

Etapa 1. Defina os parâmetros do cronograma

Determine a data de início e a taxa na qual você deseja fazer consultas.

📘

Observação

Se a data de início da consulta estiver no passado e você quiser que o agendador preencha, crie consultas sempre que possível até que você esteja consultando os dias atuais. Isso garante que seus dados permaneçam atualizados. Por exemplo, se a data de início for há um mês e você quiser informações de cada dia, ajuste a solução para que o agendador execute rapidamente consultas para cada dia do mês anterior até chegar ao dia atual.

Se você não precisar preencher, defina a data de início como a data atual ou futura para evitar que o agendador crie consultas anteriores.

As frequências comuns incluem diárias, semanais ou mensais. A escolha da taxa depende da frequência com que seus dados são atualizados. Por exemplo, se seus dados são atualizados diariamente, uma frequência diária é apropriada. Não consulte com muita frequência. Se um conjunto de dados for atualizado diariamente, uma consulta de hora em hora seria redundante.

Etapa 2. Ajustar parâmetros de consulta

Crie uma função que altere as datas de início e término da consulta com base na taxa desejada para que cada consulta recupere novos dados. Por exemplo, se a taxa de agendamento for diária, a função deverá ajustar as datas de início e término em um dia para cada nova consulta.

❗️

Aviso!

Diferentes conjuntos de dados têm diferentes nomes de chaves de atributos e diferentes períodos de recarga de dados. Conheça as chaves de atributos para as datas de início e término de cada conjunto de dados. Quando você atualiza ou altera os atributos das datas de início e término, os nomes das chaves podem variar entre os conjuntos de dados.

Etapa 3. Crie a consulta

Para enviar consultas automaticamente, use um agendador de eventos, como AWS EventBridge. Com o EventBridge, você pode configurar tarefas recorrentes usando expressões cron ou expressões de taxa (por exemplo, a cada cinco minutos, de hora em hora, diariamente). Configure o EventBridge para ajustar automaticamente as datas das consultas e fazer as chamadas para createQuery em intervalos definidos para recuperar dados de forma contínua e eficiente.

Etapa 4. Salvar informações de agendamento

Armazene informações de agendamento, como datas de início, taxas e consultas associadas, em um banco de dados. Certifique-se de poder cancelar ou excluir agendas conforme necessário e manter registros de consultas para fins de auditoria e geração de relatórios.

Melhores práticas e considerações

Evite erros e gerencie a redundância. Algumas coisas a considerar incluem:

  • Evite redundância: Valide se as consultas solicitam dados exclusivos. Certifique-se de que não haja sobreposição com os carimbos de data/hora de dados armazenados anteriormente e não crie várias agendas para a mesma consulta. A criação da consulta falhará se a consulta anterior ainda estiver em execução.

  • Erros de registro: Não permita que uma consulta com falha interrompa todo o mecanismo de agendamento. Implemente um registro abrangente para capturar erros durante o envio da consulta e a recuperação de dados. Processe os documentos de erro que o Data Kiosk retorna e corrija os erros que eles contêm.

  • Tente novamente: Se uma consulta for limitada pela limitação de consulta simultânea, incorpore mecanismos de repetição que usem recuo exponencial.

  • Monitore e alerte: Monitore em tempo real e defina alertas de erro para consultas com falha, limites de taxa excedidos ou tempos de processamento prolongados. Identifique e responda rapidamente aos problemas.

Para obter detalhes sobre diferentes erros e como corrigi-los, consulte Tratamento de erros de processamento.


Esta página ajudou você?