Agendar consultas do Data Kiosk
Saiba como agendar consultas do Data Kiosk.
Use este guia para saber como fazer chamadas regulares automaticamente para createQuery
evitando solicitações de dados redundantes.
Observação
Uma amostra de código completa para esse mecanismo de agendamento está publicada em nosso Repositório de amostras no GitHub.
Visão geral do Data Kiosk
O uso do Data Kiosk envolve as seguintes etapas:
- Assine a notificação: Inscrever uma fila SQS no
DATA_KIOSK_QUERY_PROCESSING_FINISHED
notificação, que notifica você quando o processamento de dados é concluído. - Crie a consulta: Envie uma consulta do GraphQL usando o
createQuery
operação. - Recupere o documento: Uso
dataDocumentId
ouerrorDocumentId
para recuperar detalhes do documento com ogetDocument
operação. Esses atributos estão na carga útil da notificação. Se você recebererrorDocumentId
, você pode encontrar o motivo da falha no documento. - Armazene os dados: Recupere e armazene o JSONL arquivo do
documentUrl
para processamento e acesso adicionais.
Observação
Para obter mais informações sobre fluxos de trabalho do Data Kiosk, consulte:
Tutorial: criar um mecanismo de agendamento para o Data Kiosk
Saiba como fazer consultas automáticas e regulares ao Data Kiosk, evitando chamadas redundantes.
Etapa 1. Defina os parâmetros do cronograma
Determine a data de início e a taxa na qual você deseja fazer consultas.
Observação
Se a data de início da consulta estiver no passado e você quiser que o agendador preencha, crie consultas sempre que possível até que você esteja consultando os dias atuais. Isso garante que seus dados permaneçam atualizados. Por exemplo, se a data de início for há um mês e você quiser informações de cada dia, ajuste a solução para que o agendador execute rapidamente consultas para cada dia do mês anterior até chegar ao dia atual.
Se você não precisar preencher, defina a data de início como a data atual ou futura para evitar que o agendador crie consultas anteriores.
As frequências comuns incluem diárias, semanais ou mensais. A escolha da taxa depende da frequência com que seus dados são atualizados. Por exemplo, se seus dados são atualizados diariamente, uma frequência diária é apropriada. Não consulte com muita frequência. Se um conjunto de dados for atualizado diariamente, uma consulta de hora em hora seria redundante.
Etapa 2. Ajustar parâmetros de consulta
Crie uma função que altere as datas de início e término da consulta com base na taxa desejada para que cada consulta recupere novos dados. Por exemplo, se a taxa de agendamento for diária, a função deverá ajustar as datas de início e término em um dia para cada nova consulta.
Aviso!
Diferentes conjuntos de dados têm diferentes nomes de chaves de atributos e diferentes períodos de recarga de dados. Conheça as chaves de atributos para as datas de início e término de cada conjunto de dados. Quando você atualiza ou altera os atributos das datas de início e término, os nomes das chaves podem variar entre os conjuntos de dados.
Etapa 3. Crie a consulta
Para enviar consultas automaticamente, use um agendador de eventos, como AWS EventBridge. Com o EventBridge, você pode configurar tarefas recorrentes usando expressões cron ou expressões de taxa (por exemplo, a cada cinco minutos, de hora em hora, diariamente). Configure o EventBridge para ajustar automaticamente as datas das consultas e fazer as chamadas para createQuery
em intervalos definidos para recuperar dados de forma contínua e eficiente.
Etapa 4. Salvar informações de agendamento
Armazene informações de agendamento, como datas de início, taxas e consultas associadas, em um banco de dados. Certifique-se de poder cancelar ou excluir agendas conforme necessário e manter registros de consultas para fins de auditoria e geração de relatórios.
Melhores práticas e considerações
Evite erros e gerencie a redundância. Algumas coisas a considerar incluem:
-
Evite redundância: Valide se as consultas solicitam dados exclusivos. Certifique-se de que não haja sobreposição com os carimbos de data/hora de dados armazenados anteriormente e não crie várias agendas para a mesma consulta. A criação da consulta falhará se a consulta anterior ainda estiver em execução.
-
Erros de registro: Não permita que uma consulta com falha interrompa todo o mecanismo de agendamento. Implemente um registro abrangente para capturar erros durante o envio da consulta e a recuperação de dados. Processe os documentos de erro que o Data Kiosk retorna e corrija os erros que eles contêm.
-
Tente novamente: Se uma consulta for limitada pela limitação de consulta simultânea, incorpore mecanismos de repetição que usem recuo exponencial.
-
Monitore e alerte: Monitore em tempo real e defina alertas de erro para consultas com falha, limites de taxa excedidos ou tempos de processamento prolongados. Identifique e responda rapidamente aos problemas.
Para obter detalhes sobre diferentes erros e como corrigi-los, consulte Tratamento de erros de processamento.
Updated 23 days ago