Stack Exchange Data Explorer si interrompe in modo intermittente

Aug 18 2020

Da domenica, prevedo che dopo l'aggiornamento delle 03:00 UTC, Stack Exchange Data Explorer sembra avere problemi a servire le pagine.

Noto che sono disconnesso frequentemente, ricevo la casella di errore rossa che qualcosa è andato storto durante l'esecuzione della mia query o mi viene presentata la pagina di manutenzione.

Riprovare la mia azione e / o aggiornare sembra risolvere il problema in qualche modo fino al prossimo inconveniente.

Sono presenti rapporti di altri utenti che riscontrano gli stessi problemi . E alcuni utenti non segnalano problemi . Ciò indica la natura intermittente del problema.

Penso che l'istanza di SEDE abbia bisogno di un abbraccio, quindi si sente di nuovo felice. Qualcuno può fare un giro in bicicletta fino al data center e applicare l'amore necessario?

Risposte

15 Taryn Aug 18 2020 at 21:59

TL; DR; Questo dovrebbe essere risolto nelle prossime 8-24 ore poiché abbiamo dovuto bloccare un bot che ci raschiava.


Versione più lunga:

Ho notato gli sbattimenti durante il fine settimana e ieri ho iniziato a indagare. La mia prima ipotesi è stata un problema SQL. Dopo alcune ricerche iniziali, ho apportato alcune modifiche a livello di server per vedere se le cose si sarebbero stabilizzate. Lo hanno fatto per diverse ore, ma la scorsa notte ho notato un'altra interruzione, quindi questa mattina ho preso un dump della memoria per la revisione.

Dopo un sacco di sbattimenti durante la notte, Nick e io abbiamo iniziato a rivedere le discariche questa mattina, beh per lo più Nick ha esaminato e ho guardato. Abbiamo notato alcuni problemi di threading, quindi abbiamo esaminato le connessioni totali a SEDE per capire cosa stava monopolizzando tutte le connessioni, ma nulla si è distinto, quindi ci siamo rivolti ai nostri registri di traffico e abbiamo trovato il problema.

Inizialmente abbiamo interrogato i registri negli ultimi due giorni e abbiamo visto che Applebot ci stava scansionando. Crawled è un eufemismo, ci stavamo sbattendo.

Ecco alcune statistiche sul traffico da Applebot e da tutti gli altri per dare un'idea su larga scala: le interruzioni sono iniziate il 16-08-2020 tra quella data e oggi (18-08-2020) che abbiamo avuto:

Applebot  |  Non-Applebot Traffic
---------------------------------
1484480   |  290063

Abbiamo aggiunto Applebot al file robots.txt per interrompere la scansione. Ci vorrà un po 'di tempo prima che abbia successo, quindi potremmo avere un po' più di sbattimento di SEDE, ma lo monitoreremo e daremo calci se necessario.