Query timeseries da QuestDb utilizzando Pandas con parametri
Sto cercando di caricare i dati delle serie temporali da QuestDb a Pandas Dataframe. Sto cercando di utilizzare il driver Postgres come
import pandas as pd
from sqlalchemy import create_engine
from datetime import datetime
engine = create_engine('postgresql://admin:quest@localhost:8812/mydb')
df = pd.read_sql_query(
"select * from cases where ts between %(dstart)s and %(dfinish)s",
con=engine,
params={"dstart":datetime(2020,12,24,16,0),"dfinish":datetime(2021,1,1,0,0)})
Ma sono tornato
DatabaseError: (psycopg2.DatabaseError) between/and parameters must be constants
LINE 1: ...etry where ts between '2020-12-24T16:00:00'::timestamp ...
Ho anche provato a usare> e <invece di BETWEEN
df = pd.read_sql_query(
"select * from cases where ts > %(dstart)s and ts < %(dfinish)s",
con=engine,
params={"dstart":datetime(2014,6,24,16,0),"dfinish":datetime(2014,6,24,17,0)})
Ma ancora senza fortuna
DatabaseError: (psycopg2.DatabaseError) unsupported class
LINE 1: ... > '2020-06-24T16:00:00'::timestamp and ts < '2021-01-0...
Funziona senza parametri, quindi non è del tutto sbagliato, ma qui mi manca qualcosa.
Risposte
QuestDb supporta il driver Postgres ma non è completamente compatibile con le query SQL. Pochi bit non funzionano quindi BETWEEN apparentemente può essere usato solo con costanti. Inoltre, quando si utilizzano parametri datetime python, vengono convertiti '2020-06-24T16:00:00'::timestamp
nella query, anch'essa non supportata da QuestDb
La soluzione alternativa è passare i parametri della stringa e convertirli in timestamp nella query stessa, qualcosa di simile
df = pd.read_sql_query(
"select * from cases where ts > to_timestamp(%(dstart)s, 'yyyy-MM-dd HH:mm:ss') " +
"and ts < to_timestamp(%(dfinish)s, 'yyyy-MM-dd HH:mm:ss')",
con=engine,
params={"dstart":datetime(2020,12,24,16,0).strftime("%Y-%m-%d %H:%M:%S"),
"dfinish":datetime(2021,6,24,17,0).strftime("%Y-%m-%d %H:%M:%S")})
È lo stesso del Trenton menzionato nei commenti.