Consultar séries temporais de QuestDb usando Pandas com parâmetros
Estou tentando carregar dados de série de tempo de QuestDb para Pandas Dataframe. Estou tentando usar o driver Postgres como
import pandas as pd
from sqlalchemy import create_engine
from datetime import datetime
engine = create_engine('postgresql://admin:quest@localhost:8812/mydb')
df = pd.read_sql_query(
"select * from cases where ts between %(dstart)s and %(dfinish)s",
con=engine,
params={"dstart":datetime(2020,12,24,16,0),"dfinish":datetime(2021,1,1,0,0)})
Mas voltou
DatabaseError: (psycopg2.DatabaseError) between/and parameters must be constants
LINE 1: ...etry where ts between '2020-12-24T16:00:00'::timestamp ...
Também tentei usar> e <em vez de BETWEEN
df = pd.read_sql_query(
"select * from cases where ts > %(dstart)s and ts < %(dfinish)s",
con=engine,
params={"dstart":datetime(2014,6,24,16,0),"dfinish":datetime(2014,6,24,17,0)})
Mas ainda sem sorte
DatabaseError: (psycopg2.DatabaseError) unsupported class
LINE 1: ... > '2020-06-24T16:00:00'::timestamp and ts < '2021-01-0...
Ele funciona sem parâmetros, então não está totalmente errado, mas estou faltando alguma coisa aqui.
Respostas
QuestDb tem suporte para driver Postgres, mas não é totalmente compatível com consultas SQL. Poucos bits não funcionam, então BETWEEN aparentemente só pode ser usado com constantes. Além disso, quando você usa parâmetros de data e hora python, eles são convertidos '2020-06-24T16:00:00'::timestamp
na consulta, que também não é compatível com QuestDb
A solução alternativa é passar parâmetros de string e convertê-los em carimbo de data / hora na própria consulta, algo como
df = pd.read_sql_query(
"select * from cases where ts > to_timestamp(%(dstart)s, 'yyyy-MM-dd HH:mm:ss') " +
"and ts < to_timestamp(%(dfinish)s, 'yyyy-MM-dd HH:mm:ss')",
con=engine,
params={"dstart":datetime(2020,12,24,16,0).strftime("%Y-%m-%d %H:%M:%S"),
"dfinish":datetime(2021,6,24,17,0).strftime("%Y-%m-%d %H:%M:%S")})
É o mesmo que no Trenton mencionado nos comentários.