パラメータ付きのパンダを使用してQuestDbから時系列をクエリする
QuestDbからPandasDataframeに時系列データを読み込もうとしています。私は次のようなPostgresドライバーを使おうとしています
import pandas as pd
from sqlalchemy import create_engine
from datetime import datetime
engine = create_engine('postgresql://admin:quest@localhost:8812/mydb')
df = pd.read_sql_query(
"select * from cases where ts between %(dstart)s and %(dfinish)s",
con=engine,
params={"dstart":datetime(2020,12,24,16,0),"dfinish":datetime(2021,1,1,0,0)})
しかし戻ってきた
DatabaseError: (psycopg2.DatabaseError) between/and parameters must be constants
LINE 1: ...etry where ts between '2020-12-24T16:00:00'::timestamp ...
また、BETWEENの代わりに>と<を使用しようとしました
df = pd.read_sql_query(
"select * from cases where ts > %(dstart)s and ts < %(dfinish)s",
con=engine,
params={"dstart":datetime(2014,6,24,16,0),"dfinish":datetime(2014,6,24,17,0)})
しかし、それでも運がない
DatabaseError: (psycopg2.DatabaseError) unsupported class
LINE 1: ... > '2020-06-24T16:00:00'::timestamp and ts < '2021-01-0...
パラメータなしで動作するので、完全に間違っているわけではありませんが、ここで何かが欠けています。
回答
4 AlexdesPelagos
QuestDbはPostgresドライバーをサポートしていますが、SQLクエリと完全に互換性はありません。動作しないビットはほとんどないため、BETWEENは定数でのみ使用できるようです。また、Pythonの日時パラメータを使用する'2020-06-24T16:00:00'::timestamp
と、クエリで変換されますが、これもQuestDbではサポートされていません。
回避策は、文字列パラメータを渡し、クエリ自体でタイムスタンプに変換することです。
df = pd.read_sql_query(
"select * from cases where ts > to_timestamp(%(dstart)s, 'yyyy-MM-dd HH:mm:ss') " +
"and ts < to_timestamp(%(dfinish)s, 'yyyy-MM-dd HH:mm:ss')",
con=engine,
params={"dstart":datetime(2020,12,24,16,0).strftime("%Y-%m-%d %H:%M:%S"),
"dfinish":datetime(2021,6,24,17,0).strftime("%Y-%m-%d %H:%M:%S")})
コメントで言及されているトレントンと同じです。