pg_duckdb 1.0.0

1 view
Skip to first unread message

Pavel Stehule

unread,
5:20 AM (11 hours ago) 5:20 AM
to PostgreSQL-cz
Ahoj

určitě extrémně zajímavá extenze pro všechny, kdo dělají analytiku


Pavel

Josef Šimánek

unread,
5:47 AM (10 hours ago) 5:47 AM
to postgr...@googlegroups.com
pá 5. 9. 2025 v 11:20 odesílatel Pavel Stehule <pavel....@gmail.com> napsal:
>
> Ahoj
>
> určitě extrémně zajímavá extenze pro všechny, kdo dělají analytiku

Jen doplním - není to čistě jen na analytiku, ale otevírá to dveře pro
modernější zpracování dat jako čtení dát přímo z cloudu/webu
(GCS/AWS/HTTP(S), ...), pro čtení modernějších datových formátů
(Parquet, AVRO, ...) a to vše velice efektivně s ohledem na dostupnou
paměť a z až neuvěřitelného pohodlí PostgreSQL.

pár příkladů

čtení CSV zvenku
SELECT DISTINCT csv['name'] FROM read_csv('s3://bucket/file.csv') csv;

zápis parquet ven (to už začíná být zajímavější, DuckDB pak může s
datama pokračovat v analytice s ohledem na to že parquet ukládá data -
velmi zjednodušeně - do sloupců...)
COPY (SELECT * FROM events WHERE event_date = '2024-01-01') TO
's3://bucket/events/' || strftime('2024-01-01'::timestamp, '%Y/%m/%d')
|| '/events.parquet';

a podobně

Kdyby to někoho zajímalo víc, rád někde rozvedu nebo pokecám.

> https://github.com/duckdb/pg_duckdb/releases/tag/v1.0.0
>
> Pavel
>
> --
> Tuto zprávu jste obdrželi, protože jste přihlášeni k odběru skupiny „PostgreSQL-cz“ ve Skupinách Google.
> Chcete-li zrušit odběr skupiny a přestat dostávat e‑maily ze skupiny, zašlete e-mail na adresu postgresql-c...@googlegroups.com.
> Tuto diskuzi najdete na adrese https://groups.google.com/d/msgid/postgresql-cz/CAFj8pRAj9z5PSft%2BbyNNViaoE0n3Hh8kfWoi1eHkU9T7A6ngqA%40mail.gmail.com.

Pavel Stehule

unread,
5:50 AM (10 hours ago) 5:50 AM
to postgr...@googlegroups.com


pá 5. 9. 2025 v 11:47 odesílatel Josef Šimánek <josef....@gmail.com> napsal:
pá 5. 9. 2025 v 11:20 odesílatel Pavel Stehule <pavel....@gmail.com> napsal:
>
> Ahoj
>
> určitě extrémně zajímavá extenze pro všechny, kdo dělají analytiku

Jen doplním - není to čistě jen na analytiku, ale otevírá to dveře pro
modernější zpracování dat jako čtení dát přímo z cloudu/webu
(GCS/AWS/HTTP(S), ...), pro čtení modernějších datových formátů
(Parquet, AVRO, ...) a to vše velice efektivně s ohledem na dostupnou
paměť a z až neuvěřitelného pohodlí PostgreSQL.

pár příkladů

čtení CSV zvenku
SELECT DISTINCT csv['name'] FROM read_csv('s3://bucket/file.csv') csv;

zápis parquet ven (to už začíná být zajímavější, DuckDB pak může s
datama pokračovat v analytice s ohledem na to že parquet ukládá data -
velmi zjednodušeně - do sloupců...)
COPY (SELECT * FROM events WHERE event_date = '2024-01-01') TO
's3://bucket/events/' || strftime('2024-01-01'::timestamp, '%Y/%m/%d')
|| '/events.parquet';

a podobně

Kdyby to někoho zajímalo víc, rád někde rozvedu nebo pokecám.

Guilcin stale hleda prednasejici na meetupy - na to bych vyrazil i do Prahy
 

> https://github.com/duckdb/pg_duckdb/releases/tag/v1.0.0
>
> Pavel
>
> --
> Tuto zprávu jste obdrželi, protože jste přihlášeni k odběru skupiny „PostgreSQL-cz“ ve Skupinách Google.
> Chcete-li zrušit odběr skupiny a přestat dostávat e‑maily ze skupiny, zašlete e-mail na adresu postgresql-c...@googlegroups.com.
> Tuto diskuzi najdete na adrese https://groups.google.com/d/msgid/postgresql-cz/CAFj8pRAj9z5PSft%2BbyNNViaoE0n3Hh8kfWoi1eHkU9T7A6ngqA%40mail.gmail.com.

--
Tuto zprávu jste obdrželi, protože jste přihlášeni k odběru skupiny PostgreSQL-cz ve Skupinách Google.
Chcete-li zrušit odběr skupiny a přestat dostávat e‑maily ze skupiny, zašlete e-mail na adresu postgresql-c...@googlegroups.com.
Reply all
Reply to author
Forward
0 new messages