prepis dádových suborov pgsql

10 views
Skip to first unread message

Michal Páleník

unread,
Jun 16, 2024, 3:16:09 PMJun 16
to postgr...@googlegroups.com
ahojte, počas updgradu na novšiu verziu pgsql 15->16 som urobil úplne
školácku chybu a (asi) som na chvíľu zapol PG16 na adresári kde má dáta
PG15 (a asi tam PG16 čosí prepísal). a teraz sa to PG15 nepáči..
(a možno som urobil niečo úplne iné, ale toto mi príde
najpravdepodobnejšie)

PG15 sa naštartuje, ale po cca 20 sekundách sa reštartne
server process (PID 1828570) was terminated by signal 11: Chyba segmentácie
invalid record length at 954/8C0A3778: wanted 24, got 0

a podobné chyby.

počas toho ako funguje, tak príkazy typu \d+ a pár selectov ide
normálne.

ale potom sa reštartne (bez ohľadu na to, či dávam príkazy alebo nie)

do DB teraz nikto nezapisuje, miesta na disku je dosť, CPU voľné, ...

čo môžem skúsiť povypínať, aby databáza ako tak bežala a zvládol som
pg_dumpall?


vďaka za tipy

Michal


--
Michal Páleník
www.oma.sk

Pavel Stehule

unread,
Jun 16, 2024, 3:28:20 PMJun 16
to postgr...@googlegroups.com
Ahoj

ne 16. 6. 2024 v 21:16 odesílatel Michal Páleník <michal....@freemap.sk> napsal:
ahojte, počas updgradu na novšiu verziu pgsql 15->16 som urobil úplne
školácku chybu a (asi) som na chvíľu zapol PG16 na adresári kde má dáta
PG15 (a asi tam PG16 čosí prepísal). a teraz sa to PG15 nepáči..
(a možno som urobil niečo úplne iné, ale toto mi príde
najpravdepodobnejšie)

PG15 sa naštartuje, ale po cca 20 sekundách sa reštartne
server process (PID 1828570) was terminated by signal 11: Chyba segmentácie
invalid record length at 954/8C0A3778: wanted 24, got 0

a podobné chyby.

počas toho ako funguje, tak príkazy typu \d+ a pár selectov ide
normálne.

ale potom sa reštartne (bez ohľadu na to, či dávam príkazy alebo nie)

 V podstate jedine, co se startuje automaticky, je autovacuum - takze bych zacal tim, ze bych vypnul autovacuum.

Pripadne bych se podival, jestli mi tam cron nestartuje nejake skripty.

Postgres po havarii dela recovery, ale asi za to se dostavate.

Nic jineho by se tam automaticky startovat nemelo. Mozna bys mohl zkusit nastartovat do single modu

Pak by se ti mohl alespon podarit export dat do csv, pripadne reindex.




do DB teraz nikto nezapisuje, miesta na disku je dosť, CPU voľné, ...

 

čo môžem skúsiť povypínať, aby databáza ako tak bežala a zvládol som
pg_dumpall?

tam mohlo dojit ke zmene formatu tabulky, indexu, PB vi. Zkusil bych v single modu reindexaci - alespon zjistis na cem ti to spadne, a pak pokud to bude mozne, tak poskozene tabulky promazat

 


vďaka za tipy

Michal


--
Michal Páleník
www.oma.sk

--
Tuto zprávu jste obdrželi, protože jste přihlášeni k odběru skupiny PostgreSQL-cz ve Skupinách Google.
Chcete-li zrušit odběr skupiny a přestat dostávat e‑maily ze skupiny, zašlete e-mail na adresu postgresql-c...@googlegroups.com.
Chcete-li zobrazit tuto diskusi na webu, navštivte https://groups.google.com/d/msgid/postgresql-cz/Zm85871ryKx2DUM_%40tanicka.iz.sk.

Tomas Vondra

unread,
Jun 16, 2024, 5:50:26 PMJun 16
to postgr...@googlegroups.com, Pavel Stehule


On 6/16/24 21:27, Pavel Stehule wrote:
> Ahoj
>
> ne 16. 6. 2024 v 21:16 odesílatel Michal Páleník
> <michal....@freemap.sk <mailto:michal....@freemap.sk>> napsal:
>
> ahojte, počas updgradu na novšiu verziu pgsql 15->16 som urobil úplne
> školácku chybu a (asi) som na chvíľu zapol PG16 na adresári kde má dáta
> PG15 (a asi tam PG16 čosí prepísal). a teraz sa to PG15 nepáči..
> (a možno som urobil niečo úplne iné, ale toto mi príde
> najpravdepodobnejšie)
>

To nezní pravděpodobně, protože postgres si kontroluje jestli startuje
na datovém adresáři stejné verze, a pokud ne tak se vypne a v žádném
případě nic nepřepisuje. Tudíž i pokud jste během upgradu nastartoval
PG16 na adresáři PG15, tak tenhle následek by to mít nemělo.

Nejlepší by bylo zkusit popsat co jste vlastně udělal, co vlastně
myslíte "upgradem" (jenom balíčky v distribuci, OS, pg_upgrade, něco
jiného?). Takhle akorát spekulujeme, a např. moje fantazie je bujná.


> PG15 sa naštartuje, ale po cca 20 sekundách sa reštartne
> server process (PID 1828570) was terminated by signal 11: Chyba
> segmentácie
> invalid record length at 954/8C0A3778: wanted 24, got 0
>

Zapněte se generování core souborů, vytáhněte z toho backtrace [1], a
uvidíte na čem konkrétně to padá s tím segfaultem. V logu postgresu
nejspíše bude i podrobnější info které konkrétně identifikuje který
proces vlastně padá.

https://wiki.postgresql.org/wiki/Getting_a_stack_trace_of_a_running_PostgreSQL_backend_on_Linux/BSD


> a podobné chyby.
>
> počas toho ako funguje, tak príkazy typu \d+ a pár selectov ide
> normálne.
>
> ale potom sa reštartne (bez ohľadu na to, či dávam príkazy alebo nie)
>
>
>  V podstate jedine, co se startuje automaticky, je autovacuum - takze
> bych zacal tim, ze bych vypnul autovacuum.
>
> Pripadne bych se podival, jestli mi tam cron nestartuje nejake skripty.
>
> Postgres po havarii dela recovery, ale asi za to se dostavate.
>
> Nic jineho by se tam automaticky startovat nemelo. Mozna bys mohl zkusit
> nastartovat do single modu
>
> Pak by se ti mohl alespon podarit export dat do csv, pripadne reindex.
>
>
>
>
> do DB teraz nikto nezapisuje, miesta na disku je dosť, CPU voľné, ...
>
>
>
> čo môžem skúsiť povypínať, aby databáza ako tak bežala a zvládol som
> pg_dumpall?
>
>
> tam mohlo dojit ke zmene formatu tabulky, indexu, PB vi. Zkusil bych v
> single modu reindexaci - alespon zjistis na cem ti to spadne, a pak
> pokud to bude mozne, tak poskozene tabulky promazat
>

Nechápu jak by k čemukoliv z toho mohlo dojít prostým startem novějšího
postgresu. To se pustí, zjistí že catversion neodpovídá, a umře aniž by
to cokoliv měnilo.

Můj random tip je spíš že "upgrade" zahrnoval např. upgrade glibc,
včetně locales, a někde se něco změnilo tak že to rozbilo index.

T.

Pavel Stehule

unread,
Jun 16, 2024, 11:30:27 PMJun 16
to Tomas Vondra, postgr...@googlegroups.com


ne 16. 6. 2024 v 23:50 odesílatel Tomas Vondra <tv.f...@gmail.com> napsal:


On 6/16/24 21:27, Pavel Stehule wrote:
> Ahoj
>
> ne 16. 6. 2024 v 21:16 odesílatel Michal Páleník
> <michal....@freemap.sk <mailto:michal....@freemap.sk>> napsal:
>
>     ahojte, počas updgradu na novšiu verziu pgsql 15->16 som urobil úplne
>     školácku chybu a (asi) som na chvíľu zapol PG16 na adresári kde má dáta
>     PG15 (a asi tam PG16 čosí prepísal). a teraz sa to PG15 nepáči..
>     (a možno som urobil niečo úplne iné, ale toto mi príde
>     najpravdepodobnejšie)
>

To nezní pravděpodobně, protože postgres si kontroluje jestli startuje
na datovém adresáři stejné verze, a pokud ne tak se vypne a v žádném
případě nic nepřepisuje. Tudíž i pokud jste během upgradu nastartoval
PG16 na adresáři PG15, tak tenhle následek by to mít nemělo.

pokud se provede upgrade pomoci pg_upgrade a linkovani souboru, tak si myslim, ze k tomu dojit muze

Michal Páleník

unread,
Jun 17, 2024, 3:10:23 AMJun 17
to postgr...@googlegroups.com
On Sun, Jun 16, 2024 at 11:50:21PM +0200, Tomas Vondra wrote:
>
>
> On 6/16/24 21:27, Pavel Stehule wrote:
> > Ahoj
> >
> > ne 16. 6. 2024 v 21:16 odesílatel Michal Páleník
> > <michal....@freemap.sk <mailto:michal....@freemap.sk>> napsal:
> >
> > ahojte, počas updgradu na novšiu verziu pgsql 15->16 som urobil úplne
> > školácku chybu a (asi) som na chvíľu zapol PG16 na adresári kde má dáta
> > PG15 (a asi tam PG16 čosí prepísal). a teraz sa to PG15 nepáči..
> > (a možno som urobil niečo úplne iné, ale toto mi príde
> > najpravdepodobnejšie)
> >
>
> To nezní pravděpodobně, protože postgres si kontroluje jestli startuje na
> datovém adresáři stejné verze, a pokud ne tak se vypne a v žádném případě
> nic nepřepisuje. Tudíž i pokud jste během upgradu nastartoval PG16 na
> adresáři PG15, tak tenhle následek by to mít nemělo.
>
> Nejlepší by bylo zkusit popsat co jste vlastně udělal, co vlastně myslíte
> "upgradem" (jenom balíčky v distribuci, OS, pg_upgrade, něco jiného?).
> Takhle akorát spekulujeme, a např. moje fantazie je bujná.

upgrade bol len inštalácia PG16 z debian balíčkov.
manuálne som robil update konfigurácie
v /etc/postgresql/*/main (pg_hba, a conf.d), kde
som skopíroval staré, neprepísal data_directory/port a reštartol PG16

potom som robil pg_dumpall --clean | psql -p 5433
(_možno_ v čase keď bola na PG16 ešte konfigurácia PG15)

potom som prepísal conf na správnu data_directory a port.


(debian testing, všetko balíčky z distribúcie, postgis; je to
analyticko-reportingový server, takže keď deň nebeží, nič sa nedeje)
v --single móde bežalo v poriadku, aj reindex zopár tabuliek.
zmena na autovacuum=off nepomohla

čo pomohlo:

zmena listen_addresses iba na 'localhost', teraz pg_dump funguje
(keď nechám 'localhost,10.9.0.10' tak blbne, tá 10.9.0.10 je openvpn
adresa)


vďaka za nakopnutie

problém (asi, snáď) vyriešený
pošlem nejaké logy/dumpy pre potreby historického výskumu?
> --
> Tuto zprávu jste obdrželi, protože jste přihlášeni k odběru skupiny PostgreSQL-cz ve Skupinách Google.
> Chcete-li zrušit odběr skupiny a přestat dostávat e‑maily ze skupiny, zašlete e-mail na adresu postgresql-c...@googlegroups.com.
> Chcete-li zobrazit tuto diskusi na webu, navštivte https://groups.google.com/d/msgid/postgresql-cz/29bed08e-3492-4709-b573-7337ffab6732%40gmail.com.
>

--
Michal Páleník
www.oma.sk

Pavel Stehule

unread,
Jun 17, 2024, 5:30:59 AMJun 17
to postgr...@googlegroups.com


po 17. 6. 2024 v 9:10 odesílatel Michal Páleník <michal....@freemap.sk> napsal:
On Sun, Jun 16, 2024 at 11:50:21PM +0200, Tomas Vondra wrote:
>
>
> On 6/16/24 21:27, Pavel Stehule wrote:
> > Ahoj
> >
> > ne 16. 6. 2024 v 21:16 odesílatel Michal Páleník
> > <michal....@freemap.sk <mailto:michal....@freemap.sk>> napsal:
> >
> >     ahojte, počas updgradu na novšiu verziu pgsql 15->16 som urobil úplne
> >     školácku chybu a (asi) som na chvíľu zapol PG16 na adresári kde má dáta
> >     PG15 (a asi tam PG16 čosí prepísal). a teraz sa to PG15 nepáči..
> >     (a možno som urobil niečo úplne iné, ale toto mi príde
> >     najpravdepodobnejšie)
> >
>
> To nezní pravděpodobně, protože postgres si kontroluje jestli startuje na
> datovém adresáři stejné verze, a pokud ne tak se vypne a v žádném případě
> nic nepřepisuje. Tudíž i pokud jste během upgradu nastartoval PG16 na
> adresáři PG15, tak tenhle následek by to mít nemělo.
>
> Nejlepší by bylo zkusit popsat co jste vlastně udělal, co vlastně myslíte
> "upgradem" (jenom balíčky v distribuci, OS, pg_upgrade, něco jiného?).
> Takhle akorát spekulujeme, a např. moje fantazie je bujná.

upgrade bol len inštalácia PG16 z debian balíčkov.
manuálne som robil update konfigurácie
v /etc/postgresql/*/main (pg_hba, a conf.d), kde
som skopíroval staré, neprepísal data_directory/port a reštartol PG16

potom som robil pg_dumpall --clean | psql -p 5433
(_možno_ v čase keď bola na PG16 ešte konfigurácia PG15)

tak pokud se delal upgrade pg_dumpall, tak nastartovanim 16 by se skutecne nic stat nemelo. To vypada spis jako nejaka falesna stopa.

 

potom som prepísal conf na správnu data_directory a port.


(debian testing, všetko balíčky z distribúcie, postgis; je to
analyticko-reportingový server, takže keď deň nebeží, nič sa nedeje)
v --single móde bežalo v poriadku, aj reindex zopár tabuliek.
zmena na autovacuum=off nepomohla

čo pomohlo:

zmena listen_addresses iba na 'localhost', teraz pg_dump funguje
(keď nechám 'localhost,10.9.0.10' tak blbne, tá 10.9.0.10 je openvpn
adresa)


vďaka za nakopnutie

problém (asi, snáď) vyriešený
pošlem nejaké logy/dumpy pre potreby historického výskumu?

v tomhle pripade by byl zajimavy stacktrace z toho padu. Nicmene je mozne, ze v te vasi konfiguraci je neco, co sunda 16ku. Nehrajete si nahodou s PostGISem? Nemuze to mit souvislost s nim?

 
Chcete-li zobrazit tuto diskusi na webu, navštivte https://groups.google.com/d/msgid/postgresql-cz/Zm_hOKdDzZKRHgBW%40tanicka.iz.sk.
Reply all
Reply to author
Forward
0 new messages