killare uno script con tutti gli eventuali sottoprocessi

pozz

unread,

Aug 4, 2008, 3:52:57 AM8/4/08

to

Pensavo che il segnale SIGTERM generato dal comando kill raggiungesse
il processo principale e gli eventuali sotto-processi, ma a quanto
pare sembra di no.
---
user@ubuntu704desktop:~/temp$ cat prova.sh
#!/bin/bash
sleep 100
user@ubuntu704desktop:~/temp$ ./prova.sh &
[1] 9210
user@ubuntu704desktop:~/temp$ ps
PID TTY TIME CMD
9210 pts/2 00:00:00 prova.sh
9211 pts/2 00:00:00 sleep
9214 pts/2 00:00:00 ps
25597 pts/2 00:00:00 bash
user@ubuntu704desktop:~/temp$ kill 9210
user@ubuntu704desktop:~/temp$ ps
PID TTY TIME CMD
9211 pts/2 00:00:00 sleep
9219 pts/2 00:00:00 ps
25597 pts/2 00:00:00 bash
[1]+ Terminato ./prova.sh
---

Come si può vedere, se killo lo script prova.sh, il comando sleep (che
è un sotto-processo di prova.sh) non viene terminato. Posso vedere con
il comando pstree che prima del kill sleep è effettivamente un sotto-
processo di prova.sh, dopo il kill sleep diventa un sotto-processo di
init.

Come posso fare per killare uno script e gli eventuali comandi
lanciati nello script e ancora in fase di esecuzione?

Roberto Divia

unread,

Aug 4, 2008, 5:16:59 AM8/4/08

to pozz

pozz wrote:
> Come posso fare per killare uno script e gli eventuali comandi
> lanciati nello script e ancora in fase di esecuzione?

Due possibilita`:
1) usa un'utility in C con "kill( -pid, segnale )"(da provare)
2) usa "pstree -p" e poi digerisci l'output (da scrivere) trovando tutti i PIDs
da uccidere individualmente

Ciao,
--
Roberto Divia` Love at first sight is one of the greatest
Dep:PH Bat:53 Mailbox:C02110 labour-saving devices the world has ever seen
Route de Meyrin 385 ---------------------------------------------
Case Postale Phone: +41-22-767-4994
CH-1211 Geneve 23 CERN Fax: +41-22-767-9585
Switzerland E-Mail: Robert...@cern.ch

pozz

unread,

Aug 4, 2008, 5:36:26 AM8/4/08

to

On 4 Ago, 11:16, Roberto Divia <Roberto.Di...@cern.ch> wrote:
> > Come posso fare per killare uno script e gli eventuali comandi
> > lanciati nello script e ancora in fase di esecuzione?
> Due possibilita`:
> 1) usa un'utility in C con "kill( -pid, segnale )"(da provare)

In effetti il reference manual della libc a proposito della funzione
kill() dice:
---
The pid specifies the process or process group to receive the signal:
pid > 0
The process whose identifier is pid.
pid == 0
All processes in the same process group as the sender.
pid < -1
The process group whose identifier is -pid.
pid == -1
If the process is privileged, send the signal to all processes
except
for some special system processes. Otherwise, send the signal to
all processes with the same effective user ID.
---
Sinceramente non conoscevo il concetto di "process group", ma penso
sia un
insieme di processi accomunati da qualcosa. Forse i comandi eseguiti
da uno
script bash appartengono allo stesso "process group".
Proverò a scrivere un comando killg (kill group), ma possibile che
nessun altro
ci abbia già pensato e non esista già qualcosa di standard?

> 2) usa "pstree -p" e poi digerisci l'output (da scrivere) trovando tutti i PIDs
> da uccidere individualmente

In effetti ci avevo pensato... peccato che nella mia piccolissima
linux-box
(sono solo 8MB di Flash) non ho il comando pstree, ma solo uno scarso
ps.

Roberto Divia

unread,

Aug 4, 2008, 9:00:05 AM8/4/08

to pozz

pozz wrote:
> Sinceramente non conoscevo il concetto di "process group", ma penso
> sia un
> insieme di processi accomunati da qualcosa. Forse i comandi eseguiti
> da uno
> script bash appartengono allo stesso "process group".

Process group = il processo + tutti i suoi figli.

>> 2) usa "pstree -p" e poi digerisci l'output (da scrivere) trovando tutti i PIDs
>> da uccidere individualmente
>
> In effetti ci avevo pensato... peccato che nella mia piccolissima
> linux-box
> (sono solo 8MB di Flash) non ho il comando pstree, ma solo uno scarso
> ps.

Anche col ps si fa. Ci vuole un po' ma si fa. Guarda "ps --ppid", oppure un
"ps --no-header -eo'pid,ppid'" seguito da un parsing ricorsivo...

pozz

unread,

Aug 4, 2008, 9:22:19 AM8/4/08

to

On 4 Ago, 15:00, Roberto Divia <Roberto.Di...@cern.ch> wrote:
> Process group = il processo + tutti i suoi figli.

In effetti...
Cmq ho fatto il programmino C killpg che usa la kill() per inviare un
segnale
ad un determinato process group, semplicemente passando il PID del
parent
process con il segno meno.
Su una linux box "normale" funziona... sulla mia linux box embedded
non va,
la kill() mi ritorna l'errore ESRCH (non trova il pid). Eppure
passando il PID
positivo per terminare solo il parent process funziona.
La libc utilizzata è la stessa... chissà dov'è la differenza.

Forse la shell che è diversa?

> > In effetti ci avevo pensato... peccato che nella mia piccolissima
> > linux-box
> > (sono solo 8MB di Flash) non ho il comando pstree, ma solo uno scarso
> > ps.
> Anche col ps si fa. Ci vuole un po' ma si fa. Guarda "ps --ppid", oppure un
> "ps --no-header -eo'pid,ppid'" seguito da un parsing ricorsivo...

Eh sì, ma quando ti dicevo che è uno scarso ps, volevo dire che non
c'è l'opzione
--ppid, purtroppo :(

Roberto Divia

unread,

Aug 4, 2008, 9:47:28 AM8/4/08

to

pozz wrote:
> On 4 Ago, 15:00, Roberto Divia <Roberto.Di...@cern.ch> wrote:
>> Process group = il processo + tutti i suoi figli.
>
> In effetti...
> Cmq ho fatto il programmino C killpg che usa la kill() per inviare un
> segnale
> ad un determinato process group, semplicemente passando il PID del
> parent
> process con il segno meno.
> Su una linux box "normale" funziona... sulla mia linux box embedded
> non va,
> la kill() mi ritorna l'errore ESRCH (non trova il pid). Eppure
> passando il PID
> positivo per terminare solo il parent process funziona.
> La libc utilizzata è la stessa... chissà dov'è la differenza.
>
> Forse la shell che è diversa?

Probabilmente e` la kill ad essere diversa :-(

>>> In effetti ci avevo pensato... peccato che nella mia piccolissima
>>> linux-box
>>> (sono solo 8MB di Flash) non ho il comando pstree, ma solo uno scarso
>>> ps.
>> Anche col ps si fa. Ci vuole un po' ma si fa. Guarda "ps --ppid", oppure un
>> "ps --no-header -eo'pid,ppid'" seguito da un parsing ricorsivo...
>
> Eh sì, ma quando ti dicevo che è uno scarso ps, volevo dire che non
> c'è l'opzione
> --ppid, purtroppo :(

Prova con "ps -efl".

Hai killall? Ha un'opzione per il kill ricorsivo...

RedWiz

unread,

Aug 4, 2008, 10:40:36 AM8/4/08

to

>
> Probabilmente e` la kill ad essere diversa :-(

verrebbe da dire cosě, ma come puo' essere diversa la kill se la libc č
la stessa?

infatti: sicuro sia la stessa e non, chessň, la microClibc? (di solito
negli embedded c'č quella)

http://www.uclibc.org/about.html

pozz

unread,

Aug 4, 2008, 12:22:45 PM8/4/08

to

Roberto Divia ha scritto:

>> Forse la shell che è diversa?
> Probabilmente e` la kill ad essere diversa :-(

Ho due modalità di funzionamento nel mio sistema embedded.
Una è full-feature e si basa su un filesystem NFS che risiede su un
normale PC. Il kernel in esecuzione sul target (una piattaforma ARM)
viene caricato dalla rete al boot e il root filesystem è su NFS sempre
in rete.
In queste condizioni kill funziona come previsto.

Copiando la stessa libc e lo stesso comando kill nella memoria Flash del
mio sistema e facendolo partire in modalità standalone (kernel e root
filesystem in Flash), il comportamento del comando kill è diverso.
Mi dice che non c'è il processo normalmente elencato da ps.

>>>> In effetti ci avevo pensato... peccato che nella mia piccolissima
>>>> linux-box
>>>> (sono solo 8MB di Flash) non ho il comando pstree, ma solo uno scarso
>>>> ps.
>>> Anche col ps si fa. Ci vuole un po' ma si fa. Guarda "ps --ppid",
>>> oppure un
>>> "ps --no-header -eo'pid,ppid'" seguito da un parsing ricorsivo...
>> Eh sì, ma quando ti dicevo che è uno scarso ps, volevo dire che non
>> c'è l'opzione
>> --ppid, purtroppo :(
> Prova con "ps -efl".

Nada, non accetta praticamente alcuna opzione.

> Hai killall? Ha un'opzione per il kill ricorsivo...

Proverò e ti farò sapere...

pozz

unread,

Aug 4, 2008, 12:27:25 PM8/4/08

to

RedWiz ha scritto:

>> Probabilmente e` la kill ad essere diversa :-(

> verrebbe da dire così, ma come puo' essere diversa la kill se la libc è
> la stessa?

Potrebbe essere il comando kill che non parsa correttamente i PID
negativi, cioè quelli relativi ai process group. Ma in realtà la kill è
la stessa, come dicevo nell'altro post.

> infatti: sicuro sia la stessa e non, chessò, la microClibc? (di solito
> negli embedded c'è quella)

Ho copiato il file libc-2.3.5.so dal sistema di sviluppo NFS (vedi altro
post) al mio target.

E si comporta in modo differente anche il mio programma killpg che
richiama semplicemente la kill() della libc passando come PID in un
numero negativo. Lavorando con il sistema NFS funziona correttamente,
lavorando direttamente sul target in modalità stand-alone mi dà errore
di processo inesistente.

I due sistemi hanno molte differenze tra di loro, quello in NFS è molto
accessoriato. Però si basano sullo stesso kernel e sulle stesse libc...

Come sarà implementata la kill() nella libc? Dove potrei andare a
guardare per capire che succede?

Magari è la shell differente (bash nel sistema NFS e msh nel sistema
standalone) che crea processi in modi differenti e che non riescono ad
essere visti dalla kill().

RedWiz

unread,

Aug 4, 2008, 4:59:18 PM8/4/08

to

> Come sarà implementata la kill() nella libc? Dove potrei andare a
> guardare per capire che succede?

eh io partirei da li
e vedere cosa fa kill() quando gli dai un pid negativo per ricavarsi
l'albero dei pid , perchè magari lui tenta semplicemente di killare un
pid negativo, da cui l'errore.

> Magari è la shell differente (bash nel sistema NFS e msh nel sistema
> standalone) che crea processi in modi differenti e che non riescono ad
> essere visti dalla kill().

potrebbe essere, mai usata msh

Clyde.bis

unread,

Aug 4, 2008, 6:52:09 PM8/4/08

to

pozz ha scritto:

> Come posso fare per killare uno script e gli eventuali comandi lanciati
> nello script e ancora in fase di esecuzione?

Se usi bash, puoi provare con il comando trap:

#!/bin/bash

trap "cleaner" EXIT

cleaner() {
for proc in $(jobs -p); do
kill -15 $proc;
done
}

sleep 1000 &
sleep 1500 &
sleep 2000 &

wait

--
no signature yet

pozz

unread,

Aug 5, 2008, 2:55:07 AM8/5/08

to

On 4 Ago, 22:59, RedWiz <red...@inwind.it> wrote:
> > Magari è la shell differente (bash nel sistema NFS e msh nel sistema
> > standalone) che crea processi in modi differenti e che non riescono ad
> > essere visti dalla kill().
> potrebbe essere, mai usata msh

E sembra essere proprio così. La msh è una shell minimale riscritta in
busybox (busybox.net) che non crea i process group. Da quello che ho
capito, rimane una gerarchia dei processi (infatti riesco comunque a
vedere
il parent PID di ogni processo) ma non viene creato il process group
relativo agli script e ai comandi eseguiti all'interno.

Questo vuol dire che l'unico modo per killare il processo padre e
tutti i
processi figli è cercare tra _tutti_ i processi quelli con il parent
PID uguale
al processo padre.

Oppure l'altra soluzione è usare la bash che mi occupa un bel po' di
spazio.

RedWiz

unread,

Aug 5, 2008, 3:19:08 AM8/5/08

to

>> potrebbe essere, mai usata msh
>

> E sembra essere proprio cosě. La msh č una shell minimale riscritta in

> busybox (busybox.net) che non crea i process group. Da quello che ho
> capito, rimane una gerarchia dei processi (infatti riesco comunque a
> vedere

ah ecco (l'avevo pure usata allora, ma ai in questo senso)

> Oppure l'altra soluzione č usare la bash che mi occupa un bel po' di

ma esattamente cosa devi fare?
perchč al limite fai tutto in c ed i pid dell'albero te li
tieni in un vettore (globale) che puoi svuotare in un signal handler

forse un po' tortuoso ma dovrebbe andare:

insomma per ogni comando che vuoi dare:

int pid_table[MAXCHILD]
main()
{
signal(SIGTERM, Handler);
signal(SIGINT, Handler);

pid=fork()
if(!pid)
execl(blabla)
else
appenti pid alla pid_table

ciclo di wait sui pid:
se morto elimina dalla pid_table
}

void Handler()
{
for i in pid_table
kill(i)
}

ovviamente ho scritto tutto in una pseudo_amorfo codifica :)
ma il succo si dovrebbe capire

un robo del genere in python verrebbe di certo molto piu' semplice, ma di
sicuro il python non ce l'hai

Roberto Divia

unread,

Aug 5, 2008, 3:38:35 AM8/5/08

to

pozz wrote:
> Questo vuol dire che l'unico modo per killare il processo padre e
> tutti i
> processi figli è cercare tra _tutti_ i processi quelli con il parent
> PID uguale
> al processo padre.

Hai il /proc ? Se si, un grep in tutti i proc/<ppid>/status per il 'PPid:' del
padre dovrebbe risolvere il tuo problema...

pozz

unread,

Aug 5, 2008, 5:36:50 AM8/5/08

to

On 5 Ago, 09:38, Roberto Divia <Roberto.Di...@cern.ch> wrote:
> pozz wrote:
> > Questo vuol dire che l'unico modo per killare il processo padre e
> > tutti i
> > processi figli è cercare tra _tutti_ i processi quelli con il parent
> > PID uguale
> > al processo padre.
> Hai il /proc ? Se si, un grep in tutti i proc/<ppid>/status per il 'PPid:' del
> padre dovrebbe risolvere il tuo problema...

Infatti ho creato uno script semplice che tramite il comando ps mi
tira
fuori tutti i PID dei processi e tramite il grep mi tira fuori solo i
PID che
hanno un certo PPid.
E' un po' lentino, ma lo devo fare solo qualche volta.

Però questa msh è proprio minimale. Ho un altro problema che credo
sia sempre legato a questa shell.

Ho due script:
---
root:/tmpfs/tmp> cat example.sh
#!/bin/sh
while true; do
read X
./flash.sh &
FLASHPID=$!
sleep 5
kill $FLASHPID
done
---
root:/tmpfs/tmp> cat flash.sh
#!/bin/sh
while true; do
echo "ON"
sleep 1
echo "OFF"
sleep 1
done
---

In pratica il primo script, sempre in esecuzione, aspetta un evento
(in questo caso, l'input da tastiera) e successivamente mette in
esecuzione
un altro processo (flash.sh).
Quindi example.sh inizia a fare certi compiti che durano un po' (in
questo
caso una semplice sleep) e dopo killa flash.sh per rimettersi in
attesa
dell'evento.

La prima volta tutto funziona e example.sh si rimette in attesa
dell'evento.
Appena premo di nuovo RET, lo script principale example.sh termina
brutalmente (mi compare killed) non appena cerca di eseguire
nuovamente
flash.sh.

Mi sa che la distribuzione dei segnali con msh è alquanto scarsa.

RedWiz

unread,

Aug 5, 2008, 5:54:33 AM8/5/08

to

> La prima volta tutto funziona e example.sh si rimette in attesa
> dell'evento.
> Appena premo di nuovo RET, lo script principale example.sh termina
> brutalmente (mi compare killed) non appena cerca di eseguire
> nuovamente
> flash.sh.
>
> Mi sa che la distribuzione dei segnali con msh è alquanto scarsa.

mmmmm....
non è che quel killed si riferisce al'ultimo flash che avevi ucciso?
che (ipotesi) tornando dal background uccide il padre perchè la shell è
scarsa nel gestire questo tipo di cose?

ed esempio, prova a mettere una sleep 2 dopo il kill e vedi se comunque ti
fa arrivare alla read o muore

pozz

unread,

Aug 5, 2008, 6:45:44 AM8/5/08

to

On 5 Ago, 09:38, Roberto Divia <Roberto.Di...@cern.ch> wrote:

> Hai il /proc ? Se si, un grep in tutti i proc/<ppid>/status per il 'PPid:' del
> padre dovrebbe risolvere il tuo problema...

Cavolo, non ci riesco ancora!

Con un po' di sforzo sono riuscito a ritargliarmi lo spazio per una
bash completa.
Ora l'esempio semplice funziona:
---
sh-3.00# cat prova.sh
#!/bin/bash
sleep 100
sh-3.00# ./prova.sh &
[1] 2545
sh-3.00# /bin/kill -s TERM -2545
sh-3.00#
[1]+ Terminated ./prova.sh
sh-3.00#
--
Notare che ho usato il comando kill esterno alla shell perchè quello
builtin
non supporta i PID negativi per i process group.

La mia applicazione finale, però, sarà formata da due script: il primo
esegue o killa il secondo a seconda del parametro start/stop (ebbene
sì,
è uno script di /etc/init.d).
In questo caso non funziona:
---
sh-3.00# cat startstop.sh
#!/bin/bash
case "$1" in
start)
echo "Starting prova.sh..."
./prova.sh &
;;
stop)
echo "Stopping prova.sh..."
PID=`pidof -o $$ prova.sh`
if [ ! -z $PID ]; then
/bin/kill -s TERM -$PID
fi
;;
esac
sh-3.00# ./startstop.sh start
Starting prova.sh...
sh-3.00# ./startstop.sh stop
Stopping prova.sh...
kill -2575: No such process
---

Evidentemente il process group viene creato dalla bash al lancio del
primo
script startbutton.sh che rappresenta anche il process group leader.
Tutti i
comandi lanciati da startbutton.sh appartengono allo stesso process
group.
Però startbutton.sh termina il suo lavoro e, probabilmente, cancella
anche
il processo group che aveva creato, lasciando il processo prova.sh (ed
anche
il comando sleep lanciato da questi) privo di process group.

Non so che altro pensare.

Riprendo una tua precedente affermazione:

> Process group = il processo + tutti i suoi figli.

Da quello che ho capito, non è detto. Un process group è un gruppo
eterogeneo
di processi che hanno in comune lo stesso identificativo di gruppo,
nient'altro.
Con opportune funzioni come setpgid() è possibile assegnare un
processo qualsiasi
(con alcune restrizioni) ad un gruppo, anche se questi non è un figlio
del leader
del gruppo (ecco perchè, forse, parlano nella documentazione di group
leader e
non semplicemente di parent process).

In genere la shell, almeno la bash, assegna lo stesso identificativo
di gruppo
ai comandi lanciati da uno script. Ma se muore il group leader che
succede?

ilSimo

unread,

Aug 5, 2008, 7:11:36 AM8/5/08

to

It was 08:55, martedì 5 agosto 2008, and pozz, in message

<178ecd0f-680f-403b...@m3g2000hsc.googlegroups.com> wrote:
>
> Oppure l'altra soluzione è usare la bash che mi occupa un bel po' di
> spazio.

non esiste mica solo bash...
ci sono anche tcsh, zsh, ash...

ilSimo
--
now playing:

Le barche mi danno il voltastomaco.
Piu' delle barche odio soltanto gli elfi.

-- Gotrek Gurnisson
da "Sangue di Skaven"

pozz

unread,

Aug 5, 2008, 9:36:04 AM8/5/08

to

On 5 Ago, 12:45, pozz <pozzu...@libero.it> wrote:
> Cavolo, non ci riesco ancora!

Ho capito l'arcano!

Quando eseguo lo script "startstop.sh start", viene creato un processo
con
un proprio PID, diciamo 100. Viene creato anche un process group in
cui
lo script startstop.sh è il leader, quindi l'identificativo del gruppo
(PGID) è
pari al PID del leader, nel nostro esempio 100.

startstop.sh crea un processo figlio, prova.sh, che ha un altro PID,
diciamo 101.
Questo processo figlio viene assegnato al gruppo PGID=100.

A questo punto, startstop.sh finisce il suo lavoro visto che prova.sh
è stato
lanciato in background e quindi termina. Non esiste più il processo
con PID=100
ma rimane un processo (prova.sh) con PGID=100.

prova.sh lancia "sleep 100" che, a sua volta, avrà PID=102 (esempio) e
PGID=100.

Quindi il comando ps mostrerà
prova.sh con PID=101 e PGID=100
sleep 100 con PID=102 e PGID=100
Per terminare il process group bisogna usare
/bin/kill -s TERM -100
e non
/bin/kill -s TERM -101
come facevo prima.

Il problema è ora capire qual è il PGID che è il PID del primo
startstop.sh che
ormai non c'è più. Con il comando ps full-features è semplice (ps -o
pgid),
nel mio caso dovrei guardare a /proc, ma non so dove.è l'informazione.

enoquick

unread,

Aug 5, 2008, 10:50:18 PM8/5/08

to

RedWiz ha scritto:

>> Come sarà implementata la kill() nella libc? Dove potrei andare a
>> guardare per capire che succede?

kill è una chiamata di sistema.
Quindi desumo che in libc la funzione kill ingloba uno strato
assembler per effettuare la syscall
http://linux.die.net/man/2/syscalls

>
> eh io partirei da li
> e vedere cosa fa kill() quando gli dai un pid negativo per ricavarsi
> l'albero dei pid , perchè magari lui tenta semplicemente di killare un
> pid negativo, da cui l'errore.

E' un punto di partenza, se non è li probabilmente occorrerà leggersi i
sorgenti del kernel

>
>> Magari è la shell differente (bash nel sistema NFS e msh nel sistema
>> standalone) che crea processi in modi differenti e che non riescono ad
>> essere visti dalla kill().

I segnali possono essere trappati ad eccezione del SIGKILL (kill per
default invia un SIGTERM)
Inoltre quando un processo è in kernel mode probabilmente neanche la
SIGKILL ha effetto

Roberto Divia

unread,

Aug 7, 2008, 5:50:53 AM8/7/08

to

pozz wrote:
> Il problema č ora capire qual č il PGID che č il PID del primo
> startstop.sh che
> ormai non c'č piů.

Fai fare un wait al primo processo (startstop.sh) anziche` farlo uscire...

pozz

unread,

Aug 7, 2008, 6:56:44 PM8/7/08

to

Roberto Divia ha scritto:
> pozz wrote:
>> Il problema è ora capire qual è il PGID che è il PID del primo
>> startstop.sh che
>> ormai non c'è più.

>
> Fai fare un wait al primo processo (startstop.sh) anziche` farlo uscire...

In realtà poi ho risolto andando in /proc/<pid>/stat e leggendo il
quinto numero. Rappresenta proprio il PGID.

Poi mi sono ripreso un po' di spazio cancellando la bash (roba troppo
pesante per il mio sistema) e mettendo su la ash che gestisce
correttamente i process group.

Tra l'altro ho scoperto che una variante della ash (la dash, Debian ash)
viene ampiamente usata in Ubuntu dove /bin/sh è un link simbolico
proprio a /bin/dash in modo da eseguire gli script in modo più rapido,
visto che la (d)ash è molto più snella della bash.
Questo mi fa sperare che la ash sia molto simile alla bash, anche se
alcuni script scritti per bash potrebbero incaxxarsi con la ash.