OT - separare voci e musica

255 views
Skip to first unread message

albertof

unread,
Aug 27, 2011, 4:48:09 PM8/27/11
to maclover...@googlegroups.com
Questa sera si discuteva con amici sulla possibilità di ottenere da
un file audio (diciamo mp3) file diversi ciascuno con una parte del
file audio originario.
Facio un esempio perchè non me ne intendo assolutamente. Il casus
belli era un file di un coro e l'obiettivo era trovare un sw che
consentise di ottenere un file con i "bassi" (intendo le voci dei
bassi) un file con i tenori, uno con i soprani et similia.
Obiettivo per ragini di studio e non altro, ma mi pareva una pretesa
alta con sw non professionali (e quindi costosi sia come sw che come
hw specifico da usare) ammesso che ci sia un sw adeguato allo scopo
(forse siamo un po' fuorviati dai telefilm americani.....)
Che ne dite? Esiste qualcosa del genere? Mi piacerebbe capire se si
parlava a vuoto o meno.
Grazie
Alberto
--
Alberto Ferrari
e-mail: albert...@iol.it

Franco

unread,
Aug 28, 2011, 7:30:19 AM8/28/11
to maclover...@googlegroups.com
Per quella che è stata la mia esperienza professionale, ciò è impossibile.
Solo in una fase i premix, ovvero quando la registrazione viene fatta su un multitraccia o colonne separate - parlando di cinema, quindi di perforato audio -, lì vengono impostate le separazioni; musica (diverse colonne) effetti (sincroni, fondi, speciali - ed anch'essi suddivise in più colonne) e parlato, o doppiato.
Da qui si ottiene un  premix e da qui il mix finale; stereo o multicanale.

Bene tornare "all'origine" è impossibile.

--
Ciao
Frank 
R: Perché inverte l'ordine in cui la gente legge un testo.
D: Perché la risposta in alto è così fastidiosa?
R: La risposta in alto.
D: Qual è la cosa più fastidiosa nelle email?

albertof

unread,
Aug 29, 2011, 6:40:19 AM8/29/11
to maclover...@googlegroups.com

Caro Frank,
avevo pensato proprio quello che dici per logica e per la poca
conoscenza di "fisica" che posso avere. La tua esperienza mi dà la
conferma finale e cioè che in genere non si può fare, mentre se il
file è ancora leggibile come multitraccia allora -oserei dire- è un
gioco da ragazzi avendo il sw che gestisce le tracce (sempre che ti
sia consentito vederle queste tracce) e naturalmente vedi le tracce
che ci sono: se alcune tracce sono già state mixate, .... buonanotte!
Resta solo la curiosità se esiste la possibilità -come si vede nei
vari telefilm polizieschi- di separare i suoni ed estrarre in modo
selettivo alcune voci o altro. A mio modo di vedere si può fare solo
lavorando sulle frequenze, ma questo non significherebbe un granchè
se volessi distinguere il parlato di tizio da quello di caio.
Grazie e a presto

Franco

unread,
Aug 29, 2011, 7:42:03 AM8/29/11
to maclover...@googlegroups.com

Il giorno 29/ago/2011, alle ore 12:40, albertof ha scritto:

Caro Frank,
avevo pensato proprio quello che dici per logica e per la poca conoscenza di "fisica" che posso avere. La tua esperienza mi dà la conferma finale e cioè che in genere non si può fare, mentre se il file è ancora leggibile come multitraccia allora -oserei dire- è un gioco da ragazzi avendo il sw che gestisce le tracce (sempre che ti sia consentito vederle queste tracce) e naturalmente vedi le tracce che ci sono: se alcune tracce sono già state mixate, .... buonanotte!
Resta solo la curiosità se esiste la possibilità -come si vede nei vari telefilm polizieschi- di separare i suoni ed estrarre in modo selettivo alcune voci o altro. A mio modo di vedere si può fare solo lavorando sulle frequenze, ma questo non significherebbe un granchè se volessi distinguere il parlato di tizio da quello di caio.
Grazie e a presto
Alberto
--

Diciamo che la fanno
 molto facile.
Sì, ma con molti limiti e moltissimi filtri ed una pazienza certosina.
Il risultato, comunque, non è come mostrato nei film perché anche la voce, o parlato, ne risente.

Ad esempio, se in un parlato c'è la eco; ecco, questo non si può togliere.
Sia la eco vera che quella artificiale.

albertof

unread,
Aug 29, 2011, 1:27:59 PM8/29/11
to maclover...@googlegroups.com
At 13:42 +0200 29-08-2011, Franco wrote:
Il giorno 29/ago/2011, alle ore 12:40, albertof ha scritto:

Caro Frank,
avevo pensato proprio quello che dici per logica e per la poca conoscenza di "fisica" che posso avere. La tua esperienza mi dà la conferma finale e cioè che in genere non si può fare, mentre se il file è ancora leggibile come multitraccia allora -oserei dire- è un gioco da ragazzi avendo il sw che gestisce le tracce (sempre che ti sia consentito vederle queste tracce) e naturalmente vedi le tracce che ci sono: se alcune tracce sono già state mixate, .... buonanotte!
Resta solo la curiosità se esiste la possibilità -come si vede nei vari telefilm polizieschi- di separare i suoni ed estrarre in modo selettivo alcune voci o altro. A mio modo di vedere si può fare solo lavorando sulle frequenze, ma questo non significherebbe un granchè se volessi distinguere il parlato di tizio da quello di caio.
Grazie e a presto
Alberto
--

Diciamo che la fanno
 molto facile.
Sì, ma con molti limiti e moltissimi filtri ed una pazienza certosina.
Il risultato, comunque, non è come mostrato nei film perché anche la voce, o parlato, ne risente.

Ad esempio, se in un parlato c'è la eco; ecco, questo non si può togliere.
Sia la eco vera che quella artificiale.

Capisco che c'è dietro "un mondo" e a questo punto - non potendo sapere e capire tutto nella vita :-) - mi ritiro appagato di quello che ho capito.
Grazie
Ciao
Alberto




--•
Ciao
Frank •
R: Perché inverte l'ordine in cui la gente legge un testo.
D: Perché la risposta in alto è così fastidiosa?
R: La risposta in alto.
D: Qual è la cosa più fastidiosa nelle email?

--
Hai ricevuto questo messaggio perché sei iscritto al gruppo "Maclovers" di Google Gruppi.
Per postare messaggi in questo gruppo, invia un'email a maclover...@googlegroups.com.
Per annullare l'iscrizione a questo gruppo, invia un'email a maclovers_ital...@googlegroups.com.
Per ulteriori opzioni, visita il gruppo all'indirizzo http://groups.google.com/group/maclovers_italia?hl=it.

Gmail Giovanni

unread,
Aug 29, 2011, 1:55:03 PM8/29/11
to maclover...@googlegroups.com, maclover...@googlegroups.com
Premesso che Frank ha ragione, esistono software molto sofisticati - e proporzionalmente costosi - che riescono a separare i suoni anche se la registrazione originale non è stata multitraccia. Tanto per intenderci quello che si vede in NCIS non è fantascienza.
Ciao
Giovanni

Inviato da iPad


Franco

unread,
Aug 29, 2011, 5:47:35 PM8/29/11
to maclover...@googlegroups.com
--
Hai ricevuto questo messaggio perché sei iscritto al gruppo "Maclovers" di Google Gruppi.
Per postare messaggi in questo gruppo, invia un'email a maclover...@googlegroups.com.
Per annullare l'iscrizione a questo gruppo, invia un'email a maclovers_ital...@googlegroups.com.
Per ulteriori opzioni, visita il gruppo all'indirizzo http://groups.google.com/group/maclovers_italia?hl=it.


Personalmente nutro molti dubbi, però…
:)

Giuliano Michelini

unread,
Aug 29, 2011, 9:11:31 PM8/29/11
to maclover...@googlegroups.com

Il giorno 29/ago/2011, alle ore 19:55, Gmail Giovanni ha scritto:

> Premesso che Frank ha ragione, esistono software molto sofisticati - e proporzionalmente costosi - che riescono a separare i suoni anche se la registrazione originale non è stata multitraccia. Tanto per intenderci quello che si vede in NCIS non è fantascienza.


secondo quello che conosco io invece lo è eccome.
Separare due segnali miscelati è, per un algoritmo software audio che funziona essenzialmente con le FFT (ovvero le trasformate di Fourier), impossibile.
Perché è solo il discernimento dato dal nostro cervello ad “isolare” mentalmente una componente rispetto ad un’altra.

Esempio: voci diverse in un coro hanno spettri che si sovrappongono e che miscelati diventano un tutt’uno dal punto di vista fisico e dunque del segnale (sia analogico che PCM) e non vi è modo se non con algoritmi di intelligenza artificiale che “tentano” di capire e ricostruire lo spettro originario di ogni componente. Ma è una ricostruzione con resintesi se si usano software di questi tipi, dai risultati tutti strampalati e assolutamente non scientifici.

Ho effettuato in passato delle consulenze su delle intercettazioni (non vi posso dare ovviamente dettagli) e ti assicuro che NCIS è fantascienza, sia quando fanno le acrobazie audio, sia quando ricostruiscono immagini perfette da una manciata di pixel scadenti.

Per ora, con la nostra tecnologia è come voler ricavare la farina da una torta.
:-)

ciao

albertof

unread,
Aug 30, 2011, 4:37:50 AM8/30/11
to maclover...@googlegroups.com

Caro Giuliano,
neanche a farlo apposta hai citato un esempio che era proprio
l'argomento da cui sono partito nella discussione citata nella mail
di inizio thread.
Si parlava infatti di riuscire ad ottenere le singole voci di un
coro! per ragioni -come dicevo- didattiche, ma il problema era quello.
Quindi diciamo insolubile salvo l'esistenza di tracce singole
individuabili e separabili.
Ciao
Alberto

Giuliano Michelini

unread,
Aug 30, 2011, 7:48:57 AM8/30/11
to maclover...@googlegroups.com

Il giorno 30/ago/2011, alle ore 10:37, albertof ha scritto:

> Si parlava infatti di riuscire ad ottenere le singole voci di un coro! per ragioni -come dicevo- didattiche, ma il problema era quello.

quello che si può fare "abbastanza bene” è analizzare la traccia corale con un software come Melodyne (http://www.celemony.com/cms/index.php?id=products_editor) che ti “estrae” il pitch delle singole note e te le mostra in una sorta di griglia graduata dove fluttuano le sezioni a diverse altezze, un po’ come facevano i notatori in campo aperto 1000 anni fa, col gregoriano.
In senso didattico puoi “vedere” le diverse voci e poi ricostruirle con le voci vere o tentando di “oscurare” parzialmente alcune voci (ad esempio i bassi a scapito dei soprani e così via).
Un lavoretto impegnativo…
:)

ciao

Reply all
Reply to author
Forward
0 new messages