[SOD15] Analisi FP7: a che punto sono arrivato e una richiesta di aiuto

85 views
Skip to first unread message

Alberto

unread,
Apr 9, 2015, 6:39:42 PM4/9/15
to spaghett...@googlegroups.com
Ciao a tutti,

sono andato un po' avanti nell'analisi, che ho aggiornato sul wiki. La novità più importante è che ho scoperto che quella sottorete completa di 160 organizzazioni tutte connesse tra loro (la Morte Nera) è un artefatto matematico di un grosso progetto infrastrutturale con 160 organizzazioni, che partecipando allo stesso progetto sono ovviamente tutte connesse tra loro per costruzione. Per liberarmi del problema delle cliques ho provato a costruire un grafo di relazioni stabili, in cui due organizzazioni sono connesse se hanno partecipato insieme ad almeno due progetti diversi. Il grafo si riduce molto (perde 600 000 archi); dà luogo a una serie di piccole "isole", con una componente gigante con 9 000 organizzazioni e circa 90 000 archi. 

Sorpresa:  la Morte Nera c'è lo stesso. Ha 153 organizzazioni, che mi sembrano essere tutte grandi università e grandi istituti di ricerca pubblici o quasi. L'elenco completo è qui. Gli italiani sono (in ordine decrescente di numero di partners):

CONSIGLIO NAZIONALE DELLE RICERCHE
POLITECNICO DI TORINO
ALMA MATER STUDIORUM-UNIVERSITA DI BOLOGNA
UNIVERSITA DEGLI STUDI DI ROMA LA SAPIENZA
POLITECNICO DI MILANO
UNIVERSITA DEGLI STUDI DI PADOVA
AGENZIA NAZIONALE PER LE NUOVE TECNOLOGIE, L'ENERGIA E LO SVILUPPO ECONOMICO SOSTENIBILE
UNIVERSITA DI PISA
UNIVERSITA DEGLI STUDI DI NAPOLI FEDERICO II.
UNIVERSITA DEGLI STUDI DI FIRENZE
UNIVERSITA DEGLI STUDI DI MILANO
UNIVERSITA DEGLI STUDI DI TORINO
ISTITUTO NAZIONALE DI FISICA NUCLEARE
 
Ho anche trovato 1 700 organizzazioni "periferiche" che sono nella scena FP7 avendo un unico partner stabile, che è la loro chiave per ottenere fondi FP7. Questi si rapportano con 700 organizzazioni (sulle 31 000 da cui siamo partiti) che ho chiamato "intermediarie": sono quelli che intermediano i periferici rispetto al nucleo denso di FP7, appunto la Morte Nera. 

Mi servirebbe che qualche esperto di politiche pubbliche e di FP7 desse una letta al wiki e proponesse un'interpretazione. Questa situazione come si legge? 
  • è un male: significa che poche organizzazioni accademiche dominano la scena. Gli altri possono fare un progetto ogni tanto perché gli entra per caso, o essere parte della scena FP7 in permanenza ma sempre intermediati da una sola o poche organizzazioni dominanti. 
  • è un bene: significa che grandi università e centri di ricerca sono bravi e proattivi nel rincorrere le imprese per farle partecipare a FP7.
  • altro?
Se riuscite a scrivere due righe nel wiki (fate una pagina nuova) perfetto; se no scrivete qui che ne riparliamo.

leonardo maccari

unread,
Apr 10, 2015, 4:20:14 AM4/10/15
to spaghett...@googlegroups.com
On 04/10/2015 12:39 AM, Alberto wrote:
> Ciao a tutti,

Ciao Alberto,

intanto grazie per il lavoro che stai facendo, che e' molto utile.
ti do la mia interpretazione.

> Mi servirebbe che qualche esperto di politiche pubbliche e di FP7 desse
> una letta al wiki e proponesse un'interpretazione. Questa situazione
> come si legge?
>
> * è un male: significa che poche organizzazioni accademiche dominano
> la scena. Gli altri possono fare un progetto ogni tanto perché gli
> entra per caso, o essere parte della scena FP7 in permanenza ma
> sempre intermediati da una sola o poche organizzazioni dominanti.
> * è un bene: significa che grandi università e centri di ricerca sono
> bravi e proattivi nel rincorrere le imprese per farle partecipare a FP7.
> * altro?


secondo me e' naturale, nel senso che molte delle organizzazioni che hai
citato sono molto grandi, hanno dipartimenti che si occupano di tutto lo
scibile umano (il CNR, La Sapienza...) e quindi e' normale che appaiano
in molti progetti. L'altro punto e' che per partecipare a (e ancora di
piu' per proporre) progetti ci vuole expertise, quindi e' normale che
istituti grandi abbiano uffici dediti e supporto alla progettazione, che
li rende piu' efficienti e avvantaggiati. In fine, la comunita' cerca di
collegare i progetti con azioni di coordinazione, quindi e' facile che
quando sei entrato in un progetto che ha guadagnato un po' di
visibilita' poi sia piu' facile che ti invitino a farne altri.
Se vuoi relativizzare, puoi dividere per il numero di afferenti, che per
le universita' dovresti trovare sul sito del MIUR e vedere quali sono i
centri piu' efficienti.

ciao,
l.

Alberto

unread,
Apr 10, 2015, 4:47:07 AM4/10/15
to spaghett...@googlegroups.com
Leonardo, grazie a te. Ma:
  1. Non so se è poi così normale. Il CNRS ha fatto 1600 progetti! Ok, è grande, ma quanti centri di ricerca può avere? 100? Vuol dire che in media, ciascun centro ha fatto 2.5 progetti FP7 all'anno per 7 anni? Siccome poi i progetti durano due o tre anni, vuol dire avere 100 centri di ricerca che gestiscono 5-6 progetti FP7 contemporaneamente, per tutto il settennato. Questi non sono proprio numeri normali: anche se immagini che abbia 100 centri di ricerca, la media per centro è molto più alta che in altre organizzazioni. Questa è un'anomalia: te lo dicono i numeri.
  2. La tua spiegazione all'anomalia è convincente: fare progetti è un mestiere in sé, indipendentemente dal contenuto dei progetti in termini di idee, innovazione, delivery etc. Più fai progetti più diventi bravo a farli. Ma io sospetto che questo NON sia un obiettivo di policy della Commissione, che al contrario vorrebbe che i progetti fossero semplici, e venissero assegnati in base alle idee, ai contenuti, alla capacità di delivery. Qualcuno del nostro gruppo a SOD15 sosteneva addirittura che Horizon 2020 premia in graduatoria chi non ha mai fatto progetti, proprio per incentivare gente diversa a entrare. In altre parole: questa distribuzione molto asimmetrica, a legge di potenza (due terzi di tutte le organizzazioni coinvolte hanno partecipato solo a un progetto), è un bug: gli economisti dicono "una cattura" della policy. 
A meno che, ovviamente, il ruolo molto centrale di alcune istituzioni non fosse intenzionale. Questo non te lo dicono i dati, ma la conoscenza qualitativa di FP7 come policy; che, appunto, io non ho.

Matteo Fortini

unread,
Apr 10, 2015, 4:50:05 AM4/10/15
to spaghett...@googlegroups.com
Aggiungo che creare tutta la struttura del bando, della scrittura dei progetti, della valutazione etc per poi avere come risultato che i soldi li prendono i grossi centri di ricerca e chi si associa a loro mangia forse è fatica sprecata.

A questo punto tanto varrebbe prendere i migliori centri di ricerca e renderli mediatori direttamente dei fondi, a patto di presentare dei progetti secondo alcune regole.
--
Hai ricevuto questo messaggio perché sei iscritto al gruppo "Spaghetti Open Data" di Google Gruppi.
Per annullare l'iscrizione a questo gruppo e non ricevere più le sue email, invia un'email a spaghettiopend...@googlegroups.com.
Visita questo gruppo all'indirizzo http://groups.google.com/group/spaghettiopendata.
Per altre opzioni visita https://groups.google.com/d/optout.

Message has been deleted

raffaele messuti

unread,
Apr 10, 2015, 5:37:22 AM4/10/15
to spaghett...@googlegroups.com
lavoro molto interessante, complimenti.
sarebbe altrettanto interessante studiare quante pubblicazioni in open
access escono dalla morte nera.

https://www.openaire.eu/stats-fp7/statistics/fp7-stats
http://api.openaire.eu/

(assumendo per buoni i dati di openaire, che, essendo esso stesso un
prodotto di FP7, funziona cosi' cosi' :|)

--
raffaele

Stefano Durì

unread,
Apr 10, 2015, 5:54:23 AM4/10/15
to spaghett...@googlegroups.com
mi stavo preoccupando inutilmente: avevo letto CNR invece di CNRS e i conti ovviamente non tornavano affatto. Non ho informazioni che possano spiegare questo strapotere CNRS, ma noto che il numero di laboratori che mette in campo è notevole: http://www.cnrs.fr/fr/recherche/labos.htm
Mi sembra di notare che la network analysis (ma non è lo strumento a fare la differenza) non riesca a indicarci una linea interpretativa più plausibile di un'altra. Mi chiedo se non possiamo però aggiungere al quadro qualche altro indicatore, ad es. introducendo il tempo: diverso è dire 
"x organizzazioni vengono intermediate da un nucleo di altre y"
e
"x organizzazioni nell'arco di 7 anni sono state intermediate da un nucleo di altre y"
La seconda frase potrebbe descrivere un quadro altamente dinamico, nel quale vengono attivate imprese sempre diverse nel corso del tempo, fino a raggiungere il numero di x.
(sempre che io abbia capito bene)

Stefano Durì

unread,
Apr 10, 2015, 8:29:16 AM4/10/15
to spaghett...@googlegroups.com
nel frattempo vedo un aggiornamento dei file excel con i dati dei progetti (+26) e delle organizzazioni partecipanti (+208). 
Teoricamente dovrei rifare tutte le elaborazioni. Comincia a sembrare l'asintotica fine di FriendFeed a cui si può assistere in queste ore

leonardo maccari

unread,
Apr 10, 2015, 9:14:21 AM4/10/15
to spaghett...@googlegroups.com
On 04/10/2015 10:47 AM, Alberto wrote:
> Leonardo, grazie a te. Ma:
>
> 1. Non so se è poi così normale. Il CNRS ha fatto 1600 progetti! Ok, è

il CNRS o il CNR?

Il CNR ha piu' di 6000 dipendenti, e quindi almeno tre-quattro volte il
numero di personale non strutturato, tutti che lavorano anche ai
progetti, quindi il numero non sembra grande, anzi (e il CNRS penso che
sia ancora piu' grande).

> grande, ma quanti centri di ricerca può avere? 100? Vuol dire che in
> media, ciascun centro ha fatto 2.5 progetti FP7 all'anno per 7 anni?

se nel centro ci lavorano 10 strutturati, 40 precari e 10
tecnici/amministrativi, non ci vedo niente di strano. Poi FP7 vuol dire
tante cose, ci sono progetti di ricerca e sviluppo, progetti di
supporto, marie curie, scambio di personale amministrativo... (non ho
visto i dati, non so se ti riferisci solo ad una famiglia). quindi si fa
male a fare un rapporto significativo progetti/anno.

> Siccome poi i progetti durano due o tre anni, vuol dire avere 100
> centri di ricerca che gestiscono 5-6 progetti FP7
> contemporaneamente, per tutto il settennato. Questi non sono proprio
> numeri normali: anche se immagini che abbia 100 centri di ricerca,
> la media per centro è molto più alta che in altre organizzazioni.
> Questa è un'anomalia: te lo dicono i numeri.

beh dipende da quali numeri dovrebbero definire la normalita' :-)

Forse pero' c'e' un problema nell'interpretazione, la comunita' europea
non finanzia tutta la ricerca, finanzia quella di respiro europeo e
principalmente quella eccellente. Se te sei un ricercatore che non ha
dimostrato di poter fare ricerca ad alto livello, difficilmente ricevi
fondi da progetti di ricerca e sviluppo. Tant'e' che il tasso di
accettazione per i primi due anni di FP7 (i primi dati che ho trovato)
era del 16%, che non e' proprio alto. Penso sia normale che l'eccellenza
sia concentrata in grandi importanti istituti, e quindi sia piu' facile
che questi istituti prendano tanti finanziamenti.
Sarebbe il compito dei singoli paesi finanziare la ricerca in modo che
ricercatori bravi abbiano accesso a delle carriere che gli permettono di
diventare eccellenti, l'anomalia e' che alcuni non lo fanno e quindi e'
difficile competere a livello europeo.



> 2. La tua spiegazione all'anomalia è convincente: fare progetti è un
> mestiere in sé, indipendentemente dal contenuto dei progetti in
> termini di idee, innovazione, delivery etc. Più fai progetti più
> diventi bravo a farli. Ma io sospetto che questo NON sia un
> obiettivo di policy della Commissione, che al contrario vorrebbe che
> i progetti fossero semplici, e venissero assegnati in base alle
> idee, ai contenuti, alla capacità di delivery. Qualcuno del nostro
> gruppo a SOD15 sosteneva addirittura che Horizon 2020 premia in
> graduatoria chi non ha mai fatto progetti, proprio per incentivare
> gente diversa a entrare. In altre parole: questa distribuzione molto
> asimmetrica, a legge di potenza (due terzi di tutte le
> organizzazioni coinvolte hanno partecipato solo a un progetto), è un
> bug: gli economisti dicono "una cattura" della policy.

Io non vedo come potrebbe essere altrimenti, chi ha esperienza di
scrivere un progetto da cordinatore sa che e' un lavoro grosso e
difficile. Se non hai partecipato *almeno* ad un altro progetto e' quasi
impossibile che tu abbia successo. Quindi almeno il cordinatore e'
qualcuno con le spalle larghe, che deve poter gestire tutto il processo.
A quel punto il cordinatore si porta dentro chi gli serve.
Sul fatto di incoraggiare i newcomers, non saprei, h2020 ha snellito
alcune procedure amministrative, ma ogni progetto e' valutato
singolarmente, non c'e' nessun criterio di distribuzione. Quindi, di
nuovo nessuno impedisce a Cambridge (per dirne una) di prendere tanti
progetti anche nella stessa call.

> A meno che, ovviamente, il ruolo molto centrale di alcune istituzioni
> non fosse intenzionale. Questo non te lo dicono i dati, ma la conoscenza
> qualitativa di FP7 come policy; che, appunto, io non ho.

Ci sono programmi specifici per finanziare solo alcuni istututi ritenuti
eccellenti, ad esempio EIT: http://eit.europa.eu/eit-community/map

ma penso siano poche cose.

comunque secondo me e' interessante vedere il rapporto progetti/persone
perche' ti da' un coefficiente di efficienza dei singoli istituti (anche
se grezzo). Per le universita' i dati li trovi qui

http://statistica.miur.it/scripts/personalediruolo/vdocenti0.asp

torno a scrivere il mio progetto :-)
l.

Andrea Maurino

unread,
Apr 10, 2015, 12:23:23 PM4/10/15
to spaghett...@googlegroups.com

concordo in pieno con le osservazioni di leonardo. nom dimentichiamo che nella ricerca l'europa se la deve vedere cpn con usa, cina india etc... per cui è normale che "piova sul bagnato dell'eccellenza"
suggerirei di spezzare l'analisi per aree tematichr (health, agro, ict) qui so vede se ci sono organizzazioni pigliatutto o meno e qui i centri e le aziende mono ricerca potrebbero emergere nella rete.

inoltre so dovrebbe correlare i soldi con i risultati se i primi 10 centri di ricerca europei per progetti presi sono ai livelli mondiali per produzione scientifica. ..allora l'europa ha fattp un buon investimento. ..altrimenti c'è da riflettere

sui newcomers in alcune call h2020 ci sono punti in più per sme che per la prima volta chiedono il pic number, oltre a chiamate specifiche per singole aziende (sme instrument) o per ricercatori singoli (erc)

andrea

--
Hai ricevuto questo messaggio perché sei iscritto al gruppo "Spaghetti Open Data" di Google Gruppi.
Per annullare l'iscrizione a questo gruppo e non ricevere più le sue email, invia un'email a spaghettiopend...@googlegroups.com.
Visita questo gruppo all'indirizzo http://groups.google.com/group/spaghettiopendata.
Per ulteriori opzioni, visita https://groups.google.com/d/optout.

karloff

unread,
Apr 13, 2015, 4:47:59 PM4/13/15
to spaghett...@googlegroups.com
Segnalo a corredo delle analisi fatte un articolo sulla performance dei diversi paesi europei apparso sul Sole di inizio aprile. Nonostante la fote presenza del CNR l'analisi che ne esce è comunque di una performance pessima rispetto al contributo itailano al finanziamento

http://www.scuola24.ilsole24ore.com/art/universita-e-ricerca/2015-04-03/cosi-l-italia-finanzia-ricerca-altri-213954.php?uuid=ABkq8MKD


Andrea Nelson Mauro

unread,
Apr 14, 2015, 12:09:32 AM4/14/15
to spaghett...@googlegroups.com
mi pare davvero una questione interessantissima nella quale è stato risolto l'entry level sui dati (ovvero: da dove comincio?). Probabilmente varrebbe la pena costruire una visualizzazione interattiva navigale. Alberto: se stai lavorando con gephi potresti usare - ma magari lo sai già - sigmajs, un plugin che ti permette di costruire una rete interattiva e navigabile (qui un esempio http://viz.dataninja.it/datamediahub/20140411_Network_DMH/ ). Si installa il plugin e poi semplicemente invece di tirare giù l'img si tira giù la pagina html.
Volendo do una mano

Oppure se l'avete già fatta, dove si trova? io non ho beccato il link, ma ci avrei fatto volentieri un po' di ricerche

Laura Camellini

unread,
Apr 14, 2015, 4:59:20 AM4/14/15
to spaghett...@googlegroups.com
Mi spiace, non riesco a trovare i file gephi su cui abbiamo lavorato durante SOD, li' ci avevano lavorato parecchio Alessandro Masserdotti (aless...@dotdotdot.it) e Nicolo' Gnudi (nicolo...@gmail.com) usando una versione semplificata dei dati che aveva elaborato Fortini mi pare.
Se vuoi ti mando quella e le visualizzazioni pdf che hanno fatto in privato.

Io mi ero un po' concentrata su nodebox (che ha un buon plugin per la visualizzazione di reti, molto articolato), ho scritto le procedure che ho trovato nella wiki https://github.com/spaghetti-open-data/fp7-funding-network-analysis/wiki/Stack ma non sono arrivata avanti come loro.

Ciao,
LauraC

--
Hai ricevuto questo messaggio perché sei iscritto al gruppo "Spaghetti Open Data" di Google Gruppi.
Per annullare l'iscrizione a questo gruppo e non ricevere più le sue email, invia un'email a spaghettiopend...@googlegroups.com.
Visita questo gruppo all'indirizzo http://groups.google.com/group/spaghettiopendata.

Nicolò Gnudi

unread,
Apr 20, 2015, 6:23:23 PM4/20/15
to spaghett...@googlegroups.com
Ciao a tutti e scusate la latitanza. 

Premessa: io e Alessandro a SOD15 avevamo lavorato ad alcune visualizzazioni in Gephi, le ho anche salvate ma non penso diano un valore aggiunto all'attuale lavoro o siano utili all'analisi perché approssimative, inoltre, non ho tracciato i parametri di filtro quindi potrebbero anche essere fuorvianti. 
----------

Nelle ultime settimane nel mio tempo libero ho lavorato a un piccola web-app per visualizzare i collegamenti tra le organizzazioni, è ancora un work in progress e sicuramente ci sarà qualche piccolo errore qua e là, comunque se volete darci un'occhiata la trovate qui: http://fp7-env.elasticbeanstalk.com/
Per il momento è veramente "spartana" e non ho un vero obiettivo, volevo solo provare un po' a giocare con Sigma e i dati di FP7.
I suggerimenti sono comunque ben accetti :)

Al link http://fp7-env.elasticbeanstalk.com/fp7-graph/index.html potete trovare una parte dell'intero grafo elaborato con Gephi e visualizzato con Sigma (proprio come aveva suggerito Andrea Nelson).
Il grafo totale (e qui ringrazio ancora Matteo Fortini per averci passato il .graphml) ha più di 31mila nodi e oltre 158mila archi, ho provato a lanciare qualche layout (ForceAtlas e ForceAtlas2) ma il grafo non si schioda e rimane illeggibile, per questo al momento ho caricato una versione filtrata per degree (>49) e i nodi visualizzati sono 915 (2,87% ), gli archi 35900 (22,62%).  
Su quest'ultimo passaggio vorrei chiedere un consiglio agli esperti di Gephi, è possibile secondo voi fare una visualizzazione dell'intero grafo ma che sia leggibile? 
Qui il graphml ->  link
Qui il grafo elaborato da me con con Gephi -> link

Se volete potete sbirciare anche il codice su github https://github.com/nickgnd/fp7-test 
Nella directory "_data" trovate i CSV che ho usato per implementare il database, creati a partire dagli excel di Stefano Durì (l'ultima versione), grazie :) .


PS: a proposito di dati, penso ci sia un errore: le organizzazioni 90, 91, 92, 93 (id) hanno dei punti di domanda nel nome, questo errore è presente anche nell'excel iniziale. http://fp7-env.elasticbeanstalk.com/organizations?page=2


Sto usando Ruby on Rails 4.2, Sigma.js per la dataviz, Foundation 5 come framework front-end. 
Deploy su Amazon per comodità.


Penso di aver detto tutto, scusate il papiro.
A presto, 


Nicolò

Laura Camellini

unread,
Apr 21, 2015, 4:17:43 AM4/21/15
to spaghett...@googlegroups.com
Ciao Nicolo',
bel lavoro davvero.
La navigabilita' dell'interfaccia ci permetterebbe di dare rilievo ad informazioni fino ad ora trascurate.

Ti faccio una domanda da profana di gephi, su che criterio sono stati scelti i gruppi (selezionabili dal menu a tendina a sinistra?)
E se non esiste un criterio, pensi che potremmo inserirlo?
Faccio riferimento all'xls che mando' karloff ancora durante SOD15 utile a razionalizzare la navigazione delle informazioni, dividendo i centri a seconda del tipo di ricerca svolta:


Copio/incollo dalla mail di karloff riguardo alle categorie che lui ha trovato

---------------------------------------------------------------------------------

Interessanti sono le tabelle B4-B6 che presentano le top50 organizations che hanno avuto accesso ai finanziamenti, che a quanto pare sono state anche classificate secondo le seguenti categorie 
  • Higher or secondary education (HES)
  • Private for profit (excluding education) (PRC)
  • Public body (excluding research and education) (PUB)
  • Research organisations (REC)
  • Other (OTH)

nella banca dati E-Corda, da cui sono state estratte.

------------------------------------------------------

Vuoi che provi io a farlo?
Se si mi dai qualche indicazione in pvt?

Ciao,
LauraC

--
Hai ricevuto questo messaggio perché sei iscritto al gruppo "Spaghetti Open Data" di Google Gruppi.
Per annullare l'iscrizione a questo gruppo e non ricevere più le sue email, invia un'email a spaghettiopend...@googlegroups.com.
Visita questo gruppo all'indirizzo http://groups.google.com/group/spaghettiopendata.

Nicolò Gnudi

unread,
Apr 21, 2015, 2:26:51 PM4/21/15
to spaghett...@googlegroups.com
Grazie Laura, ma per il momento è veramente un abbozzo. 

I gruppi che vedi rappresentano la Moduarity Class, ovvero, differenti community all'interno del grafo totale. 
Ogni community identificata ha un'alta densità di collegamenti tra i nodi che la compongono e, viceversa, collegamenti meno frequenti verso nodi appartenenti ad atre community. (http://en.wikipedia.org/wiki/Modularity_%28networks%29 )

Nel grafo in questione non mi sembra emergano community in particolare, infatti il parametro calcolato nel grafo totale è di 0,39.
(Statistiche relative al grafo totale --> modularity = 0,396 (risoluzione = 1); Numero di community identificate = 858; su richiesta posso allegare la distribuzione)

Per quanto riguarda la possibilità di evidenziare i nodi in base alla tipologia di ricerca che svolgono, beh è sicuramente una strada interessante da provare a percorrere. Il problema è che i nodi sono oltre 31.000 e avremmo solo 50 nodi classificati in questo modo. Però è sicuramente da tenere presente come opzione.

Si potrebbe provare anche direttamente in Gephi, scarichi il graphml di Matteo o il mio .gephi, trovi le top50 organizzazioni, aggiungi un campo nella base di dati e le classifichi le top 50 una a una in base alla ricerca che fanno, poi modifichi i parametri della visualizzazione
(es. grandezza data dalle connessioni, colore diverso in base al tipo di ricerca, ne deriva che i nodi non classificati avranno un colore neutro)..questo potrebbe essere un primo tentativo. 

Buon appetito :)

Nicolò

Alberto

unread,
Apr 22, 2015, 3:28:32 AM4/22/15
to spaghett...@googlegroups.com
Ciao Nicolò, e complimenti per il lavoro.

Per quello che ne so io, quando vai a ridurre il grafo devi avere una motivazione interpretativa: in assenza di questo, ti trovi con una scelta arbitraria, difficile da difendere. Per esempio, tu scegli di visualizzare solo i nodi con grado maggiore di 49: per fare questo, devi (1) spiegare perché consideri i nodi a connettività bassa poco interessanti nel contesto della tua analisi e (2) spiegare perché metti la soglia a 49 e non a 50 o a 6.

Nell'analisi partita a SOD15, per esempio, il problema è stato affrontato così: invece che il grafo delle relazioni di partenariato, considero il grafo delle relazioni stabili di partenariato. Una relazione stabile di partenariato si ha quando due organizzazioni partecipano insieme ad almeno due progetti FP7. Questo grafo dice una cosa diversa rispetto a quello primario, naturalmente: scarta le relazioni occasionali e si concentra su quelle che sono considerate abbastanza interessanti per essere tenute in vita oltre la durata del singolo progetto. Questo è interessante, perché a SOD15 cercavamo strutture di potere: nel grafo delle relazioni stabili di partenariato, una struttura di potere emerge dal fatto che alcune organizzazioni sono molto connesse, con centinaia di partners stabili, e quindi hanno molti punti di entrata in FP7; altre hanno un unico partner stabile, e quindi solo un punto di ingresso – cosa che configura una relazione asimmetrica del tipo "io ho bisogno di te ma tu non hai bisogno di me".

Ho un dubbio: ma come fai ad avere 130 000 archi? Io ne ho molti di più, 680 000 nel grafo pesato. :-( Matteo, sei sicuro di quel .graphml ?


Nicolò Gnudi

unread,
Apr 24, 2015, 10:01:04 AM4/24/15
to spaghett...@googlegroups.com
Ciao Alberto, grazie. Come dicevo a Laura è ancora una bozza, ora, tempo permettendo, vorrei implementare qualche funzionalità che possa essere più utile. 

Si vero, il grafo creato con gephi non ha una motivazione di fondo se non quella di ottenere qualcosa che fosse più leggibile. Anche se elimino tutti gli archi con weigth < 2 mi rimangono tantissimi nodi e il grafo rimaneva molto concentrato e poco  leggibile. 

Comunque confermo, con il database con cui sto lavorando (preso dal lavoro di Stefano) ho 675.548 edges già "pesati". Quindi qualcosa non torna. 

Alberto Cottica

unread,
Apr 24, 2015, 1:01:44 PM4/24/15
to spaghett...@googlegroups.com
Ecco, questi sono i numeri che avevamo anche noi. :-)

Reply all
Reply to author
Forward
0 new messages