This thesis presents research conducted as part of the PhD program in Applied Data Science and Artificial Intelligence, with the aim of demonstrating how network analysis can offer a quantitative understanding of collaborations that drive innovation. Innovation is a fundamental strategy for many organizations and policymakers, with collaboration between companies, research centers, and universities playing a crucial role in this process. However, studying collaboration dynamics is challenging due to the lack of structured data and the complexity of the analysis. The proposed methodology segments the data into temporal periods, represents collaborations as weighted networks, and applies network analysis techniques to identify the most influential organizations (using centrality measures) and cohesive groups (through community detection algorithms). By comparing these networks over time, the evolution of collaborations can be observed and quantified. The methodology was first tested on artificial networks to verify its effectiveness and improve clarity of exposition. This revealed several issues, including the variability of results produced by community detection algorithms, the need to validate the outputs, and the dependence on the order in which input data is provided. The research redefined the role of community detection algorithms, showing that they do not provide the solution, but rather one point within a solution space. Consequently, the process of identifying communities in networks follows a more nuanced approach: generating possible solutions, verifying their stability, and, in cases of multiple solutions, applying a consensus procedure to reach a definitive result. The process also introduces node-level uncertainty coefficients and different strategies for managing outliers. Research results include an R library and open access datasets published in open repositories. The methodology and software were applied to two case studies: collaborations between industry and research in Friuli Venezia Giulia and Horizon projects in the hydrogen sector. These studies demonstrate the effectiveness of network analysis in revealing collaboration dynamics.
Questa tesi presenta la ricerca svolta nell'ambito del programma di dottorato in Applied Data Science and Artificial Intelligence, con l'obiettivo di evidenziare come l'analisi delle reti possa fornire una visione quantitativa delle collaborazioni che sono alla base dell'innovazione. L'innovazione rappresenta una strategia importante per l'industria, la ricerca e per i decisori politici, e la collaborazione tra diverse organizzazioni è spesso un fattore abilitante che è importante conoscere e misurare. Tuttavia, studiare le dinamiche di collaborazione risulta complesso a causa della scarsa disponibilità di dati strutturati. La metodologia proposta in questa tesi segmenta i dati in intervalli temporali, rappresenta le collaborazioni come reti pesate e applica tecniche di analisi delle reti per identificare le organizzazioni più influenti (attraverso misure di centralità) e le comunità coese (mediante algoritmi di community detection). Il confronto tra le reti in periodi successivi permette di osservare e quantificare l'evoluzione delle collaborazioni. La metodologia è stata inizialmente testata su reti artificiali per verificarne l'efficacia e facilitare la comprensione dei risultati. Questo ha permesso di mettere in luce alcune problematiche, tra cui la variabilità dei risultati prodotti dagli algoritmi di community detection, la necessità di validare tali risultati e la dipendenza dall'ordine di inserimento dei dati in ingresso (input ordering bias). La ricerca ha portato a una ridefinizione del ruolo dell'algoritmo di community detection, sottolineando come non sia corretto considerare i risultati ottenuti come soluzione, ma piuttosto come un punto all'interno di uno spazio delle soluzioni. Di conseguenza, il processo di individuazione delle comunità segue un flusso di lavoro articolato che prevede: generazione delle soluzioni, verifica della stabilità dei risultati e, in caso di soluzioni multiple, applicazione di una procedura di consenso per ottenere una soluzione univoca. Inoltre, il processo introduce coefficienti di incertezza a livello di nodo e diverse modalità di gestione degli outliers. I risultati della ricerca includono la pubblicazione di una libreria in linguaggio R e alcuni dataset, con licenza CC-BY in repository aperti. La metodologia e il software sono stati applicati a due casi di studio: le collaborazioni tra industria e ricerca in Friuli Venezia Giulia e i progetti Horizon nel settore dell'idrogeno. Questi studi dimostrano l'efficacia dell'analisi delle reti nel rivelare le dinamiche collaborative.
Rilevamento delle comunità nelle reti complesse: limitazioni e nuovi approcci per migliorare la stabilità delle soluzioni / Morea, Fabio. - (2025 Feb 03).
Rilevamento delle comunità nelle reti complesse: limitazioni e nuovi approcci per migliorare la stabilità delle soluzioni
MOREA, FABIO
2025-02-03
Abstract
This thesis presents research conducted as part of the PhD program in Applied Data Science and Artificial Intelligence, with the aim of demonstrating how network analysis can offer a quantitative understanding of collaborations that drive innovation. Innovation is a fundamental strategy for many organizations and policymakers, with collaboration between companies, research centers, and universities playing a crucial role in this process. However, studying collaboration dynamics is challenging due to the lack of structured data and the complexity of the analysis. The proposed methodology segments the data into temporal periods, represents collaborations as weighted networks, and applies network analysis techniques to identify the most influential organizations (using centrality measures) and cohesive groups (through community detection algorithms). By comparing these networks over time, the evolution of collaborations can be observed and quantified. The methodology was first tested on artificial networks to verify its effectiveness and improve clarity of exposition. This revealed several issues, including the variability of results produced by community detection algorithms, the need to validate the outputs, and the dependence on the order in which input data is provided. The research redefined the role of community detection algorithms, showing that they do not provide the solution, but rather one point within a solution space. Consequently, the process of identifying communities in networks follows a more nuanced approach: generating possible solutions, verifying their stability, and, in cases of multiple solutions, applying a consensus procedure to reach a definitive result. The process also introduces node-level uncertainty coefficients and different strategies for managing outliers. Research results include an R library and open access datasets published in open repositories. The methodology and software were applied to two case studies: collaborations between industry and research in Friuli Venezia Giulia and Horizon projects in the hydrogen sector. These studies demonstrate the effectiveness of network analysis in revealing collaboration dynamics.File | Dimensione | Formato | |
---|---|---|---|
Tesi_PhD_Fabio_Morea_FINAL.pdf
accesso aperto
Descrizione: Rilevamento delle comunità nelle reti complesse: limitazioni e nuovi approcci per migliorare la stabilità delle soluzioni
Tipologia:
Tesi di dottorato
Dimensione
4.62 MB
Formato
Adobe PDF
|
4.62 MB | Adobe PDF | Visualizza/Apri |
Pubblicazioni consigliate
I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.