Page 35 - SymbolsUnimore_n4
P. 35
Data Management and Analytics
Al giorno d'oggi, la disponibilità sempre cre- pali attività. Ci si concentra su modelli, algorit- alla business intelligence, dalle knowledge-ba-
scente e diffusa di dati provenienti da molte- mi e strutture di dati per ricerche approssimative se di dati biologici all'industria 4.0 e alle digi-
plici fonti di informazione, come social media, in dati non convenzionali come grafi, dati se- tal factory, per le quali un aspetto centrale è di
dispositivi mobili e indossabili, World Wide mi-strutturati e testo semplice, nonché in conte- consentire agli stakeholder del ciclo di vita del
Web (Semantico), reti peer-to-peer, bibliote- sti non convenzionali come scenari eterogenei. prodotto di collaborare con soluzioni software e
che digitali, apre enormi possibilità nel campo La principale preoccupazione è adattare le esi- di interoperabilità innovative.
della gestione e dell'analisi dei dati di prossima genze degli utenti alle informazioni di interesse
generazione. La gestione e l’analisi efficiente quando queste ultime non corrispondono esat- Uno degli aspetti su cui la linea di ricerca è
ed efficace di una tale ricchezza di informazio- tamente e come classificare i risultati. Approcci particolarmente attiva in diversi scenari appli-
ni pone costantemente eccezionali sfide in am- di ricerca approssimati e/o personalizzati sono cativi è quello legato all'analisi dei dati, anche
bito della ricerca e delle sue applicazioni. stati studiati, ad esempio, nel contesto di digital attraverso tecniche di apprendimento automati-
co (machine learning). Con il termine Big data
Il focus della linea di ricerca "Data management library distribuite, P2P, rilevamento del plagio, analytics si intende proprio il processo di raccol-
and analytics", portata avanti dall’Information traduzione automatica, sviluppo di software as- ta e analisi di grandi volumi di dati per estrarre
Systems Group (ISGroup) del Dipartimento di sistito, semantic web, applicazioni dipendenti informazioni nascoste. Tra i contesti applicativi
Scienze Fisiche, Informatiche e Matematiche, dal contesto. In ambito di data management per considerati, ricordiamo ad esempio i notevoli ri-
Università di Modena e Reggio Emilia (Prof. big data, si studiano anche soluzioni per una ge- sultati conseguiti nell'ambito medico, genomico,
Federica Mandreoli, Dott. Riccardo Martoglia), stione efficiente di stream di dati, inclusi i dati delle risorse umane, di cultural heritage (CH).
è principalmente legato alle seguenti macro-a- dei sensori, i dati RFID, i dati provenienti dalle Ad esempio, in ambito medico sono in corso
ree: (i) gestione e accesso a grandi quantità di automobili in scenari di smart city. ricerche in ambito di medicina preventiva, pre-
dati non convenzionali (stream, testuali, XML e La sempre crescente e diffusa disponibilità di dittiva, personalizzata e partecipativa (P4), con
grafici semistrutturati), anche in modo approssi- dati provenienti da fonti di informazione su In- l'obiettivo di migliorare notevolmente la quali-
mato e/o personalizzato; (ii) condivisione delle ternet suscita anche grande interesse sul poten- tà della vita delle persone, ma anche di ridurre
informazioni, interoperabilità e Web Semantico ziale della condivisione e dell'interoperabilità significativamente i costi sanitari e migliorarne
in grandi sorgenti di dati eterogenee e distribu- delle informazioni. In questo campo la ricerca l'efficienza. La ricerca si concentra: (a) sulle
ite; (iii) scalable data science, data analytics e riguarda la condivisione e l'interoperabilità di malattie legate all'età ed esplora le opportunità
machine learning. Vediamo alcune delle attività fonti di dati eterogenee e distribuite e si concen- offerte da un approccio basato sui dati per pre-
di punta svolte in queste aree.
tra principalmente sul paradigma peer-to-peer vedere gli stati di salute delle persone anziane;
Per quanto riguarda la gestione e l'accesso a (P2P) e sulle sue evoluzioni verso i dataspace, i (b) sulla predizione di stati clinici dei pazienti
grandi quantità di dati non convenzionali, la ri- data lake e i polystore. Vari sono i contesti ap- Sars-CoV-2 e sull’introduzione di approcci da-
cerca approssimata è da sempre una delle princi- plicativi considerati, dalle biblioteche digitali ta-driven per trattamenti personalizzati.
35