[opendatasicilia] Fwd: primi passi

Previous Topic Next Topic
 
classic Classic list List threaded Threaded
1 message Options
Reply | Threaded
Open this post in threaded view
|

[opendatasicilia] Fwd: primi passi

Riccardo Grosso
Scusate il cross posting.
Vi invio quanto segue, nel caso possa essere oggetto o spunto di riflessione per sessioni di open data fest.
Buon raduno.
Riccardo Grosso

---------- Messaggio inoltrato ----------
Da: Riccardo Grosso <[hidden email]>
Date: 26 maggio 2017 23:55
Oggetto: Re: primi passi
A: Giorgia Lodi <[hidden email]>, Raffaele Lillo <[hidden email]>
Cc: Matteo Troìa <[hidden email]>, Marco Combetto <[hidden email]>, Francesca Gleria <[hidden email]>, Marco Brandizi <[hidden email]>, Daniele Santamaria DMI <[hidden email]>, Cristiano Longo <[hidden email]>, Lorenzo Perone <[hidden email]>, Alessio Cimarelli <[hidden email]>


Con riferimento a quanto scritto precedentemente e riportato sotto, questo e' il disegno dell'ontologia inferita usando
cpsv-ap_it.owl come esca:


Valgono in parte le considerazioni che avevo fatto in precedenza nella mail sottoriportata, ovvero:

i tool sono in grado di arricchire dal basso le ontologie di riferimento, utilizzando i constraints fisici dei database. Cosa impossibile da fare in automatico reversando strutture csv di opendata. Cosa che sarebbe possibile se si partisse dalle strutture (ddl sql scripts) dei db operazionali, ecco perche' insisto (in altre mie richieste a voi come DAF) per poter lavorare sulle strutture dei db fonte.

Prossimamente conto di aumentare l'input, partendo dalla sola search "rifiuti", senza tener conto della classificazione ambiente:
L'inferenza applicata su una maggior quantita' di dati e metadati puo' incrementare le inferenze stesse.

Prossimamente mi dedichero' anche ad applicare le inferenze, con lo stesso core vocabulary (cpsv-ap_it), ad alcune strutture dati afferenti al progetto ricostruzione trasparente, come promesso ad un paio di amici che leggono in copia.

Vi saluto e resto a disposizione per chiarimenti ed approfondimenti.

A presto.

Riccardo







Il giorno 14 aprile 2017 01:42, Riccardo Grosso <[hidden email]> ha scritto:
Cari Giorgia e Raffaele,
vi relaziono un primo lavoro svolto, relativo alle inferenze semantiche ed uso di ontologie, partendo dai dati aperti su dati.gov.it, classificati come ambiente, in tema di rifiuti.
Il mio input e' stato il seguente:
Tale input consiste nell'insieme dei csv classificati come ambiente, e trovati con la search "rifiuti".
Ho importato tutti i csv che non davano errori di importazione, e li ho caricati in un file access che allego, di nome rifiuti28.mdb
Ogni tabella importata da csv, e' stata manipolata per ottenere solo le colonne di interesse per le inferenze, ovvero:
nome tavola, descrizione tavola, nome campo, descrizione campo.
Laddove mancante la descrizione tavola, e' stata resa uguale a nome tavola.
Laddove mancante la descrizione campo, e' stata resa uguale a nome campo.
Sono stati presi quindi i metadati di ciascuna tavola.
Per i campi alfanumerici, sono stati presi anche i valori di dominio, ovvero i dati e non solo i metadati.
Con un esempio: se tratto il campo colore, puo' essere interessante inferire conoscenza anche dai suoi valori alfanumerici (bianco, rosso, eccetera).
Ciascuna tavola manipolata e' stata copiata in una unica tavola denominata f1, che contiene metadati e dati di tutte le tavole manipolate, e ha il seguente formato:
id progressivo, nome database, nome tavola, descrizione tavola, nome campo, descrizione campo
Il tutto e' confluito nel db rifiuti28ontologia.mdb allegato.
Infine, la sola tabella f1 e' confluita nel database del tool che uso per le inferenze, si chiama db.mdb e lo allego:​​Facendo girare i tools (che allego: ​​eseguibile da lanciare: progettocsi.exe)
si ottengono 3 frammenti di ontologia (i files *.txt che allego).
Si accede al seguente web service:
dando in input i rispettivi txt allegati (usage=attributes).
Si ottiene in output il file con estensione owl in allegato.
A sua volta tale file diventa l'input per un web service che disegna l'owl allegata:
Un paio di considerazioni:
1) le ontologie di riferimento che ho usato sono quelle ottenute, a suo tempo da Carlo Batini, dalle gerarchie di generalizzazione delle 4 entita' fondamentali della p.a. (soggetto, bene, documento, luogo geografico). Di tali gerarchie si sfruttano le relazioni a livello piu' alto. Non ho al momento a disposizione ontologie relative ai rifiuti. E' possibile introdurre nuove ontologie (dei rifiuti, nello specifico, o qualsivoglia altre per materia) nel tool ed arricchire le inferenze.
2) i tool sono in grado di arricchire dal basso le ontologie di riferimento, utilizzando i constraints fisici dei database. Cosa impossibile da fare in automatico reversando strutture csv di opendata. Cosa che sarebbe possibile se si partisse dalle strutture (ddl sql scripts) dei db operazionali, ecco perche' insisto (in altre mie richieste a voi come DAF) per poter lavorare sulle strutture dei db fonte.

Prossimamente conto di aumentare l'input, partendo dalla sola search "rifiuti", senza tener conto della classificazione ambiente:
L'inferenza applicata su una maggior quantita' di dati e metadati puo' incrementare le inferenze stesse.

Avrei bisogno di sapere se posso usare questi esperimenti, quelli di questa email in particolare, per scrivere un articolo che parli di questi primi esperimenti, e pubblicarlo da parte di Alessandro Longo.
Attendo vostre risposte e suggerimenti, richieste di chiarimenti e quant'altro sia per voi necessario sapere.
Scusate per l'approccio dettagliato e necessariamente tecnico.
Vi ringrazio.
A presto.
Riccardo Grosso.

Il giorno 23 marzo 2017 12:09, Giorgia Lodi <[hidden email]> ha scritto:



---------- Messaggio inoltrato ----------
Da: Riccardo Grosso <[hidden email]>
Date: 22 marzo 2017 15:55
Oggetto: primi passi
A: Lodi Giorgia <[hidden email]>


Ciao Giorgia,
comincero' con un reverse engineering dal fisico partendo dai seguenti datasets:


A presto
Ric

--

Questo è un account di posta personale di Riccardo Maria Grosso: tutte le opinioni espresse sono personali e non riflettono necessariamente quelle del mio datore di lavoro

Riservatezza: In ottemperanza al D.Lgs. n. 196 del 30/6/2003 in materia di protezione dei dati personali, le informazioni contenute in questo messaggio sono strettamente riservate ed esclusivamente indirizzate al destinatario indicato (oppure alla persona responsabile di rimetterlo al destinatario). Vogliate tener presente che qualsiasi uso, riproduzione o divulgazione di questo messaggio è vietato. Nel caso in cui aveste ricevuto questo messaggio per errore, vogliate cortesemente avvertire il mittente e distruggere il presente messaggio.
Rispetto per l'ambiente - non stampare questa e.mail se davvero non ne hai bisogno

Confidentiality: According to Italian law D.Lgs. 196/2003 concerning privacy, if you are not the addressee (or responsible for delivery of the message to such person) you are hereby notified that any disclosure, reproduction, distribution or other dissemination or use of this communication is strictly prohibited. If you have received this message in error, please destroy it and notify us by email. 
Consider the environment - do not print this email if you really do not need to do so



--

Questo è un account di posta personale di Riccardo Maria Grosso: tutte le opinioni espresse sono personali e non riflettono necessariamente quelle del mio datore di lavoro

Riservatezza: In ottemperanza al D.Lgs. n. 196 del 30/6/2003 in materia di protezione dei dati personali, le informazioni contenute in questo messaggio sono strettamente riservate ed esclusivamente indirizzate al destinatario indicato (oppure alla persona responsabile di rimetterlo al destinatario). Vogliate tener presente che qualsiasi uso, riproduzione o divulgazione di questo messaggio è vietato. Nel caso in cui aveste ricevuto questo messaggio per errore, vogliate cortesemente avvertire il mittente e distruggere il presente messaggio.
Rispetto per l'ambiente - non stampare questa e.mail se davvero non ne hai bisogno

Confidentiality: According to Italian law D.Lgs. 196/2003 concerning privacy, if you are not the addressee (or responsible for delivery of the message to such person) you are hereby notified that any disclosure, reproduction, distribution or other dissemination or use of this communication is strictly prohibited. If you have received this message in error, please destroy it and notify us by email. 
Consider the environment - do not print this email if you really do not need to do so




--

Questo è un account di posta personale di Riccardo Maria Grosso: tutte le opinioni espresse sono personali e non riflettono necessariamente quelle del mio datore di lavoro

Riservatezza: In ottemperanza al D.Lgs. n. 196 del 30/6/2003 in materia di protezione dei dati personali, le informazioni contenute in questo messaggio sono strettamente riservate ed esclusivamente indirizzate al destinatario indicato (oppure alla persona responsabile di rimetterlo al destinatario). Vogliate tener presente che qualsiasi uso, riproduzione o divulgazione di questo messaggio è vietato. Nel caso in cui aveste ricevuto questo messaggio per errore, vogliate cortesemente avvertire il mittente e distruggere il presente messaggio.
Rispetto per l'ambiente - non stampare questa e.mail se davvero non ne hai bisogno

Confidentiality: According to Italian law D.Lgs. 196/2003 concerning privacy, if you are not the addressee (or responsible for delivery of the message to such person) you are hereby notified that any disclosure, reproduction, distribution or other dissemination or use of this communication is strictly prohibited. If you have received this message in error, please destroy it and notify us by email. 
Consider the environment - do not print this email if you really do not need to do so



--

Questo è un account di posta personale di Riccardo Maria Grosso: tutte le opinioni espresse sono personali e non riflettono necessariamente quelle del mio datore di lavoro

Riservatezza: In ottemperanza al D.Lgs. n. 196 del 30/6/2003 in materia di protezione dei dati personali, le informazioni contenute in questo messaggio sono strettamente riservate ed esclusivamente indirizzate al destinatario indicato (oppure alla persona responsabile di rimetterlo al destinatario). Vogliate tener presente che qualsiasi uso, riproduzione o divulgazione di questo messaggio è vietato. Nel caso in cui aveste ricevuto questo messaggio per errore, vogliate cortesemente avvertire il mittente e distruggere il presente messaggio.
Rispetto per l'ambiente - non stampare questa e.mail se davvero non ne hai bisogno

Confidentiality: According to Italian law D.Lgs. 196/2003 concerning privacy, if you are not the addressee (or responsible for delivery of the message to such person) you are hereby notified that any disclosure, reproduction, distribution or other dissemination or use of this communication is strictly prohibited. If you have received this message in error, please destroy it and notify us by email. 
Consider the environment - do not print this email if you really do not need to do so



--

Questo è un account di posta personale di Riccardo Maria Grosso: tutte le opinioni espresse sono personali e non riflettono necessariamente quelle del mio datore di lavoro

Riservatezza: In ottemperanza al D.Lgs. n. 196 del 30/6/2003 in materia di protezione dei dati personali, le informazioni contenute in questo messaggio sono strettamente riservate ed esclusivamente indirizzate al destinatario indicato (oppure alla persona responsabile di rimetterlo al destinatario). Vogliate tener presente che qualsiasi uso, riproduzione o divulgazione di questo messaggio è vietato. Nel caso in cui aveste ricevuto questo messaggio per errore, vogliate cortesemente avvertire il mittente e distruggere il presente messaggio.
Rispetto per l'ambiente - non stampare questa e.mail se davvero non ne hai bisogno

Confidentiality: According to Italian law D.Lgs. 196/2003 concerning privacy, if you are not the addressee (or responsible for delivery of the message to such person) you are hereby notified that any disclosure, reproduction, distribution or other dissemination or use of this communication is strictly prohibited. If you have received this message in error, please destroy it and notify us by email. 
Consider the environment - do not print this email if you really do not need to do so

--
Sito: http://opendatasicilia.it
Facebook: https://www.facebook.com/groups/opendatasicilia/
twitter: http://twitter.com/opendatasicilia
Slack: http://opendatasicilia.it/slack/
Newsletter http://opendatasicilia.it/newsletter/
---
Hai ricevuto questo messaggio perché sei iscritto al gruppo "opendatasicilia" di Google Gruppi.
Per annullare l'iscrizione a questo gruppo e non ricevere più le sue email, invia un'email a [hidden email].
Per postare in questo gruppo, invia un'email a [hidden email].
Visita questo gruppo all'indirizzo https://groups.google.com/group/opendatasicilia.
Per visualizzare questa discussione sul Web, visita https://groups.google.com/d/msgid/opendatasicilia/CAHb%3DY5AmXAiUf7Tc-DcASr_oLqjPu3k9XfnXn6_P7BwH8rnKTA%40mail.gmail.com.
Per altre opzioni visita https://groups.google.com/d/optout.