Michelangelo Taormina, in uno scambio di consigli via email, mi ha gentilmente inviato questo pdf dello stradario di Palermo (allegato).
-- Nella stessa !cella! (chiamala cella) del pdf c'è: nome via - cap - circoscrizione. Sarebbe utile, per tanti individui e per tanti scopi e per tante professioni, potere avere tutte le informazioni in colonne separate. Ricordo di un software trattato qui in questa mailing list tempo fa, ma non l'ho provato. Se è possibile farlo con un tool che fa tutto in automatico, pensavo che questa tipologia di dataset potrebbero popolare un repository open data di opendatasicilia (ma su questo argomento in seguito si aprirà un thread dedicato). Grazie dell'attenzione ciro Sito: http://opendatasicilia.it Facebook: https://www.facebook.com/groups/opendatasicilia/ twitter: http://twitter.com/opendatasicilia Slack: http://opendatasicilia.it/slack/ Newsletter http://opendatasicilia.it/newsletter/ --- Hai ricevuto questo messaggio perché sei iscritto al gruppo "opendatasicilia" di Google Gruppi. Per annullare l'iscrizione a questo gruppo e non ricevere più le sue email, invia un'email a [hidden email]. Per postare in questo gruppo, invia un'email a [hidden email]. Visita questo gruppo all'indirizzo https://groups.google.com/group/opendatasicilia. Per visualizzare questa discussione sul Web, visita https://groups.google.com/d/msgid/opendatasicilia/1995d68f-2424-49e1-ac1a-78a250ac7d74%40googlegroups.com. Per altre opzioni visita https://groups.google.com/d/optout. stradario palermo.pdf (1M) Download Attachment |
Administrator
|
2017-01-17 7:13 GMT+01:00 cirospat <[hidden email]>:
https://medium.com/open-data-stories/estrarre-tabelle-da-pdf-con-molte-pagine-122c2823a529#.mj40z943z Se hai difficoltà, fischia ___________________ Andrea Borruso website: http://blog.spaziogis.it 38° 7' 48" N, 13° 21' 9" E, EPSG:4326 ___________________ "cercare e saper riconoscere chi e cosa, in mezzo all’inferno, non è inferno, e farlo durare, e dargli spazio" Italo Calvino Sito: http://opendatasicilia.it Facebook: https://www.facebook.com/groups/opendatasicilia/ twitter: http://twitter.com/opendatasicilia Slack: http://opendatasicilia.it/slack/ Newsletter http://opendatasicilia.it/newsletter/ --- Hai ricevuto questo messaggio perché sei iscritto al gruppo "opendatasicilia" di Google Gruppi. Per annullare l'iscrizione a questo gruppo e non ricevere più le sue email, invia un'email a [hidden email]. Per postare in questo gruppo, invia un'email a [hidden email]. Visita questo gruppo all'indirizzo https://groups.google.com/group/opendatasicilia. Per visualizzare questa discussione sul Web, visita https://groups.google.com/d/msgid/opendatasicilia/CAHEdGZMT6tYA9H9maertVed2otyeOvQmqb_MtXvwSzt-n7PGwQ%40mail.gmail.com. Per altre opzioni visita https://groups.google.com/d/optout. |
Andrea grazie della velocità... il problema (mio per ora) è che tutti i dati si trovano dentro un unica riga (unica cella se paragonato ad un formato tabellare) dentro il formato pdf, caso diverso da quello da te affrontato nel post su Medium che riguardava i beni immobili comunali per i quali il pdf "sezionava" la diversa tipologia di dati in più colonne, almeno credo così dalla visione dei 2 diversi pdf.... ma può anche darsi che mi sbaglicredo che sia necessario qualche comando specifico che stacchi i diversi dati: esempio: questa è la presentazione del contenuto di ogni singola riga del pdf dello stradario ABBATE (cortile) - Nel corso dei Mille, al civ. 1328 - 1/10 - Circ. Seconda - c.a.p. 90122. L'obiettivo è staccare "ABBATE (cortile)" da "Nel corso dei Mille" da "al civ. 1328" da "Circ. Seconda" da "c.a.p. 90122" quindi arrivare ad ottenere il dato atomico separato dagli altri dati atomici ed in più operando una cancellazione di:
Credo che si sia un po di lavoretto oltre alla divisione dei dati per colonne, se si vuole ottenere un dataset quanto più pulito e riusabile. Grazie per l'attenzione ______________ Il giorno 17 gennaio 2017 08:20, andy <[hidden email]> ha scritto:
Sito: http://opendatasicilia.it Facebook: https://www.facebook.com/groups/opendatasicilia/ twitter: http://twitter.com/opendatasicilia Slack: http://opendatasicilia.it/slack/ Newsletter http://opendatasicilia.it/newsletter/ --- Hai ricevuto questo messaggio perché sei iscritto al gruppo "opendatasicilia" di Google Gruppi. Per annullare l'iscrizione a questo gruppo e non ricevere più le sue email, invia un'email a [hidden email]. Per postare in questo gruppo, invia un'email a [hidden email]. Visita questo gruppo all'indirizzo https://groups.google.com/group/opendatasicilia. Per visualizzare questa discussione sul Web, visita https://groups.google.com/d/msgid/opendatasicilia/CAJyZuPJLzkGYPE1i%3DgfGRNYzOpEyDzpdOLZ1Hu1%2BXRUe-f%3DkUA%40mail.gmail.com. Per altre opzioni visita https://groups.google.com/d/optout. |
Administrator
|
2017-01-17 9:34 GMT+01:00 ciro spataro <[hidden email]>:
Inizia a tirare fuori la mega tabella così per come è. E poi ci lavoriamo ___________________ Andrea Borruso website: http://blog.spaziogis.it 38° 7' 48" N, 13° 21' 9" E, EPSG:4326 ___________________ "cercare e saper riconoscere chi e cosa, in mezzo all’inferno, non è inferno, e farlo durare, e dargli spazio" Italo Calvino Sito: http://opendatasicilia.it Facebook: https://www.facebook.com/groups/opendatasicilia/ twitter: http://twitter.com/opendatasicilia Slack: http://opendatasicilia.it/slack/ Newsletter http://opendatasicilia.it/newsletter/ --- Hai ricevuto questo messaggio perché sei iscritto al gruppo "opendatasicilia" di Google Gruppi. Per annullare l'iscrizione a questo gruppo e non ricevere più le sue email, invia un'email a [hidden email]. Per postare in questo gruppo, invia un'email a [hidden email]. Visita questo gruppo all'indirizzo https://groups.google.com/group/opendatasicilia. Per visualizzare questa discussione sul Web, visita https://groups.google.com/d/msgid/opendatasicilia/CAHEdGZOsAvfGiwyzVM-V7SVZbKHL6F9%3DR9QQFV6O2NL%2BcwR4ow%40mail.gmail.com. Per altre opzioni visita https://groups.google.com/d/optout. |
Administrator
|
Ecco un primo risultato https://docs.google.com/spreadsheets/d/1HJxkNZQjTLoAdNgtstjqqiUsyV_9h15iCWjS8fUzz2M/edit?usp=sharing Due cose sicuramente rimangono:
Ma la mia pausa pranzo è finita :) Ciro secondo me se chiedi all’ufficio toponomastica ti da il file ben separato. Andrea Borruso “cercare e saper riconoscere chi e cosa, Italo Calvino Sito: http://opendatasicilia.it Facebook: https://www.facebook.com/groups/opendatasicilia/ twitter: http://twitter.com/opendatasicilia Slack: http://opendatasicilia.it/slack/ Newsletter http://opendatasicilia.it/newsletter/ --- Hai ricevuto questo messaggio perché sei iscritto al gruppo "opendatasicilia" di Google Gruppi. Per annullare l'iscrizione a questo gruppo e non ricevere più le sue email, invia un'email a [hidden email]. Per postare in questo gruppo, invia un'email a [hidden email]. Visita questo gruppo all'indirizzo https://groups.google.com/group/opendatasicilia. Per visualizzare questa discussione sul Web, visita https://groups.google.com/d/msgid/opendatasicilia/CAHEdGZOjr%3DWp3d4Z5L3p6dhLqeyLO6CgL99AVaNZBcJeha_rAg%40mail.gmail.com. Per altre opzioni visita https://groups.google.com/d/optout. |
grazie Andrea per l'esperimento di trasformazione in tabella seria. Si posso chiedere all'Ufficio Toponomastica, hai ragione. Volevo solo rendere subito riusabili quei dati, in un formato tabellare strutturato. Grazie Il giorno 17 gennaio 2017 14:10, andy <[hidden email]> ha scritto:
Sito: http://opendatasicilia.it Facebook: https://www.facebook.com/groups/opendatasicilia/ twitter: http://twitter.com/opendatasicilia Slack: http://opendatasicilia.it/slack/ Newsletter http://opendatasicilia.it/newsletter/ --- Hai ricevuto questo messaggio perché sei iscritto al gruppo "opendatasicilia" di Google Gruppi. Per annullare l'iscrizione a questo gruppo e non ricevere più le sue email, invia un'email a [hidden email]. Per postare in questo gruppo, invia un'email a [hidden email]. Visita questo gruppo all'indirizzo https://groups.google.com/group/opendatasicilia. Per visualizzare questa discussione sul Web, visita https://groups.google.com/d/msgid/opendatasicilia/CAJyZuPLa6VN_3tL1JRwY%3DmS-twrf7vgGcwnibam%3DOa%3DaQzCsgg%40mail.gmail.com. Per altre opzioni visita https://groups.google.com/d/optout. |
per estrarre dati da pdf segnalo anche versione aggratis di tabula ospitata su server ondata funziona semplicemente: 1) carichi il pdf 2) selezioni tabella (e) da estrarre 3) clicchi estrai Il giorno 17 gennaio 2017 15:03, ciro spataro <[hidden email]> ha scritto:
Sito: http://opendatasicilia.it Facebook: https://www.facebook.com/groups/opendatasicilia/ twitter: http://twitter.com/opendatasicilia Slack: http://opendatasicilia.it/slack/ Newsletter http://opendatasicilia.it/newsletter/ --- Hai ricevuto questo messaggio perché sei iscritto al gruppo "opendatasicilia" di Google Gruppi. Per annullare l'iscrizione a questo gruppo e non ricevere più le sue email, invia un'email a [hidden email]. Per postare in questo gruppo, invia un'email a [hidden email]. Visita questo gruppo all'indirizzo https://groups.google.com/group/opendatasicilia. Per visualizzare questa discussione sul Web, visita https://groups.google.com/d/msgid/opendatasicilia/CAMp3PFdUYknQYJM1%2Bh5O9EX9%3Dv7GCzG9rAUp0BAN1YQZeDSkLA%40mail.gmail.com. Per altre opzioni visita https://groups.google.com/d/optout. |
In reply to this post by Andrea Borruso
partendo da questa tabella Il giorno 17 gennaio 2017 14:10, andy <[hidden email]> ha scritto:
come dice giustamente andy, la strada migliore è splittare
è gli dico splittala in nuove colonne ogni volte che c’è il trattino - questa cosa splitta il valore in quattro valori. lo trovate funzionante qui https://docs.google.com/spreadsheets/d/1HJxkNZQjTLoAdNgtstjqqiUsyV_9h15iCWjS8fUzz2M/edit#gid=0 --- Sito: http://opendatasicilia.it Facebook: https://www.facebook.com/groups/opendatasicilia/ twitter: http://twitter.com/opendatasicilia Slack: http://opendatasicilia.it/slack/ Newsletter http://opendatasicilia.it/newsletter/ --- Hai ricevuto questo messaggio perché sei iscritto al gruppo "opendatasicilia" di Google Gruppi. Per annullare l'iscrizione a questo gruppo e non ricevere più le sue email, invia un'email a [hidden email]. Per postare in questo gruppo, invia un'email a [hidden email]. Visita questo gruppo all'indirizzo https://groups.google.com/group/opendatasicilia. Per visualizzare questa discussione sul Web, visita https://groups.google.com/d/msgid/opendatasicilia/CAMp3PFf-1jQS9OpNHPuS0PR%2B-iU0TE-2N_TYp-osMM_%2Bgy4LSw%40mail.gmail.com. Per altre opzioni visita https://groups.google.com/d/optout. |
grazie Andrea e Andrea Nelson
-- per i vostri suggerimenti utili a breve questa tabella sarà molto riusabile __ Ciro Il giorno 17 gennaio 2017 19:17, Andrea Nelson Mauro | Dataninja.it <[hidden email]> ha scritto:
Sito: http://opendatasicilia.it Facebook: https://www.facebook.com/groups/opendatasicilia/ twitter: http://twitter.com/opendatasicilia Slack: http://opendatasicilia.it/slack/ Newsletter http://opendatasicilia.it/newsletter/ --- Hai ricevuto questo messaggio perché sei iscritto al gruppo "opendatasicilia" di Google Gruppi. Per annullare l'iscrizione a questo gruppo e non ricevere più le sue email, invia un'email a [hidden email]. Per postare in questo gruppo, invia un'email a [hidden email]. Visita questo gruppo all'indirizzo https://groups.google.com/group/opendatasicilia. Per visualizzare questa discussione sul Web, visita https://groups.google.com/d/msgid/opendatasicilia/CAJyZuPKY-VHNAt4%3Di4BHTZiB%3D_ZdWzsaN8KRSb7EbTgu1L8ZVg%40mail.gmail.com. Per altre opzioni visita https://groups.google.com/d/optout. |
Administrator
|
2017-01-17 19:41 GMT+01:00 ciro spataro <[hidden email]>: a breve questa tabella sarà molto riusabile Ciro, noi non vogliamo creare la tabella :) Ste cose si imparano, solo se ci si sbatte un po'. Se ci dici "non è cosa mia", la porto produzione. Però è un peccato. ___________________ Andrea Borruso website: http://blog.spaziogis.it 38° 7' 48" N, 13° 21' 9" E, EPSG:4326 ___________________ "cercare e saper riconoscere chi e cosa, in mezzo all’inferno, non è inferno, e farlo durare, e dargli spazio" Italo Calvino Sito: http://opendatasicilia.it Facebook: https://www.facebook.com/groups/opendatasicilia/ twitter: http://twitter.com/opendatasicilia Slack: http://opendatasicilia.it/slack/ Newsletter http://opendatasicilia.it/newsletter/ --- Hai ricevuto questo messaggio perché sei iscritto al gruppo "opendatasicilia" di Google Gruppi. Per annullare l'iscrizione a questo gruppo e non ricevere più le sue email, invia un'email a [hidden email]. Per postare in questo gruppo, invia un'email a [hidden email]. Visita questo gruppo all'indirizzo https://groups.google.com/group/opendatasicilia. Per visualizzare questa discussione sul Web, visita https://groups.google.com/d/msgid/opendatasicilia/CAHEdGZPPW4TCocKTKgJ_aur%2Bk5gDO-TsE%2Bvp2w4xi7JfbtP7rw%40mail.gmail.com. Per altre opzioni visita https://groups.google.com/d/optout. |
Stavo solo cercando di aiutare una persona che chiedeva Supporto per riusare i dati del PDF. Appena ho un po di tempo approfondisco. Promesso. Grazie di cuore dell'utilissimo aiuto che avete dato. Il 17/gen/2017 19:53, "andy" <[hidden email]> ha scritto:
Sito: http://opendatasicilia.it Facebook: https://www.facebook.com/groups/opendatasicilia/ twitter: http://twitter.com/opendatasicilia Slack: http://opendatasicilia.it/slack/ Newsletter http://opendatasicilia.it/newsletter/ --- Hai ricevuto questo messaggio perché sei iscritto al gruppo "opendatasicilia" di Google Gruppi. Per annullare l'iscrizione a questo gruppo e non ricevere più le sue email, invia un'email a [hidden email]. Per postare in questo gruppo, invia un'email a [hidden email]. Visita questo gruppo all'indirizzo https://groups.google.com/group/opendatasicilia. Per visualizzare questa discussione sul Web, visita https://groups.google.com/d/msgid/opendatasicilia/CAJyZuP%2BHRnm5GiHuQBF5%3DjHOo_CDMVrLHjj6EuD7MciJY-5T-w%40mail.gmail.com. Per altre opzioni visita https://groups.google.com/d/optout. |
Administrator
|
2017-01-17 22:27 GMT+01:00 ciro spataro <[hidden email]>:
Ok, ho aggiunto due colonne che derivano dall'analisi della prima: il "nome" e il "tipo". Ho usato un'altra cosa troppo comoda per lavorare sui testi, le espressioni regolari. Ma non ce la faccio adesso con le spiegazioni :( Grazie al tipo si possono fare un po' di conti, come ad esempio:
Lo split di Andrea Nelson è comodo, ma per come è fatto il file è anche da usare con cautela, perché non è sempre un separatore. Un po' meglio sarebbe usare come separatore solo l'ultimo dei caratteri "-". Notte ___________________ Andrea Borruso website: http://blog.spaziogis.it 38° 7' 48" N, 13° 21' 9" E, EPSG:4326 ___________________ "cercare e saper riconoscere chi e cosa, in mezzo all’inferno, non è inferno, e farlo durare, e dargli spazio" Italo Calvino Sito: http://opendatasicilia.it Facebook: https://www.facebook.com/groups/opendatasicilia/ twitter: http://twitter.com/opendatasicilia Slack: http://opendatasicilia.it/slack/ Newsletter http://opendatasicilia.it/newsletter/ --- Hai ricevuto questo messaggio perché sei iscritto al gruppo "opendatasicilia" di Google Gruppi. Per annullare l'iscrizione a questo gruppo e non ricevere più le sue email, invia un'email a [hidden email]. Per postare in questo gruppo, invia un'email a [hidden email]. Visita questo gruppo all'indirizzo https://groups.google.com/group/opendatasicilia. Per visualizzare questa discussione sul Web, visita https://groups.google.com/d/msgid/opendatasicilia/CAHEdGZO3i1dDoA8LCuff%3DdXGSYTMudsoBP3mRvZL5AfgmtCqhg%40mail.gmail.com. Per altre opzioni visita https://groups.google.com/d/optout. |
grazie molto Andrea
-- __ Il giorno 17 gennaio 2017 22:46, andy <[hidden email]> ha scritto:
Sito: http://opendatasicilia.it Facebook: https://www.facebook.com/groups/opendatasicilia/ twitter: http://twitter.com/opendatasicilia Slack: http://opendatasicilia.it/slack/ Newsletter http://opendatasicilia.it/newsletter/ --- Hai ricevuto questo messaggio perché sei iscritto al gruppo "opendatasicilia" di Google Gruppi. Per annullare l'iscrizione a questo gruppo e non ricevere più le sue email, invia un'email a [hidden email]. Per postare in questo gruppo, invia un'email a [hidden email]. Visita questo gruppo all'indirizzo https://groups.google.com/group/opendatasicilia. Per visualizzare questa discussione sul Web, visita https://groups.google.com/d/msgid/opendatasicilia/CAJyZuPLBUc1BMwwHF-KO1F%3DC49UFwkhJ5Yb-KBZPaUKX7JQofw%40mail.gmail.com. Per altre opzioni visita https://groups.google.com/d/optout. |
Free forum by Nabble | Edit this page |