Bona pràctica: extreure informació estructurada d'un document PDF per poder-la publicar en formats reutilitzables
De vegades, tot i que voldríem publicar la informació en formats reutilitzables, no diposem de les dades en un format estructurat.
És el cas de les aplicacions de gestió que només permeten l'exportació de documentació en format PDF. Si us trobeu davant d'aquest cas, us mostrem com convertir un document PDF que conté dades en format taula en un fitxer reutilitzable que podeu publicar al vostre portal de transparència.
En aquest exemple utilitzarem l'eina gratuïta ILovePDF, tot i que teniu a internet altres alternatives. Per motius de seguretat us recomanem que triueu una eina que no requereixi instal·lar cap programari en el vostre ordinador i que us permeti descarregar el fitxer resultant directament en un espai que tingueu al núvol.
Altres alternatives són:
Pas a pas
1. Localitza el document PDF on es trobi la informació en forma de taula.
2. Accediu a un convertidor gratuït en línia.
3. Seleccioneu i carregueu l'arxiu a convertir.
4. Com a mesura de seguretat general, si descarregueu el fitxer al vostre ordinador recordeu tenir activat l'antivirus. Recomanem que el descarregueu en un compte al núvol (per exemple de Google DRIVE).
5. Obriu el fitxer resultant i netegeu les imatges, les capçaleres i el text redactat per deixar només les taules.
6. La informació permet oferir una informació més gràfica? Genereu un format gràfic, descarregueu el gràfic com a imatge i incorporeu-lo en el portal de transparència.
7. Creu en cas necessari una fulla on especifiqueu el significat de cada columna i el significat dels codis que apareguin en la taula de dades.
Referències que apareixen al vídeo
-
Ítem Retribucions, indemnitzacions i dietes dels empleats públics
-
Complement de Google Drive per generar enllaços de descàrrega de fitxers: Download Link Generator