Nel 2007, un PDF inviato dal Ministero della Difesa del Regno Unito riguardo alla morte di un cittadino iracheno si è scoperto contenere il nome completo di un ufficiale dell'intelligence sotto copertura nei metadati, un'informazione accuratamente evitata nel testo visibile. Incidenti come questo accadono regolarmente. Ecco cosa potrebbero nascondere i tuoi PDF.
Cosa sono i metadati PDF?
I metadati PDF sono dati relativi al documento memorizzati all'interno del file ma non visualizzati in alcuna pagina. Nella specifica PDF esistono due sistemi di metadati:
Document Information Dictionary
Il formato originale dei metadati PDF. Un dizionario chiave-valore con campi come Title, Author, Subject, Keywords, Creator, Producer, CreationDate e ModDate.
XMP (Extensible Metadata Platform)
Uno standard Adobe che utilizza XML incorporato. Contiene tutti gli stessi campi del document info dictionary, ma può anche contenere namespace personalizzati con dati arbitrariamente dettagliati, tra cui GPS, gestione dei diritti e cronologia del flusso di lavoro.
Cosa possono rivelare i metadati
Campo
Autore
Valore di esempio
John Smith
Rischio per la privacy
Rivela l'identità reale in invii anonimi, documenti di informatori o proposte riservate.
Campo
Azienda
Valore di esempio
Acme Legal LLP
Rischio per la privacy
Espone l'organizzazione mittente in offerte sigillate, feedback anonimi o bozze protette da NDA.
Campo
Creator / Producer
Valore di esempio
Microsoft Word 16.0
Rischio per la privacy
Rivela lo stack software. Alcune versioni di Word incorporano il nome utente di Windows nel campo Producer.
Campo
CreationDate
Valore di esempio
2024-03-15T09:47:22
Rischio per la privacy
Può contraddire le tempistiche dichiarate in controversie legali o rivelare quando un documento “definitivo” è stato effettivamente creato.
Campo
Cronologia delle revisioni
Valore di esempio
Title: CONFIDENTIAL DRAFT v3
Rischio per la privacy
I titoli precedenti del documento o i campi oggetto possono contenere informazioni rimosse dal documento visibile.
Campo
Miniature incorporate
Valore di esempio
Immagine di anteprima della pagina 1
Rischio per la privacy
L'immagine in miniatura incorporata potrebbe mostrare una versione della pagina prima dell'applicazione delle revisioni.
Campo
Metadati GPS / di scansione
Valore di esempio
51,5074° N, 0,1278° O
Rischio per la privacy
I documenti scansionati tramite app PDF per dispositivi mobili possono incorporare le coordinate GPS del luogo in cui è stata effettuata la scansione.
Campo
Modifiche tracciate (tramite Word)
Valore di esempio
Testo eliminato: "l'onorario è di $450,000"
Rischio per la privacy
Se un file Word con modifiche tracciate viene salvato come PDF, il testo eliminato/modificato potrebbe essere incorporato nella struttura del PDF.
Come visualizzare subito i metadati del tuo PDF
Prima di rimuovere i metadati, è utile vedere cosa è effettivamente incorporato nel tuo file:
Adobe Acrobat Reader
File → Proprietà → scheda Descrizione. Controlla anche la scheda Personalizzato per eventuali campi aggiuntivi.
Browser (Chrome / Firefox / Edge)
Apri il PDF nel browser, poi vai nella barra degli indirizzi e aggiungi ?view=properties alla fine. In alternativa, usa il pannello delle proprietà PDF del visualizzatore PDF integrato nel browser, se disponibile.
Riga di comando (ExifTool)
Esegui: exiftool filename.pdf — ExifTool è gratuito, multipiattaforma e mostra tutti i campi incorporati, inclusi i namespace XMP.
EditoraPDF — strumento Edit Metadata
Carica il tuo PDF nello strumento Edit Metadata. Tutti i valori dei campi correnti vengono mostrati prima che tu apporti qualsiasi modifica.
Come rimuovere i metadati da un PDF
Usa lo strumento Sanitize PDF
Apri EditoraPDF → Sanitize PDF. Questo elimina tutti i campi del Document Information Dictionary, i metadati XMP, le miniature incorporate, le annotazioni nascoste e gli script.
Oppure cancella manualmente i singoli campi
Se vuoi conservare alcuni metadati (come il titolo) rimuovendone altri, usa Edit Metadata per cancellare o aggiornare campi specifici.
Verifica il risultato
Apri il PDF sanificato in Acrobat o eseguici ExifTool. I dati Author, Creator e XMP dovrebbero ora essere assenti o vuoti.
Per la massima privacy, applica anche la redazione
Se il documento contiene contenuti visibili sensibili, combina la sanificazione con Redact PDF per garantire che né il contenuto visibile né i metadati nascosti rivelino informazioni.
Quando dovresti rimuovere i metadati PDF?
Domande Frequenti
Cosa sono i metadati PDF?+
Dati nascosti incorporati nella struttura del file: nome dell'autore, data di creazione, software utilizzato, parole chiave, posizione GPS, cronologia delle revisioni e altro ancora, nessuno dei quali visibile sulla pagina.
I metadati PDF possono rivelare informazioni sensibili?+
Sì: hanno esposto le identità di agenti sotto copertura, rivelato gli autori reali di documenti anonimi, svelato i nomi delle aziende in offerte sigillate e mostrato testo eliminato tramite le modifiche tracciate.
Come rimuovo i metadati da un PDF?+
Usa lo strumento Sanitize PDF di EditoraPDF. Elimina tutti i campi delle Document Info, i metadati XMP, le miniature incorporate, le annotazioni nascoste e gli script, interamente nel tuo browser, senza alcun caricamento sul server.
Stampare come PDF rimuove i metadati?+
Per lo più, ma non in modo affidabile. Il driver di stampa potrebbe incorporare i propri metadati. La sanificazione dedicata è l'unico modo per garantire un file pulito.
Elimina i dati nascosti dal tuo PDF
Usa lo strumento gratuito Sanitize PDF: rimuove tutti i metadati, le annotazioni nascoste e le miniature incorporate localmente nel tuo browser.
Gratis · Nessuna registrazione · Nessun caricamento sul server