Skip to main content
Конфіденційність і безпека

Метадані PDF: що це таке і як їх видалити

Ваш файл може непомітно для вас розкривати ваше ім'я, компанію та історію змін

Автор: EditoraPDF Team

У 2007 році PDF, поданий Міністерством оборони Великої Британії щодо смерті іракського громадянина, як виявилося, містив повне ім'я офіцера розвідки під прикриттям у метаданих — інформацію, якої ретельно уникали у видимому тексті. Такі інциденти трапляються регулярно. Ось що можуть приховувати ваші PDF.

Що таке метадані PDF?

Метадані PDF — це дані про документ, що зберігаються всередині файлу, але не відображаються на жодній сторінці. У специфікації PDF є дві системи метаданих:

Словник інформації про документ (Document Information Dictionary)

Початковий формат метаданих PDF. Словник «ключ-значення» з полями на кшталт Title, Author, Subject, Keywords, Creator, Producer, CreationDate та ModDate.

XMP (Extensible Metadata Platform)

Стандарт Adobe, що використовує вбудований XML. Містить усі ті самі поля, що й словник інформації про документ, але також може зберігати власні простори імен із довільно детальними даними — зокрема GPS, керування правами та історію робочого процесу.

Що можуть розкрити метадані

Поле

Author

Приклад значення

John Smith

Ризик для конфіденційності

Розкриває справжню особу в анонімних поданнях, документах викривачів або конфіденційних пропозиціях.

Поле

Company

Приклад значення

Acme Legal LLP

Ризик для конфіденційності

Розкриває організацію-подавача в запечатаних заявках, анонімних відгуках або захищених NDA чернетках.

Поле

Creator / Producer

Приклад значення

Microsoft Word 16.0

Ризик для конфіденційності

Розкриває набір програмного забезпечення. Деякі версії Word вбудовують ім'я користувача Windows у поле Producer.

Поле

CreationDate

Приклад значення

2024-03-15T09:47:22

Ризик для конфіденційності

Може суперечити заявленим часовим рамкам у юридичних спорах або розкривати, коли насправді було створено «“остаточний”» документ.

Поле

Історія змін

Приклад значення

Title: CONFIDENTIAL DRAFT v3

Ризик для конфіденційності

Попередні назви документа або поля теми можуть містити інформацію, вилучену з видимого документа.

Поле

Вбудовані ескізи

Приклад значення

Зображення попереднього перегляду сторінки 1

Ризик для конфіденційності

Вбудоване зображення-ескіз може показувати версію сторінки до застосування редагувань.

Поле

Метадані GPS / сканування

Приклад значення

51,5074° пн. ш., 0,1278° зх. д.

Ризик для конфіденційності

Сканові документи, оброблені через мобільні застосунки PDF, можуть вбудовувати GPS-координати місця, де було зроблено сканування.

Поле

Відстежувані зміни (через Word)

Приклад значення

Видалений текст: "the fee is $450,000"

Ризик для конфіденційності

Якщо файл Word із відстежуваними змінами зберегти як PDF, видалений/змінений текст може бути вбудований у структуру PDF.

Як переглянути метадані свого PDF прямо зараз

Перед видаленням метаданих корисно побачити, що насправді вбудовано у ваш файл:

Adobe Acrobat Reader

File → Properties → вкладка Description. Також перевірте вкладку Custom на наявність додаткових полів.

Браузер (Chrome / Firefox / Edge)

Відкрийте PDF у браузері, потім перейдіть до адресного рядка та додайте ?view=properties в кінці. Як альтернатива, скористайтеся вбудованою панеллю властивостей PDF у переглядачі браузера, якщо вона доступна.

Командний рядок (ExifTool)

Виконайте: exiftool filename.pdf — ExifTool безкоштовний, кросплатформний і показує всі вбудовані поля, зокрема простори імен XMP.

EditoraPDF — інструмент Edit Metadata

Завантажте свій PDF до інструмента Edit Metadata. Усі поточні значення полів відображаються перед тим, як ви внесете будь-які зміни.

Як видалити метадані з PDF

1

Скористайтеся інструментом Sanitize PDF

Відкрийте EditoraPDF → Sanitize PDF. Це вилучає всі поля словника інформації про документ (Document Information Dictionary), метадані XMP, вбудовані ескізи, приховані анотації та скрипти.

2

Або вручну очистіть окремі поля

Якщо ви хочете зберегти деякі метадані (як-от назву), видаливши інші, скористайтеся Edit Metadata, щоб очистити або оновити конкретні поля.

3

Перевірте результат

Відкрийте санітизований PDF в Acrobat або запустіть для нього ExifTool. Дані Author, Creator і XMP тепер мають бути відсутні або порожні.

4

Для максимальної конфіденційності також застосуйте редагування (редакцію)

Якщо документ містить конфіденційний видимий вміст, поєднайте санітизацію з Redact PDF, щоб гарантувати, що ні видимий вміст, ні приховані метадані не розкриватимуть інформацію.

Коли слід видаляти метадані PDF?

Перед поданням документа анонімно або під псевдонімом
Перед надсиланням протилежній стороні (адвокату) у судовому провадженні
Перед публікацією PDF на загальнодоступних вебсайтах або порталах
Перед поданням тендерних, конкурсних заявок або заявок на гранти
Перед поширенням будь-якого документа за межами вашої організації
Перед архівуванням документів з персональними даними (відповідність GDPR)
Після сканування документів мобільним пристроєм (ризик GPS)
Перед поширенням документів викривачів або документів для захисту джерел

Поширені запитання

Що таке метадані PDF?+

Приховані дані, вбудовані у структуру файлу: ім'я автора, дата створення, використане програмне забезпечення, ключові слова, місцезнаходження GPS, історія змін тощо — нічого з цього не видно на сторінці.

Чи можуть метадані PDF розкривати конфіденційну інформацію?+

Так — вони розкривали особи агентів під прикриттям, призводили до витоку справжніх авторів анонімних документів, розкривали назви компаній у запечатаних заявках і показували видалений текст через відстежувані зміни.

Як видалити метадані з PDF?+

Скористайтеся інструментом Sanitize PDF від EditoraPDF. Він вилучає всі поля інформації про документ, метадані XMP, вбудовані ескізи, приховані анотації та скрипти — повністю у вашому браузері, без завантаження на сервер.

Чи видаляє друк у PDF метадані?+

Здебільшого так, але не надійно. Драйвер друку може вбудувати власні метадані. Спеціальна санітизація — єдиний спосіб гарантувати чистий файл.

Вилучіть приховані дані зі свого PDF

Скористайтеся безкоштовним інструментом Sanitize PDF — він видаляє всі метадані, приховані анотації та вбудовані ескізи локально у вашому браузері.

Безкоштовно · Без реєстрації · Без завантаження на сервер