Есть ли способ в Javascript (узел) или Python извлечь только данные формы PDF и преобразовать их в JSON?

У меня есть PDF-файл, созданный с помощью Jotform, в котором есть заполняемые поля. Есть ли простой способ извлечь только данные из этих полей? Я просмотрел github, но не нашел инструмента, который может сделать это специально для данных формы.

Имеют ли заполняемые PDF-файлы какой-либо легко извлекаемый формат, который дает ключ и значение для формы?

В качестве бонуса я также хотел бы иметь возможность писать в эту форму.

Мой вариант использования проходит через множество заполняемых PDF-файлов, которые представляют собой один и тот же PDF-файл, но разные значения, заполненные в формах. Я хочу создать инструмент для отображения одного значения поля из всех объединенных форм, а затем я могу редактировать эти поля формы.


person Adam Marciniak    schedule 12.01.2021    source источник
comment
Дублировать: Извлечь данные формы PDF с помощью JavaScript и написать в файл CSV   -  person Ouroborus    schedule 12.01.2021
comment
Формат PDF ISO определяет XFDF, который является форматом XML, в котором хранятся нужные вам пары ключ/значение. Затем вы можете использовать любой шаблон для преобразования из XML в JSON.   -  person Ryan    schedule 13.01.2021
comment
@Ouroborus, этот пост не отвечает на мой вопрос. Я не хочу, чтобы pdf запускал какой-либо JavaScript внутри него. Я хочу, чтобы узел извлекал данные.   -  person Adam Marciniak    schedule 13.01.2021