Публикации по теме 'pdf'


Обработка естественного языка в производстве: преобразование форматов документов PDF и Gutenberg в текст
В производственной обработке естественного языка (NLP ) критически важна быстрая предварительная обработка популярных форматов документов в текст. По оценкам, 70–85% мировых данных составляют текстовые (неструктурированные) данные. Большинство форматов бизнес-данных на английском и европейском языках в виде байтового текста, MS Word или Adobe PDF. [1] В сети организации отображаются документы в формате dobe Postscript Document Format ( PDF ). [2] В этом блоге я подробно..

Вопросы по теме 'pdf'

Скачал PDF - не могу открыть
Я разрешаю своим пользователям загружать PDF-файл, используя этот код: $db->Record['file'] содержит относительный путь к документу. Доступ к фиктивной странице, которая загружает PDF-файл, поэтому они фактически не видят «text.pdf» в...
1938 просмотров
schedule 03.04.2024

Как использовать Тессеракт
Я пытаюсь преобразовать изображения в файле PDF (каждая страница является отсканированным изображением) в текст, используя Tesseract (Tess4J) OCR, но это не работает: (см. комментарии в коде ) public static void main(String[] args) throws...
1748 просмотров
schedule 22.05.2024

Как нарисовать прямоугольник на странице PDF?
Я хочу отобразить страницу PDF в элементе управления в winforms, а затем перемещать прямоугольники по PDF, чтобы идентифицировать выбранные пользователем текстовые строки. Я пытаюсь отобразить PDF-файл с помощью элемента управления WebBrowser, но...
2513 просмотров
schedule 26.04.2024

Java открыть файл PDF на стороне клиента в Adobe Reader
В веб-приложении Java мне нужно открыть файл PDF на клиентском компьютере, который также доступен в общем доступе, без копирования на сторону клиента. Он должен открыться в Adobe Reader на стороне клиента.
1270 просмотров
schedule 14.03.2024

Создайте PDF-файл из шаблона PDF в Meteor
Я хочу создать PDF-файл из существующего «шаблона» PDF-файла. Например, «шаблон» в формате pdf будет иметь текст, поля и макет — все, что останется сделать, это заполнить «поля» данными. Я хотел бы заполнить эти поля соответствующими данными из...
1283 просмотров

ClassCastException конвертирует TIF в PDF с помощью iText
Я использую iText версии 5.5.6 (проверено также 5.3.4) с 64-битной Java 7 (1.7.0_71) в Windows 7. Вот пример кода @Test public void testConvert() throws Exception { try{ //Read the Tiff File...
691 просмотров
schedule 30.03.2024

Преобразование PDF в PNG с деактивированными слоями с помощью iTextSharp
Я использую iTextSharp. Я работаю над PDF-файлом, в котором есть то, что я называю многими «слоями». Поэтому, когда я открываю свой PDF-файл, я могу сделать свои «слои» видимыми или невидимыми, щелкнув маленький глаз слева от имени слоя. Я...
87 просмотров
schedule 24.03.2024

Используйте PDF-файл, который пользователь загружает динамически
Итак, я делаю этот проект, где мне нужно использовать PDF-файлы, которые люди загружают. Например, пользователь, у которого есть приложение, загружает случайный PDF-файл в Интернете, а затем я должен использовать этот PDF-файл в своем приложении....
80 просмотров
schedule 14.05.2024

Сравнение двух одинаковых файлов PDF не удается из-за трейлера
Я новичок здесь и немного опытен в Java. Я создаю простой модульный тест, в котором загружаю какой-нибудь pdf-файл и пытаюсь сравнить его с моим локальным файлом. final byte[] content = mockMvc.perform( get(URL,...
49 просмотров
schedule 24.03.2024

Я хочу распечатать веб-сайт и исключить нижний колонтитул с первой страницы
У меня есть веб-сайт, и я хочу создать PDF-файл с функцией печати. Мне нужно добавить нижний колонтитул на все страницы. Только первая страница должна быть без нижнего колонтитула. Я уже пробовал свойство отображения, которое не работает. Вы...
40 просмотров
schedule 20.03.2024

Есть ли способ в Javascript (узел) или Python извлечь только данные формы PDF и преобразовать их в JSON?
У меня есть PDF-файл, созданный с помощью Jotform, в котором есть заполняемые поля. Есть ли простой способ извлечь только данные из этих полей? Я просмотрел github, но не нашел инструмента, который может сделать это специально для данных формы....
43 просмотров
schedule 28.03.2024