Книгам - новую жизнь!

Ответить
tosyl
Сообщения: 205
Зарегистрирован: Сб дек 20, 2008 6:20 pm

Книгам - новую жизнь!

Сообщение tosyl » Пт сен 15, 2023 10:33 am

Время от времени для работы требуются старые книги по химии, почти любую из которых можно найти на просторах Интернета. Качество многих можно заметно улучшить, как показано на примере данной книги (Лернер И.М., Гонор А.А. Указатель препаративных синтезов неорганических, комплексных и элементорганических соединений). Программное обеспечение – Adobe Acrobat, Scan Tailor, FineReader.
У вас нет необходимых прав для просмотра вложений в этом сообщении.

derevyaha2
Сообщения: 293
Зарегистрирован: Чт мар 29, 2018 2:15 am

Re: Книгам - новую жизнь!

Сообщение derevyaha2 » Пт сен 15, 2023 9:12 pm

"финэридер" не надо, ибо распознавание в художественных текстах с целью запуска "говорилки", шоб глаза на фантастику не тратить, еще ладно. В случае кривого распознавания слова текст сохраняет смысл и без него. Но когда "финэридер" мне формулы на русский перевел, а я заметил спустя годы - это был номер. Экономить место. Ну да, мало 4 терабайт за сотню зеленых? А зачем потом плохими словами выражать свое возмущение по поводу дэжавю с распознаванием, апсолютно нечитабельного? Я пересканиваю книги, иногда те, что более 20 лет назад самолично сканил в 300 дпи. Но БЕЗ РАСПОЗНАВАНИЯ !!!
Хотите улучшить мертвый скан - пересканируйте сами, 600 дпи,grayscale, если опыт есть , можно настроить и black-white. Если уж совсем с бумажным исходником проблема, тогда пдф режете на tiff постранично и в фотошопе наводите красоту, вручную.
Удачи!
Я предпочитаю сканить. 20 лет назад продвинутый Эпсон в 300 дпи разворот книги срисовывал минуту-полторы. Сейчас разворот в 600 дпи сканируется 5 секунд. На книгу в 300 страниц уходит пара часов. И оно того стОит.

Аватара пользователя
Jeffry
Сообщения: 2559
Зарегистрирован: Пн май 12, 2008 5:31 pm

Re: Книгам - новую жизнь!

Сообщение Jeffry » Сб сен 16, 2023 5:56 pm

Причем тут FR? Его использую только для djvu. Для pdf он не нужен.
В акробате - свое распознавание, которое обычно хуже, чем дает FR.
Мне распознавание нужно для индексирования библиотеки всех книг, что есть у меня в наличии - для поисков.
В сети есть статьи, которые FR не распознает (распознает кашей из дублей строк), а акробат дает хорошее качество распознавания.
Это обычно в навороченных журналах, с водяными знаками и тиснениями, которые препятствуют распознаванию.
А переводить надо программами переводчиков, но редактировать перевод самому, вручную. Это ускоряет работу - удается переводить в день страниц 15-20, на что вручную уходит 2 недели.

Аватара пользователя
antabu
Сообщения: 6626
Зарегистрирован: Пн май 25, 2009 7:00 pm

Re: Книгам - новую жизнь!

Сообщение antabu » Сб сен 16, 2023 6:39 pm

У меня тоже текст распознан для поиска. Восьмым файнридером. Для распознания кириллицы лучше FR ничего нет. По крайней мере, так было.
Вот на либрусеке молодцы. Книги переводят в текстовые форматы. Но , в основном, художественную литературу. К сожалению, либрусек недоступен больше недели через общеизвестные зеркала.
"Я не видел людей страшней, чем толпа цвета хаки"

derevyaha2
Сообщения: 293
Зарегистрирован: Чт мар 29, 2018 2:15 am

Re: Книгам - новую жизнь!

Сообщение derevyaha2 » Вс сен 17, 2023 8:27 am

Jeffry, у меня тыщ 300 всякого разного рода книг. Даже не представляю, как это индексировать. Не объясните, как ваш поиск работает подробнее?

Аватара пользователя
Jeffry
Сообщения: 2559
Зарегистрирован: Пн май 12, 2008 5:31 pm

Re: Книгам - новую жизнь!

Сообщение Jeffry » Вс сен 17, 2023 10:39 am

Программа Архивариус 3000 создает индекс. По мере добавления книг (я индексирую книги, журналы и переводы статей) индексируются новые папки. Индекс требует довольно много места, так что надо иметь запас памяти у компа. На всякий случай есть ещё накопитель на 1.5 терабайта. Книги собраны по папкам с объемом DVD диска, чтобы можно было записать диск и перенести куда-то. Таких папок сейчас 27, а сколько книг, я не пересчитывал. Внутри папки-диска - деление по разделам, чтобы удобно было покопаться поиском вручную.
Со статьями классификация посложнее, чем с книгами. Не всегда просто определиться с разделом для той или иной статьи.

Аватара пользователя
antabu
Сообщения: 6626
Зарегистрирован: Пн май 25, 2009 7:00 pm

Re: Книгам - новую жизнь!

Сообщение antabu » Вс сен 17, 2023 1:31 pm

Текстовый поиск с помощью Total Commander (Журнальная версия2).doc
Статья была написана мною в 11 году для работы под ХР. Смысл- поиск заданного текста в файлах разных типов при помощи системы плагинов за 1 проход. С тех пор многие используемые программные компоненты обновились.
У меня под седьмой виндой, вроде, всё работает.
У вас нет необходимых прав для просмотра вложений в этом сообщении.
"Я не видел людей страшней, чем толпа цвета хаки"

Ответить

Вернуться в «Полезные материалы от участников форума»

Кто сейчас на конференции

Сейчас этот форум просматривают: Bing [Bot] и 7 гостей