Книгам - новую жизнь!
Книгам - новую жизнь!
Время от времени для работы требуются старые книги по химии, почти любую из которых можно найти на просторах Интернета. Качество многих можно заметно улучшить, как показано на примере данной книги (Лернер И.М., Гонор А.А. Указатель препаративных синтезов неорганических, комплексных и элементорганических соединений). Программное обеспечение – Adobe Acrobat, Scan Tailor, FineReader.
У вас нет необходимых прав для просмотра вложений в этом сообщении.
-
- Сообщения: 293
- Зарегистрирован: Чт мар 29, 2018 2:15 am
Re: Книгам - новую жизнь!
"финэридер" не надо, ибо распознавание в художественных текстах с целью запуска "говорилки", шоб глаза на фантастику не тратить, еще ладно. В случае кривого распознавания слова текст сохраняет смысл и без него. Но когда "финэридер" мне формулы на русский перевел, а я заметил спустя годы - это был номер. Экономить место. Ну да, мало 4 терабайт за сотню зеленых? А зачем потом плохими словами выражать свое возмущение по поводу дэжавю с распознаванием, апсолютно нечитабельного? Я пересканиваю книги, иногда те, что более 20 лет назад самолично сканил в 300 дпи. Но БЕЗ РАСПОЗНАВАНИЯ !!!
Хотите улучшить мертвый скан - пересканируйте сами, 600 дпи,grayscale, если опыт есть , можно настроить и black-white. Если уж совсем с бумажным исходником проблема, тогда пдф режете на tiff постранично и в фотошопе наводите красоту, вручную.
Удачи!
Я предпочитаю сканить. 20 лет назад продвинутый Эпсон в 300 дпи разворот книги срисовывал минуту-полторы. Сейчас разворот в 600 дпи сканируется 5 секунд. На книгу в 300 страниц уходит пара часов. И оно того стОит.
Хотите улучшить мертвый скан - пересканируйте сами, 600 дпи,grayscale, если опыт есть , можно настроить и black-white. Если уж совсем с бумажным исходником проблема, тогда пдф режете на tiff постранично и в фотошопе наводите красоту, вручную.
Удачи!
Я предпочитаю сканить. 20 лет назад продвинутый Эпсон в 300 дпи разворот книги срисовывал минуту-полторы. Сейчас разворот в 600 дпи сканируется 5 секунд. На книгу в 300 страниц уходит пара часов. И оно того стОит.
Re: Книгам - новую жизнь!
Причем тут FR? Его использую только для djvu. Для pdf он не нужен.
В акробате - свое распознавание, которое обычно хуже, чем дает FR.
Мне распознавание нужно для индексирования библиотеки всех книг, что есть у меня в наличии - для поисков.
В сети есть статьи, которые FR не распознает (распознает кашей из дублей строк), а акробат дает хорошее качество распознавания.
Это обычно в навороченных журналах, с водяными знаками и тиснениями, которые препятствуют распознаванию.
А переводить надо программами переводчиков, но редактировать перевод самому, вручную. Это ускоряет работу - удается переводить в день страниц 15-20, на что вручную уходит 2 недели.
В акробате - свое распознавание, которое обычно хуже, чем дает FR.
Мне распознавание нужно для индексирования библиотеки всех книг, что есть у меня в наличии - для поисков.
В сети есть статьи, которые FR не распознает (распознает кашей из дублей строк), а акробат дает хорошее качество распознавания.
Это обычно в навороченных журналах, с водяными знаками и тиснениями, которые препятствуют распознаванию.
А переводить надо программами переводчиков, но редактировать перевод самому, вручную. Это ускоряет работу - удается переводить в день страниц 15-20, на что вручную уходит 2 недели.
Re: Книгам - новую жизнь!
У меня тоже текст распознан для поиска. Восьмым файнридером. Для распознания кириллицы лучше FR ничего нет. По крайней мере, так было.
Вот на либрусеке молодцы. Книги переводят в текстовые форматы. Но , в основном, художественную литературу. К сожалению, либрусек недоступен больше недели через общеизвестные зеркала.
Вот на либрусеке молодцы. Книги переводят в текстовые форматы. Но , в основном, художественную литературу. К сожалению, либрусек недоступен больше недели через общеизвестные зеркала.
"Я не видел людей страшней, чем толпа цвета хаки"
-
- Сообщения: 293
- Зарегистрирован: Чт мар 29, 2018 2:15 am
Re: Книгам - новую жизнь!
Jeffry, у меня тыщ 300 всякого разного рода книг. Даже не представляю, как это индексировать. Не объясните, как ваш поиск работает подробнее?
Re: Книгам - новую жизнь!
Программа Архивариус 3000 создает индекс. По мере добавления книг (я индексирую книги, журналы и переводы статей) индексируются новые папки. Индекс требует довольно много места, так что надо иметь запас памяти у компа. На всякий случай есть ещё накопитель на 1.5 терабайта. Книги собраны по папкам с объемом DVD диска, чтобы можно было записать диск и перенести куда-то. Таких папок сейчас 27, а сколько книг, я не пересчитывал. Внутри папки-диска - деление по разделам, чтобы удобно было покопаться поиском вручную.
Со статьями классификация посложнее, чем с книгами. Не всегда просто определиться с разделом для той или иной статьи.
Со статьями классификация посложнее, чем с книгами. Не всегда просто определиться с разделом для той или иной статьи.
Re: Книгам - новую жизнь!
У меня под седьмой виндой, вроде, всё работает.
У вас нет необходимых прав для просмотра вложений в этом сообщении.
"Я не видел людей страшней, чем толпа цвета хаки"
Кто сейчас на конференции
Сейчас этот форум просматривают: Bing [Bot] и 7 гостей