djvu vs pdf, 5-я итерация

как найти книгу или статью? не поделится ли кто-нибудь программой? если у вас такой вопрос - значит, вам сюда!
Ответить
Аватара пользователя
ИСН
Робин Гуд
Сообщения: 8535
Зарегистрирован: Пт окт 10, 2003 5:32 pm
Контактная информация:

djvu vs pdf, 5-я итерация

Сообщение ИСН » Пт сен 08, 2006 9:13 am

Serge писал(а):Гм, а слабо их перегнать в djvu и залить на http://www.chemport.ru/lib.php ?
Серж, побойся бога, pdf (даже сканированный) перегонять в дежавю - только портить. И так хорош будет.

Аватара пользователя
pH<7
Сообщения: 4236
Зарегистрирован: Ср апр 21, 2004 6:48 pm
Контактная информация:

Сообщение pH<7 » Пт сен 08, 2006 11:00 am

Ну вот книжка Ларока (которая 2500 страниц крупным форматом, да) в djvu весит 32 мегабайта, а Марча (который 2100 страниц) в пдфе 165.

Так что я даже не знаю, кого тут бояться... :shock:
Carpe diem

Cherep
Сообщения: 23476
Зарегистрирован: Чт окт 30, 2003 9:22 am

Сообщение Cherep » Пт сен 08, 2006 11:21 am

Ну вот щас попросил комп перелопатить сканированый пдф на 250 страниц с гаком (17 метров) в djvu. Вобщем перелопачивалось с дефолтными настройками Lizardtech Virtual printer'a гдето в течении получаса (!). Ну, возможно зря я забыл убрать для печати 600 dpi.:oops:

Вес конечного файла 10 метров.

З. Ы. Оный принтер доступен у Chemister'a

Код: Выделить всё

http://chemister.da.ru/Download/download.htm

Аватара пользователя
ИСН
Робин Гуд
Сообщения: 8535
Зарегистрирован: Пт окт 10, 2003 5:32 pm
Контактная информация:

Сообщение ИСН » Пт сен 08, 2006 11:50 am

О как! Ну тогда уж я не знаю.

Cherep
Сообщения: 23476
Зарегистрирован: Чт окт 30, 2003 9:22 am

Сообщение Cherep » Пт сен 08, 2006 11:54 am

Ну джвю создавался специально для упаковки картинок, если я правильно понял. Но чёто медленно работало.

Аватара пользователя
rombach
Сообщения: 1869
Зарегистрирован: Пт май 14, 2004 6:20 pm

Сообщение rombach » Пт сен 08, 2006 11:36 pm

Уж если что-то и стоит сделать, так это распознавание текста. Согласитесь, найти вручную нужную фразу среди тысячи страниц нелегко. А так, что pdf (75мб), что djvu (50 мб) - один хрен. Почем у нас сегодня болванки DVD?

Sergey
Сообщения: 431
Зарегистрирован: Пт фев 04, 2005 3:35 pm

Сообщение Sergey » Пт сен 08, 2006 11:44 pm

rombach писал(а):Уж если что-то и стоит сделать, так это распознавание текста. Согласитесь, найти вручную нужную фразу среди тысячи страниц нелегко. А так, что pdf (75мб), что djvu (50 мб) - один хрен. Почем у нас сегодня болванки DVD?
Ну пока 150 страниц занимают при 300dpi всего 5 Мб. OCR можно тоже, но он плохо распознает

Аватара пользователя
rombach
Сообщения: 1869
Зарегистрирован: Пт май 14, 2004 6:20 pm

Сообщение rombach » Сб сен 09, 2006 12:06 am

Ну пока 150 страниц занимают при 300dpi всего 5 Мб. OCR можно тоже, но он плохо распознает
А 1500 страниц - 50 мб.
В акробате ОСR, выставленный на соотв. язык нормально распознает. Правда небыстро, прямо скажем.

Cherep
Сообщения: 23476
Зарегистрирован: Чт окт 30, 2003 9:22 am

Сообщение Cherep » Сб сен 09, 2006 12:19 am

rombach писал(а): А так, что pdf (75мб), что djvu (50 мб) - один хрен.
Ну не скажите. А 750 метров и 500? (для 10 томов) Да и разница то поболее будет.

Аватара пользователя
rombach
Сообщения: 1869
Зарегистрирован: Пт май 14, 2004 6:20 pm

Сообщение rombach » Сб сен 09, 2006 12:43 am

Одиннадцать лет назад купил я компьютер с охрененным диском. На 3(три!) гб. Правда тогда Губена было не достать. :D

Cherep
Сообщения: 23476
Зарегистрирован: Чт окт 30, 2003 9:22 am

Сообщение Cherep » Сб сен 09, 2006 1:36 am

Это верно, что диски нынче большие.
Только траффик и объём хостингов не резиновые и не бездонные :D Это вот чел из РХТУ может прийти, например, к челу из МИТХТ, они пивка попьют, пока с одного харда на другой льётся, даже по USB 1 (ужос, ужос, неделю квасить). А комуто с Камчатки с сервера в какойм-нибудь Люксимбурге скачивать, а комуто этот хостинг оплачивать и тп.

Аватара пользователя
pH<7
Сообщения: 4236
Зарегистрирован: Ср апр 21, 2004 6:48 pm
Контактная информация:

Сообщение pH<7 » Сб сен 09, 2006 6:01 am

Всё-таки, всё-таки, я повторяю, 2500 страниц у меня весит 32 МБ, и это самый большой djvu который у меня есть. Может вы как-то не так жмёте?
Carpe diem

Cherep
Сообщения: 23476
Зарегистрирован: Чт окт 30, 2003 9:22 am

Сообщение Cherep » Сб сен 09, 2006 8:00 am

В Ляроке относительно много пустого места на страницах. :roll: К томуже страниц там может и 2000, но в скане по 2 страницы на лист, ЕМНИП.

Sergey
Сообщения: 431
Зарегистрирован: Пт фев 04, 2005 3:35 pm

Сообщение Sergey » Сб сен 09, 2006 10:10 am

pH<7 писал(а):Всё-таки, всё-таки, я повторяю, 2500 страниц у меня весит 32 МБ, и это самый большой djvu который у меня есть. Может вы как-то не так жмёте?
Я сжимаю так, что получается при 300 dpi объем 1000 стр примерно 25 Мб, но никак не 50.

Ну вот. За сегодня сделал первый том он здесь. Формат Djvu (33 Мб) с фактическмм размером А4 и PDF с обрезкой (42 Мб). Соответственно эксперимент показал, зачем нужен Djvu? Возможно нужно применять более высокую степень сжатия, но тогда качество пострадает окончательно :(

Ответить

Вернуться в «обмен книгами, статьями, программами»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 7 гостей