Сейчас на борту: 
H-44,
Strannik4465,
Боярин,
клерк,
Ольгерд
   [Подробнее...]

Страниц: 1

#1 05.01.2010 13:12:14

Глокий Куздр
Гость




jacar'овские заморочки

Знаю что некоторые участники форума очень серьёзно работают с этим ресурсом. Я сам лишь пару раз побаловался, но тем не менее, за пару часов работы с jacar, стали ясны некоторые неудобства в работе с архивом (что никак не умаляет подвига японских товарищей - низкий им поклон за такие подарки).
Нашел пару, пусть не слишком изящных, но вполне действенных решений.

Момент первый. Вытаскивание картинок.

Возможно кому-то проще их выковыривать из DjVU-файла посредством фотошопа, я лишь предложу свой способ.

Итак, по умолчанию мы видим документ через DjVU-утилиту встроенную в браузер (идентичную обычным просмоторщикам DjVU-файлов). Видим интересующую картинку в документе, - запоминаем её номер
1. Переходим в режим "Jpeg". Выбираем искомую страницу документа.
2. Выставляем увеличение 300 или 600 %. Видим левый верхний угол изображения в нужном увеличении, причем   сохранить можем только этот уголок в разрешении 800х600. Это неинтересно.
3. Кликаем правой кнопкой мыши на картинку.
4. Жмём "свойства". В свойствах есть строка "адрес:". Копируем этот адрес.
5. Вставляем этот адрес в менеджер закачек (например download master), но, прежде чем начать закачку, вносим правку в URL.
Взятый URL выглядит вот так (к примеру):

http://jpeg.jacar.go.jp/lizardtech/iserv/getimage?cat=Jacar&item=a1201800/bet01800/0876/index.djvu&wid=800&hei=600&lev=3&cp=0.5,0.5&method=fit&oif=jpeg&page=0

6. Важное выделено жирным. Если вначале вы выбрали увеличение 300% то оптимально заменить цифирку 600 (в URL) на 4096 (думаю ясно что 800х600 это "отпускное" разрешение), а цифру 800 на 5120. Т.е. jacar предлагаем вам забрать картинку в окошке 800х600, а вы просите: "ненене, братка, отдай-ка в 5120х4096" :D Он добрый - отдаст.
Жмёте в менеджере "начать закачку". Скачиваете.
Это не всё.
7. Скачанный файл не имеет разрешения, т.е. открыть его нельзя.
Переименуйте файл. Например назовите его A03023088700_4.jpg. Важное опять-таки выделено жирным. Мы не только присваиваем файлу удобное имя (например код документа и номер страницы), но и нужное разрешение (".jpg"!)
8. PROFIT!
Методом научного тыка установлено что увеличению 300% примерно соответствует размер окна 5120х4096, а увеличению 600% - 8960х7168 (вес жпегов в этом случае приблизится к 7-8 мб). Впрочем, эти цифры совершенно не строгие, - ничего не мешает вам выбрать свои.
Кстати это только кажется что способ "муторный". Это описывать долго, а делать - быстро. Короче говоря - делать так, или извлекать из DjVU - просто дело вкуса.

Момент второй. Разрозненные файлы.

Я так и не понял как можно сохранять DjVU документ в виде целого файла а не россыпи (jacar даёт сохранять только в  виде "одна страница=один DjVU файл"). Поступил просто.
1. Берется любой редактор pdf (pdf-creator или nitro pdf или любой другой). Запускается. (Кстати фэны формата DjVU могут использовать редактор этого формата).
2. Далее в jacar'е жмём на кнопку "напечатать" (рядом с "сохранить", в виде принтера). В открывшимся окошке нам предложат напечатать на бумаге "все" страницы. Под "всеми" jacar подразумевает ту страницу что сейчас открыта в окошке просмотра, и только её!.
3. Вверху окошка (где выбор принтера) вместа принтера выбираем программу-редактор pdf файлов.
4. Ниже убираем метку с "напечатать все" и переставляем её на "напечать с: ... по:....". Выставляем значения от 1 тире количество страниц в документе. Т.е. если в документе 64 стр. у вас должно быть: "напечатать с 1 по 64".
5. Оправляете на "печать".
6. В pdf-редакторе появляются все 64 страницы документа в соответствующем порядке.
7. Жмём "сохранить pdf документ" и присваиваем ему удобное имя. Например "A03023088700" :)
8. PROFIT!!

В итоге (по идее) после обработки вышеописаннными методами нескольких документов у нас будет папка в которой находятся чересполосно целые pdf-ки а непосредственно рядом с ними (при выставлении "упорядочть значки по имени") относящиеся к ним картинки. Наверно это удобно.

Если всё вышеперечисленное - боянистый боян или суета сует - прошу прощения.

P.S. Было бы неплохо, если данная тема не будет состоять из одного лишь нулевого поста. ;)

Отредактированно Эвмел (05.01.2010 13:30:02)

#2 05.01.2010 14:02:13

vs18
Капитанъ I ранга
k1r
anna3 stas3b
Откуда: Харьков, Украина
Сообщений: 3745




Re: jacar'овские заморочки

LizardTech DjVu Browser Plug-in позволяет сохранять многостраничные документы.

Для преобразования файлов DjVu в TIFF я использую утилиту ddjvu из пакета DjVulibre (для преобразования PDF в TIFF - Ghostscript).

Если предполагается OCR полезна утилита unpaper.

Распознаю либо Tesseract-OCR (только для английских/французских/немецких текстов), либо FineReader, в зависимости от того, что дает лучшие результаты.

Отредактированно vs18 (05.01.2010 14:05:01)

#3 05.01.2010 14:15:43

Глокий Куздр
Гость




Re: jacar'овские заморочки

vs18 написал:

Оригинальное сообщение #165414
LizardTech DjVu Browser Plug-in позволяет сохранять многостраничные документы.

А как это сделать на самом jacar'е? Там же вроде тоже LizardTech-ский плагин устанавливается, но как с ним сохранить файл целиком я так и не понял. :(

vs18 написал:

Оригинальное сообщение #165414
Для преобразования файлов DjVu в TIFF я использую утилиту ddjvu из пакета DjVulibre (для преобразования PDF в TIFF - Ghostscript).

Спасибо. Зело пользительные примочки.

#4 05.01.2010 14:22:35

Глокий Куздр
Гость




Re: jacar'овские заморочки

Эвмел написал:

Оригинальное сообщение #165417
А как это сделать на самом jacar'е?

Ой прошу прощения! Только что получилось сохранить целиком (хотя раньше не получалось. странно). Может быть потому что я только что установил предложенную утилиту DjVUlib? Ей богу раньше сохранялись только отдельные файлы. Чудеса. :D

Отредактированно Эвмел (05.01.2010 14:23:55)

#5 06.01.2010 14:24:31

Евгений Пинак
Контр-адмиралъ
k-admiral
Сообщений: 2201




Re: jacar'овские заморочки

Никаких чудес. "Родной" лизардтековский плагин без проблем сохраняет документы как постранично, так и в одном файле - больше ничего устанавливать не надо.

#6 15.01.2010 15:54:27

Geomorfolog
Вице-Адмиралъ, картографъ, лучший меценат Форума 2009 и 2011
v-admiral
anna3 stas3
Откуда: г. Ноябрьск-Белая Церковь
Сообщений: 9530




Re: jacar'овские заморочки

Лично я сохраняю в BMP, а потом,если надо,преобразую в JPG, а потом уменьшаю,увеличиваю,обрезаю и т. п. Но мне кажется при любом раскладе с текстом и рисунками все нормально,с фото - полный ж.


Добро — это когда я украду чужой скот и чужих жен, а зло — когда у меня украдут.

Страниц: 1


Board footer