Сканирование и выкладывание литературы

Модераторы: =BD=, trent

Ответить
carrey
Сообщения: 96
Зарегистрирован: 09 июн 2005, 14:48

Сканирование и выкладывание литературы

Сообщение carrey » 05 мар 2007, 16:06

Благодаря Lamantine, сподвигнувшего на написание, получите краткое наставление про то, как сканировать и как выкладывать литературу - другими словами, про то, как делиться с сообществом тем, что у Вас есть :wink:

Если у Вас есть книжка, или журнал, или бумажная модель, или даже просто рекламный листок с интересной фотографией военной техники или ещё чего-либо по нашей общей теме - немедленно поделитесь с нами и Вам воздастся за труды Ваши :wink: . Для этого Вам нужно оцифровать материал и закачать его в сеть. Оцифровка производится сканером (обычно) или фотоаппаратом (для любителей извращений :lol: или при наличии отсутствия в домашнем хозяйстве сканера).

У каждого сканера есть свои особенности. Самые для Вас важные - аппаратное разрешение в DPI, т.е. сколько точек на дюйм (не квадратный!) он способен перевести в цифру ("сфотографировать") в своём природном быстром режиме. У каждого сканера есть как минимум 2 режима работы - предварительный просмотр ("превью"), и полноценное сканирование в указанном Вами качестве (разрешении, DPI). Так вот, если Ваш сканер обрабатывает превью по времени так-же быстро, как и полностью сканирует в 200 DPI - поздравляю, Вы - наш клиент :D . если аппаратное разрешение 300 DPI - ещё лучше. Если 150 DPI, то можно сканировать и в 150, но значительно лучше будет в 200 или 300, если для Вас это не покажется слишком медленным. Главный плюс сканирования материалов в аппаратном разрешении - скорость. Касательно числа DPI надо заметить, что подавляющее большинство литературы печатается в разрешении, близком к 300 DPI, т.е. сканировать в 600 DPI никакого смысла нет - за исключением декалей, травлёнки и прочей мелочёвки, где "детали имеют значение" :) . Обычная же литература замечательно выглядит в 200 DPI, т.е. при рассматривании отсканированного файла Вы не найдёте таких мест, которые размыты или нечитаемы, а в оригинале - прекрасно видны.

Итак, приступаем к сканированию. По возможности желательно обеспечить плотное прилегание всей площади оригинала к стеклу сканера. Если сканируете книгу разворотами - прижмите корешок к стеклу, если журнал - прижмите сверху книгой или ещё чем тяжёлым (можно просто растопыркой :D ). Для улучшения контрастности скана и для исключения просматривоемости в файле блёклого текста с оборотной стороны рекомендуется прокладывать за оригиналом лист чёрного непрозрачного блестящего пластика или плёнки, хороший результат дают засвеченные рентгеновские снимки, обрезанные под размер A4.

В результате усидчивого переворачивания листов и тырканья в кнопку, получаем кучку файлов. Хорошо, если это файлы формата JPEG, не сильно ужатые. Если есть возможность, установите в программе сканера формат JPEG при минимально возможном ужатии. Далее сразу просматриваем эти файлы, убеждаемся в том, что всё получилось, что пропущенных страниц не имеется, что фотографии контрастны и без дефектов (см. ниже про растровый муар) а текст - читаем. Если надо, обрезаем ненужные поля и выравниваем сканы, для меня открытием в этой сфере явилась полубесплатная программа Picture Window Pro [http://www.dl-c.com] - мышой закидываем в её окно пачку сканов, Alt+T,G,C, выставляем рамку, поворачиваем удерживая Ctrl, обрезаем - Enter, закрываем файл перезаписывая исходный.

Могут быть и проблемы. Например, "блёклый" скан - текст серый, "тонкий", фотографии бледные, неконтрастные. Улучшить сканы можно, в автоматическом режиме откорректировав контраст файлов. Лично я делаю это в Paint Shop Pro [http://www.jasc.com], File > Batch processing, предварительно создав соответствующий макрос с подходящими параметрами. Главное - не переборщить! Потренируйтесь... на кошках :wink:

Другая проблема - растровый муар, наглядно проявляющийся в сетке из тёмных пятнышек поверх фотографий в сканах. Причина сего печального явления, грубо говоря, в совпадении DPI Вашего сканера с DPI в котором подготовлено сканируемое издание. Самое простое решение - при сканировании (увы, повторном! поэтому всегда, прежде чем неудачно сканировать много страниц, для проверки правильности выбора исходных предпосылок :D - параметров - отсканируйте парочку характерных страниц) включить в настройках программы сканера опцию Descreen (может называться Derasterize, Remove Moire и т.п.). Это будет немного медленнее, но зато дефекта на фото не будет - он перейдёт на текст :lol: который из-за дескрина станет менее резким. Можно, конечно, откорректировать контраст, или поприменять другие фильтры... Но лучше убить время чем-нибудь более полезным :D

При наличии у Вас этого самого времени лучше будет пересканировать материал в большем DPI, т.е. если муар вылазит в 200 - пересканируйте в 300. Главное на этом этапе - подготовить сканы для дальнейшего сжатия и закачки.

Можно сканы зажимать, а можно оставить и так, если они не занимают больше, чем Вам хотелось бы закачать :D . Если решаемся зажимать, делать это лучше всего в формат DejaVu, режим Photo. В результате получим 1 файл, в котором внутри будут все страницы (похоже на PDF), с качеством, на глаз неотличимом от оригинальных сканов, при размере файла примерно в 4 раза меньшем нежели исходные сканы. Если книжка большая, страниц много, и файл получился большой (более 50 мегабайт), разумно сразу приготовить файл для "модемщиков" или для тех, кто платит за перекачиваемый объём (траффик) и хочет убедится в бесполезности выкачивания большой версии файла :lol: - для них зажмём исходники в тот-же DjVu но уже в режим Scanned. Главное - что-бы текст был читаем и в этом варианте. Если не получилось - исправляем контрастность оригиналов (в Paint Shop Pro помогают параметры dark, heavy) и пробуем опять.

Итак, получили 2 файла. Теперь надо ими немедленно поделится :) . Для этого их надо положить туда, откуда их смогут взять все и откуда их не сможет стереть никто :wink: . Казалось бы - элементарно, но война на этом фронте идёт с переменным успехом обеих воюющих сторон уже около года, и окончательной и бесповоротной победы Разума над Мамоной :lol: пока не видно. Лично я пока (пока этот сервис не рухнул :D ) заливаю файлы на Zshare [http://www.zshare.net] - заливка достаточно быстрая и удобная (Browse > указываем файл у себя > [x] соглашаемся с условиями > Upload > ждём пока закачается > копируем себе Download link, который публикуем далее).

Вот, собственно, вкратце и всё. Может ещё чего допишу, может и Вы чего выскажете дельного. Сообща не дадим ветке засохнуть! :D
Последний раз редактировалось carrey 06 мар 2007, 14:45, всего редактировалось 1 раз.

=BD=
Site Admin
Сообщения: 186
Зарегистрирован: 25 апр 2005, 16:56
Откуда: Санкт-Петербург

Сообщение =BD= » 05 мар 2007, 19:58

Сейчас надо поискать сканер с аппаратным меньше 600. :wink:
Устанавливать нужные яркость, контрасность и гамму гораздо лучше в модуле сканирования (если там это конечно есть - у каждого сканера модули разные). Чтобы на выходе получались готовые к употреблению файлы.
Черный лист можно и на лазернике напечатать - вполне приемлемо, особенно если лазерник на работе :wink:
"Уборка" муара может оказаться более сложным занятием :( (плюс для её иногда требуется подбирать параметры)
Я лично предпочитаю JPG или PDF - но это дело каждого.
Ты бы хоть сказал чем пользуешься для сжатия в DjVu :?:
Например у стандартного Lizardtech-евского виртуального принтера совсем другие настройки.

P.S. "Засохнуть" ветке не удастся... я уже чуствую тяжелую поступь MoscowHorror... :lol:

carrey
Сообщения: 96
Зарегистрирован: 09 июн 2005, 14:48

Сообщение carrey » 06 мар 2007, 14:44

LizardTech DjVu Solo 3.1

=BD=
Site Admin
Сообщения: 186
Зарегистрирован: 25 апр 2005, 16:56
Откуда: Санкт-Петербург

Сообщение =BD= » 06 мар 2007, 14:56

Кстати а сканер какой? и модуль сканирования?

carrey
Сообщения: 96
Зарегистрирован: 09 июн 2005, 14:48

Сообщение carrey » 06 мар 2007, 17:07

hp scanjet 5590 с оторванным фидером и оригинальными комплектными дровами. аппаратное разрешение (быстрое а не фактическое) - 200dpi.

=BD=
Site Admin
Сообщения: 186
Зарегистрирован: 25 апр 2005, 16:56
Откуда: Санкт-Петербург

Сообщение =BD= » 06 мар 2007, 17:36

аппаратное разрешение (быстрое а не фактическое) -что ты понимаешь под выделенным и откуда взял что оно 200?

carrey
Сообщения: 96
Зарегистрирован: 09 июн 2005, 14:48

Сообщение carrey » 07 мар 2007, 12:07

грубо говоря, это разрешение, в котором производится предварительное сканирование, сканирование с максимальной скоростью. я не имею в виду физическое (оптическое) разрешение сканирующего элемента (линзовой линейки, одиночной линзы с механизмом линейной каретки), я имею в виду то аппаратное разрешение, под которое сканер "заточен", т.е. на этапе его проектирования определена максимальная скорость, с которой получается приемлемый результат.

не знаю, как у вас, но у меня, запуская программу сканера и нажимая в ней кнопку "Сканировать" или сразу нажимая кнопку на самом сканере, сначала производится предварительное сканирование в 200 DPI, на экране отображается preview, в котором можно выставить рамку, параметры сканирования и далее сканировать уже в нужном разрешении. так вот, выставляя разрешение более 200, окончательное сканирование у меня происходит значительно медленнее, чем предварительное (менее 200 - с той же скоростью, что и в 200 - это именно максимальная аппаратная скорость).

обобщая, можно сказать, что чем лучше проработана механическая часть сканера (отсутствие люфтов и дребезга) и чем лучше обеспечивается обрабатываемый объём данных при сканировании (шина USB вместо LPT), тем выше обеспечиваемая скорость. что характерно, определяется только опытным путём, ибо в спецификациях не указывается.

Ответить

Вернуться в «FAQ»