ПОПУЛЯРНЫЕ ФОРМАТЫ ЭЛЕКТРОННЫХ КНИГ
*.pdf (Portable Document Format) это переносимый формат документов, созданный Adobe как средство межплатформенного обмена данными. Хотя существует масса способов передать документ, например, между Windows и Mac OS, Adobe PDF предлагает наиболее элегантное решение. Формат не накладывает никаких ограничений на внешний вид документа - текст, векторная и растровая графика могут быть объединены произвольным образом. Реализуется принцип «все мое ношу с собой» - для просмотра PDF-файла не нужно ничего, кроме самого файла и бесплатной программы Acrobat Reader. PDF создавался как формат электронного документа. Необходимость быстрого перемещения по страницам и объектам документа обусловила иерархическую структуру данных PDF. В начале файла находится оглавление, показывающее где и какие объекты расположены в файле, затем идут сами данные. Для того, чтобы что-либо делать с PDF-файлом, его нужно иметь целиком, поскольку фрагмент данных, который понадобится первым, может находиться в любой части файла - в том числе и в самом конце. Для документов с явным преобладанием текста и векторной графики формат PDF, как правило, обеспечивает заметное сокращение объема файла (с соответствующим сокращением времени пересылки по сети и т.д.).
*.djVu (дежа-вю) - графический формат, разработанный фирмой AT&T, оптимизированный для хранения отсканированных документов. Особое значение этот формат приобретает для переноса в сеть математической и вообще технической литературы, где обилие схем и формул делает распознавание и перевод в текстовый формат практически невыполнимым. В настоящее время DjVu становится фактическим стандартом для электронных библиотек технической и научной литературы. Отныне существует компромисный вариант - перевод отсканированных картинок в формат DjVu (дежа-вю). При этом текст и контрастные рисунки сохраняются с разрешением 300dpi, все остальное считается фоном и сохраняется с пониженным разрешением. Это позволяет хорошо сжать электронный документ без потери его читаемости. Размер файла отсканированной книги оказывается в пределах нескольких мегабайт, что вполне приемлемо. Разработанная фирмой AT&T технология DjVu обеспечивает для файлов с черно-белыми монохромными изображениями сжатие порядка 500:1. Выигрыш в размере файла по сравнению с форматом GIF составляет в среднем 20 раз. Суть технологии DjVu заключается в автоматическом разбиении изображения на несколько участков (например, текст, логотип фирмы и растровая фотография), для каждого из которых выбирается оптимальный для данного графического образа алгоритм сжатия. Право на коммерческое использование технологии DjVu продано компании LizardTech.
*.chm (Compiled HTML) - Изначально формат CHM был создан для формирования удобной и функциональной справочной системы к программам Windows. Этот формат часто используется не только для создания хелп-систем к ПО, но и для издания книг в электронном виде. Самой сильной стороной этого формата является наличие в CHM файлах полнотекстового поиска. Вкратце файл CHM - это набор скомпилированных HTML-файлов, т.е., другим языком, что-то вроде архива из Web-страниц. И действует CHM-файл по принципу архива, сжимает данные, хранящиеся в нём, но не все, а только текстовые или содержащие текст, отформатированный с помощью тегов HTML (HTML, TXT, CSS и файлы других форматов).
*.iSilo (Plam Os Platform /pdb - Palm Pilot Database format) - Формат базы данных, используется во всех 3Com PalmPilot, IBM Workpad и Macintosh/PC для сохранения записей в базе данных. Размер одной записи может превышать 64кб, имеются биты BackUp и т.д. Через вьювер от iSilo книги в формате PDB выглядят как в формате CHM. Каких-либо достоинств этого формата для конечного пользователя не замечено, однако встречаются весьма интересные книги скомпилированные в PDB, поэтому мы не могли обойти этом формат стороной.
Няма коментари
Comments are closed.