DjVu (от фр. déjà vu — «уже виденное») — технология представления и хранения документов (книг, журналов, рукописей и подобных, прежде всего сканированных) с использованием сжатия изображений с потерями.
DjVu | |
---|---|
Расширение | .djvu или .djv |
MIME-тип | image/vnd.djvu image/x-djvu |
(Сигнатура) | AT&TFORM |
Разработчик | Labs-Research, (с марта 2000) |
Опубликован | 1998 |
Последний выпуск | 27 (июль 2006) |
Тип формата | Электронный документ |
Открытый формат? | Да |
Сайт | djvu.org |
Медиафайлы на Викискладе |
Изначально технология была разработана Яном Лекуном, Леоном Боту и Патриком Хеффнером в Labs с 1996 по 2001 годы.
Формат оптимизирован для передачи по сети таким образом, что страницу можно просматривать ещё до завершения загрузки файла. DjVu-файл может содержать текстовый (OCR) слой, что позволяет осуществлять полнотекстовый поиск по файлу. Кроме того, DjVu-файл может содержать встроенное интерактивное оглавление и активные области — ссылки, что позволяет реализовать удобную навигацию в DjVu-книгах.
Используемые технологии
Для сжатия цветных изображений в DjVu применяется специальная технология, разделяющая исходное изображение на три слоя: передний план, задний план и чёрно-белую (однобитовую) маску. Маска сохраняется с разрешением исходного файла; именно она содержит изображение текста и прочие чёткие детали. Разрешение заднего плана, в котором остаются иллюстрации и текстура страницы, по умолчанию понижается для экономии места. Передний план содержит цветовую информацию о маске; его разрешение обычно понижается ещё сильнее. Затем задний и передний планы сжимаются с помощью вейвлет-преобразования, а маска — алгоритмом .
Особенностью алгоритма JB2 является то, что он ищет на странице повторяющиеся символы и сохраняет их изображение только один раз. В многостраничных документах каждые несколько подряд идущих страниц пользуются общим «словарём» изображений.
Для сжатия большинства книг можно обойтись только двумя цветами. В этом случае используется всего один слой, что позволяет достичь рекордной степени сжатия. В типичной книге с чёрно-белыми иллюстрациями, отсканированной с разрешением 600 dpi, средний размер страницы составляет около 15 Кб, то есть приблизительно в 100 раз меньше, чем исходный файл. В присутствии сложного заднего плана выигрыш объёма составляет обычно 4—10 раз. Однако при стандартных настройках в DjVu используется сжатие данных с потерями, поэтому для особо важных документов обычно используются форматы сжатия без потерь: PNG, JPEG 2000, TIFF и т. п. Например, сжатие без потерь предоставляет утилита CJB2 из пакета DjVuLibre.
В основе формата DjVu лежат несколько технологий, в том числе разработанных в Labs:
Текстовое представление изображений DjVu
Формат DjVu предусматривает наличие текстового слоя, который содержит текст со страницы (используется для поиска и лёгкого копирования текста при работе с ним). В случае, если текстовый слой недоступен, единственный метод получения текста — выполнение оптического распознавания в сторонних программах.
Лицензионная информация
В марте 2000 года продали технологию компании , которая пыталась использовать её в своих коммерческих интересах, но благодаря открытости формата для создания и просмотра документов DjVu существует свободное программное обеспечение, доступное для различных платформ. 1 июля 2008 года передал менеджмент DjVu родительской компании , а 10 июня 2009 года передал права на технологию DjVu компании (ранее Caminova).
Существует открытая публикуемая под лицензией GNU GPL библиотека DjVuLibre и программы-кодировщики и просмотрщики на ней.
См. также
Примечания
- См. файл readme пакета DjVuLibre-3.5.27.tar.gz
- DjVu File Format Versions . Разработчики DjVu (июль 2006). Дата обращения: 16 января 2010. 13 июня 2010 года.
- TrID — 2003.
- DjVuLibre History and Credits от 9 сентября 2017 на Wayback Machine (англ.)
- Лицензия . Дата обращения: 28 мая 2009. 2 мая 2009 года.
- . Дата обращения: 4 октября 2008. Архивировано из оригинала 28 сентября 2008 года.
- . Дата обращения: 25 октября 2014. Архивировано из оригинала 5 октября 2014 года.
- . Дата обращения: 17 июля 2009. Архивировано из оригинала 16 июля 2009 года.
Ссылки
- Алгоритмы и достоинства, программы и использование, руководства пользователя.
- Дежавю или DjVu: ликбез. Сборник статей о технологии DjVu.
- DjVu.org Англоязычный портал DjVu-сообщества.
Википедия, чтение, книга, библиотека, поиск, нажмите, истории, книги, статьи, wikipedia, учить, информация, история, скачать, скачать бесплатно, mp3, видео, mp4, 3gp, jpg, jpeg, gif, png, картинка, музыка, песня, фильм, игра, игры, мобильный, телефон, Android, iOS, apple, мобильный телефон, Samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Сеть, компьютер
Eta statya o tehnologii kompyuternogo szhatiya izobrazhenij O kompyuternoj programme avtomatizirovannogo perevoda sm Deja Vu o psihologicheskom fenomene sm dezhavyu o drugih znacheniyah termina sm dezhavyu znacheniya DjVu ot fr deja vu uzhe vidennoe tehnologiya predstavleniya i hraneniya dokumentov knig zhurnalov rukopisej i podobnyh prezhde vsego skanirovannyh s ispolzovaniem szhatiya izobrazhenij s poteryami DjVuRasshirenie djvu ili djvMIME tip image vnd djvu image x djvuSignatura AT amp TFORMRazrabotchik AT amp T Labs Research s marta 2000 Opublikovan 1998Poslednij vypusk 27 iyul 2006 Tip formata Elektronnyj dokumentOtkrytyj format DaSajt djvu org Mediafajly na Vikisklade Iznachalno tehnologiya byla razrabotana Yanom Lekunom Leonom Botu i Patrikom Heffnerom v AT amp T Labs s 1996 po 2001 gody Format optimizirovan dlya peredachi po seti takim obrazom chto stranicu mozhno prosmatrivat eshyo do zaversheniya zagruzki fajla DjVu fajl mozhet soderzhat tekstovyj OCR sloj chto pozvolyaet osushestvlyat polnotekstovyj poisk po fajlu Krome togo DjVu fajl mozhet soderzhat vstroennoe interaktivnoe oglavlenie i aktivnye oblasti ssylki chto pozvolyaet realizovat udobnuyu navigaciyu v DjVu knigah Ispolzuemye tehnologiiDlya szhatiya cvetnyh izobrazhenij v DjVu primenyaetsya specialnaya tehnologiya razdelyayushaya ishodnoe izobrazhenie na tri sloya perednij plan zadnij plan i chyorno beluyu odnobitovuyu masku Maska sohranyaetsya s razresheniem ishodnogo fajla imenno ona soderzhit izobrazhenie teksta i prochie chyotkie detali Razreshenie zadnego plana v kotorom ostayutsya illyustracii i tekstura stranicy po umolchaniyu ponizhaetsya dlya ekonomii mesta Perednij plan soderzhit cvetovuyu informaciyu o maske ego razreshenie obychno ponizhaetsya eshyo silnee Zatem zadnij i perednij plany szhimayutsya s pomoshyu vejvlet preobrazovaniya a maska algoritmom Osobennostyu algoritma JB2 yavlyaetsya to chto on ishet na stranice povtoryayushiesya simvoly i sohranyaet ih izobrazhenie tolko odin raz V mnogostranichnyh dokumentah kazhdye neskolko podryad idushih stranic polzuyutsya obshim slovaryom izobrazhenij Dlya szhatiya bolshinstva knig mozhno obojtis tolko dvumya cvetami V etom sluchae ispolzuetsya vsego odin sloj chto pozvolyaet dostich rekordnoj stepeni szhatiya V tipichnoj knige s chyorno belymi illyustraciyami otskanirovannoj s razresheniem 600 dpi srednij razmer stranicy sostavlyaet okolo 15 Kb to est priblizitelno v 100 raz menshe chem ishodnyj fajl V prisutstvii slozhnogo zadnego plana vyigrysh obyoma sostavlyaet obychno 4 10 raz Odnako pri standartnyh nastrojkah v DjVu ispolzuetsya szhatie dannyh s poteryami poetomu dlya osobo vazhnyh dokumentov obychno ispolzuyutsya formaty szhatiya bez poter PNG JPEG 2000 TIFF i t p Naprimer szhatie bez poter predostavlyaet utilita CJB2 iz paketa DjVuLibre V osnove formata DjVu lezhat neskolko tehnologij v tom chisle razrabotannyh v AT amp T Labs algoritm otdeleniya teksta ot fona na otskanirovannom izobrazhenii vejvletnyj algoritm szhatiya fona algoritm szhatiya chyorno belyh izobrazhenij JB2 pohozhij na JBIG2 universalnyj algoritm szhatiya BZZ pohozhij na BZIP2 algoritm raspakovki po zaprosu algoritm maskirovki izobrazhenij Tekstovoe predstavlenie izobrazhenij DjVuFormat DjVu predusmatrivaet nalichie tekstovogo sloya kotoryj soderzhit tekst so stranicy ispolzuetsya dlya poiska i lyogkogo kopirovaniya teksta pri rabote s nim V sluchae esli tekstovyj sloj nedostupen edinstvennyj metod polucheniya teksta vypolnenie opticheskogo raspoznavaniya v storonnih programmah Licenzionnaya informaciyaV marte 2000 godaAT amp T prodali tehnologiyu kompanii kotoraya pytalas ispolzovat eyo v svoih kommercheskih interesah no blagodarya otkrytosti formata dlya sozdaniya i prosmotra dokumentov DjVu sushestvuet svobodnoe programmnoe obespechenie dostupnoe dlya razlichnyh platform 1 iyulya 2008 goda peredal menedzhment DjVu roditelskoj kompanii a 10 iyunya 2009 goda peredal prava na tehnologiyu DjVu kompanii ranee Caminova Sushestvuet otkrytaya publikuemaya pod licenziej GNU GPL biblioteka DjVuLibre i programmy kodirovshiki i prosmotrshiki na nej Sm takzhePDF Ocifrovka knigPrimechaniyaSm fajl readme paketa DjVuLibre 3 5 27 tar gz DjVu File Format Versions neopr Razrabotchiki DjVu iyul 2006 Data obrasheniya 16 yanvarya 2010 13 iyunya 2010 goda TrID 2003 DjVuLibre History and Credits ot 9 sentyabrya 2017 na Wayback Machine angl Licenziya neopr Data obrasheniya 28 maya 2009 2 maya 2009 goda neopr Data obrasheniya 4 oktyabrya 2008 Arhivirovano iz originala 28 sentyabrya 2008 goda neopr Data obrasheniya 25 oktyabrya 2014 Arhivirovano iz originala 5 oktyabrya 2014 goda neopr Data obrasheniya 17 iyulya 2009 Arhivirovano iz originala 16 iyulya 2009 goda SsylkiMediafajly na VikiskladeImeetsya vikiuchebnik po teme Sozdanie elektronnoj kopii knigi v formate DjVu v Linux Algoritmy i dostoinstva programmy i ispolzovanie rukovodstva polzovatelya Dezhavyu ili DjVu likbez Sbornik statej o tehnologii DjVu DjVu org Angloyazychnyj portal DjVu soobshestva