(С) Владислав Боркус.
Дата актуальности: ноябрь 2005
!Данный материал защищён авторским правом и любое его копирование не допускается.
Классы систем, поддерживающие управление изображениями
Системы, решающие задачи создания фотоальбома, можно примерно разделить на следующие классы:
- Системы Digital Asset Management (DAM). Системы обычно применяемые для ведения в крупных компаниях баз изображений, видео-фрагментов, аудиозаписей;
- Системы Media Asset Management (MAM). Они похожи на DAM, но более специализированы, отличаются тем, что поддерживают функции дистрибуции контента -- например, аудио и ведео-трансляций;
- Системы поддержки маркетинга обеспечивают ведение баз документов, связанных с маркетинговой деятельностью, -- изображений, презентаций PowerPoint, других документов. Позволяют группировать эти документы в рамках проектов, вести план-графики, рассылки, контролировать использование логотипов и других графических объектов за пределами организации и т.п.
- Системы управления контентом (Enterprise content management, ECM). Они позволяют управлять всеми видами контента, в том числе и цифровыми активами, т.е. содержат модуль DAM;
- Системы управления динамическими web-альбомами. Их можно рассматривать как ослабленный вариант DAM. Они позволяют сформировать относительно несильно (инкрементально) меняющийся во времени каталог изображений в Интернет. У них более слабые средства поиска и систематизации (обычно это вложенные ссылками друг в друга Web-страницы и сквозной поиск по ключевым словам), а метафора Windows Explorer не используется. Эти системы не очень удобны, когда имеется очень большой массив данных или же когда требуется часто обновлять данные, вести сложный поиск. Как правило такие системы делаются в виде CGI-скриптов и часто создаются на заказ.
- Системы управления контентом на сайтах часто имеют средства для формирования статических альбомов, т.е. альбомов фотографий относительно жестко привязанным к Web-страницам. Они еще менее гибки, чем системы управления Web-альбомами.
- Настольные утилиты. Web-интерфейса не имеют, но позволяют создавать статические HTML-альбомы, которые можно копировать на сайт.
Заявленные технологические требования (частый поиск данных, большое число сотрудников, работающих с данными, разграничение доступа) лучше всего удовлетворяются классом систем DAM.
Типовые возможности систем DAM
Направление | Типичные возможности |
Хранение данных | - Определение метаданных для объектов хранения: дерево категорий (иногда несколько деревьев), ключевые слова, название, комментарии, авторство, дата создания, другие основные параметры объекта. Очень часто современные системы автоматически извлекают метаданные из загружаемых объектов (стандарты EXIF, IPTC, XMP, DICOM). - Управление версиями документов; - Разграничение доступа к объектам системы; - Формирование разных готовых представлений объектов системы (thumbnails, previews); - Расщепление сложных объектов на составные части (например, сцены видеоряда, страницы TIFF-документа, слайды PowerPoint и пр.), работа с частями сложных объектов как с отдельными объектами системы с сохранением целостности исходного объекта. - Пакетные режимы работы для загрузки больших объемов данных. Также крайне важно наличие функции «массовой» установки одинаковых атрибутов у нескольких объектов. Значительное число поставщиков опираются в своих системах на хранение исходных данных в файловой системе, а метаданных -- в СУБД. Многие используют свои СУБД (недорогие и немасштабируемые решения). Системы более высокого класса опираются на реляционные СУБД. |
Преобразование данных | Большинство систем предлагают механизмы преобразования данных. Как правило это: - механизм формирования thumbnail и preview объекта, загружаемого в систему. Системы отличаются по тому, формируются ли эти уменьшенные изображения сразу при загрузке или же нужно запускать отдельную команду, чтобы сформировать их в пакетном режиме. Иногда поддерживаются оба механизма; - механизм преобразования объекта по требованию пользователя (обрезка краев, смена разрешения, смена формата, увеличение четкости и пр.). Возможны варианты когда такой объект формируется отдельно и становится самостоятельным объектом хранения или же он формируется на «лету», когда пользователь выбирает в диалоге скачивания возможные форматы загрузки. Как правило современные системы хранят объект только в максимальном разрешении и формируют новые объекты «на лету». - работа с цветовыми профилями изображений (IIC); Как правило, современные системы DAM полагаются на одно из стандартных для отрасли ПО преобразования изображений: Adobe Graphic Server, ImageMagik, реже GD и NetPBM. Некоторые системы интегрированы с системами управления хранения на более низком уровне, например, IBM Content Management Server. |
Пользовательские интерфейсы для загрузки и экспорта и интеграция с настольными системами | - Большинство систем работает сегодня через web-интерфейс. Однако, если этот интерфейс не единственный (т.е. есть еще толстый клиент), то его функционал ниже функционала толстого клиента. Пакетный режим экспорта-импорта данных встречается часто, но иногда в web-интерфейсах он эмулируется формой, в которой просто предусмотрено до 5 полей для задания загружаемых единично файлов; - Некоторые системы поддерживают загрузку в себя данных через FTP, WebDav или общую сетевую папку; - Многие системы позволяют отправлять из себя данные по Email; - Часта интеграция c программами MS Office (через плагины) для вставки изображений в документы прямо из системы; - Часта интеграция c приложениями верстки (встраивание в них меню доступа к хранилищу). |
Навигация по хранилищу и поиск | - Как правило системы представляют хранилище в виде иерархического дерева папок (категорий), к которым приписываются изображения. Возможно также построение дерева ключевых слов. Фундаментальным подходом может быть приписывание одного изображения жестко к одной «папке» или же представление папки как «вида», формируемого динамически по свойствам документа. В последнем случае документ может находиться в нескольких таких «папках». Наиболее удобны системы, которые позволяют визуализировать одновременно и дерево «папок» и список thumbnails хранимых в них объектов, т.е. максимально приближенные к метафоре Windows Explorer. С сожалению, не все системы умеют это делать (те, что не умеют правильнее все же отнести к классу «web-альбомов»). - Поиск как правило возможен по всем атрибутам системы. Наиболее слабые системы ищут встречающиеся слова и выражения по всем полям метаданных (считая эти поля текстовыми). Самые сильные системы позволяют строить к тому же сложные запросы, выставляя критерии по каждому из полей, и объединяя эти критерии логическими операциями. Очень много систем промежуточного уровня между этими двумя крайностями. - Часто также встречается возможность поиска похожих изображений. - Для систем управления видео характерна функция поиска надписей на стоп-кадрах. |
Интеграция с серверными системами | - Интеграция с корпоративными системами ECM, workflow, ERP - Интеграция подсистемы безопасности с LDAP/ActiveDirectory встречается достаточно часто. Но речь может идти о разных вещах -- механизме single sign on, синхронизации логинов, проверки паролей через AD |
Workflow | Очень многие системы имеют модуль workflow для автоматизации деловых процессов работы с данными или же имеют простые механизмы интеграции с workflow-системы. |
Многоязычность | Как правило под многоязычностью системы понимается одна или обе из следующих двух вещей: локализация интерфейса или возможность одновременной работы с символами на нескольких языках. Ведение двух параллельных карточек объекта в системе, имеющих одинаковые поля, но по разному заполненные (на разных языках), является очень редким явлением, поддерживаемым системами ECM верхнего класса (Documentum и пр.) |
Потребительские возможности | Очень многие системы рассчитаны не только на внутри корпоративное использование, но и на использование за пределами компании. Поэтому они предлагают такие возможности как: - формирование LightBox -- что-то вроде «персональной папки пользователя», куда помещаются ссылки на выбираемые пользователем изображения; - «корзина» для покупки и оплаты изображений; - рейтинги фотографий; - слайдшоу; - средства управления цифровыми правами ( DRM); - средства и контроля несанкционированного использования изображения в интернет (через поиск по Сети). Первые из этих двух свойств часто встречаются и в системах формирования web-альбомов. |
Разграничение доступа, аудит и пр. | - Все более-менее серьезные системы предлагают средства авторизации пользователей. - Полнота использования групп (ролей) варьируется между системами. У дорогих систем с этим все в порядке, более дешевые серьезно ограничены в этой области. - Средства сбора журналов как правило характерны для более дорогих систем. Более дешевые полагаются на логи web-сервера. Своих средств анализа логов как правило нет ни у кого, в лучшем случае есть просмотр. Но как правило, логи пишутся в текстовые файлы. |
Масштабируемость | Масштабируемость систем сильно варьируется. Более дешевые системы обычно слабо масштабируемы (до 10 одновременных пользователей в лучшем случае). Более дорогие, опирающиеся на SQL-базы данных масштабируются до десятков пользователей. Самые дорогие могут поддерживать сотни коннектов, и даже организовывать территориально-распределенную сеть серверов доступа. Системы на базе J2EE с Web-доступом как правило относятся к верхнему классу и масштабируются хорошо, системы на базе Macromedia Application Server, Perl -- средний класс масштабируемости. |
Примечание 1. Стандарты для инкорпорирования метаданных в файлы изображений
EXIF (Exchangeable Image File Format) -- стандарт для сохранения информации в файлах графических изображений, в первую очередь JPEG. Его используют большинство современных цифровых камер. Как правило, содержит в основном техническую информацию о снимке -- разрешение, степень сжатия, примененная цветокоррекция, время снимка, выдержка и диафрагма, расстояние до объекта, фокусное расстояние и т.п. Является частью стандарта DCF японской ассоциации производителей электроники JEIDA, обеспечивающего совместимость цифровых устройств. Он задает также правила помещения файлов в папки на флэш-дисках и тому подобные технические детали.
NAA/IPTC -- стандарт комитета International Press Telecommunications Council и ассоциации Newspaper Association of America по включению в файлы изображений такой текстовой информации, как ключевые слова, заголовки, место съемки, автор и уникальный идентификатор (имя) изображения. Этот стандарт использует много приложений для работы с графикой, в частности Adobe Photoshop.
XMP (Extensible Metadata Platform) -- новый стандарт для хранения метаданных изображений, продвигаемый Adobe (начина с Photoshop 7) на замену IPTC. Этот стандарт основан на XML (и RDF, Resource Definition Framework), в отличие от двоичных блоков IPTC. Новые версии Photoshop (7.01 и CS) используют XMP, встроенный в тело файла JPEG или TIFF. XMP широко поддерживается и доступен производителям с лицензией open source. Состав полей XMP идентичен составу полей IPTC, только их разметка иная. Пользователь может вручную сохранить из PhotoShop информацию об изображении -- в новых версиях она будет сохраняться в XML-файле с расширением XMP, а не в двоичном формате с расширением FFO, как это было раньше.
DCMI (Dublin Core Metadata Initiative) -- еще один стандарт для описания метаданных, разрабатываемый одноименным консорциумом. Он сосредотачивается на названии и содержании полей метаданных, а реальное представление их может быть в разных видах -- XML/RDF, списки ключ-значение и пр. Задает 15 стандартных полей. Поддерживается в основном некрупными производителями.
DICOM (Digital Imaging and Communications in Medicine) -- стандарт для хранения медицинских изображений (рентгеновских снимков и пр.), поддерживающий инкорпорирование внутрь файла некоторых метаданных о нем. Хотя ряд систем поддерживает DICOM, для данного проекта он бесполезен.
Примечание 2. Серверные библиотеки преобразования изображений
Adobe Graphic Server -- коммерческий сервер преобразования. Цена --$7,500 single CPU; $60K for high-performance version;
ImageMagik -- бесплатная open source система, обеспечивающая интеграцию с онлайновыми системами через командную строку и API;
GD-- библиотека open source для динамического создания изображений. Написана на C и имеет обертки для Perl, PHP и других языков. GD создает «на лету» изображения PNG, JPEG, GIF и пр., включающие графики, диаграммы, thumbnails. Помимо этого поддерживает многие возможности манипуляции изображениями, включая создание копии прямоугольной области, повороты и масштабирование.
NetPBM (используется редко) -- бесплатный open source набор утилит конвертации файлов в один из четырех PBM-форматов, трансформации данных в этом формате и конвертации обратно.