office документ файл
Формат Office Open XML может включать любое число встроенных объектов, которые могут принадлежать к любому типу. Эта возможность, пришедшая на смену неэффективному кодированию Base64, которое использовалось в предыдущих версиях продукта, сделала файлы более гибкими и удобными для обработки.
Например, вставка графического изображения в документ Word 2007 приведет к появлению в контейнере следующих элементов:
· в файл [Content_Types).xml будет добавлено описание типа, связывающего расширение файла *.jpg с to image/jpeg;
· папка media, созданная в папке word, будет содержать копию вставленного в документ графического изображения;
· в файле document.xml, который находится в папке word, будет вставлена ссылка на новое взаимоотношение;
· в файле document.xml.rels (находящийся в папке word) будет добавлено новое взаимоотношение, которое будет ссылаться на соответствующий элемент в файле document.xml.
2.
Содержимое файла
2.1 Детали реализации
Рассмотрим, как описанный выше XML-формат используется при сохранении документов, создаваемых приложением Microsoft Office 2007,а именно к Word 2007.
Начнем с простого текстового документа, созданного с помощью Word 2007. На рис. 1 показано, как этот документ выглядит в редакторе.
Рис. 1. Документ, созданный средствами Word 2007
Сохраненный документ имеет расширение *.docx и представляет собой ZIP-контейнер, который мы можем исследовать с помощью любой программы, позволяющей работать с ZIP-архивами. В качестве примера будем использовать программу WinZip. Ниже показана структура docx-файла, открытого в WinZip (рис. 2).
Рис. 2. Структура docx-файла
В файле [Content_Types).xml описаны все типизованные элементы, связанные с данным документом. Все типизованные элементы, уникальные для Word 2007, имеют префикс application/vnd.ms-word. Если типизованный элемент соответствует XML-файлу, то в конец URI добавляется «+xml». Типичными для Word 2007 типизованными элементами являются:
· application/vnd.ms-word.comments+xml - содержит комментарии в формате XML;
· application/vnd.ms-package.core-properties+xml - содержит свойства документа в формате XML;
· image/png - графическое изображение в оригинальном формате.
Поскольку имеется возможность изменения имени любого фрагмента документа, в файле [Content_Types).xml описаны и ссылки на такие фрагменты. Например, вот как указывается местоположение таблицы шрифтов:
Взаимоотношения между частями документа всегда располагаются в каталоге _rels. Для конкретного документа взаимоотношения описываются в файле document.xml.rels. Например:
Do'stlaringiz bilan baham: |