mlreportgen.dom.HTMLFile class

Пакет: mlreportgen.dom

Преобразуйте файл HTML в документ DOM

Описание

Преобразует содержимое файла HTML к mlreportgen.dom.HTMLFile объект, содержащий Объекты DOM, имеющие то же содержимое и формат. Можно добавить HTMLFile возразите против документа DOM любого типа, включая Word и документы в формате PDF.

Конструкция

htmlFileObj = HTMLFile(htmlFile) преобразует файл HTML в HTMLFile объект, содержащий Объекты DOM, имеющие то же содержимое и формат.

HTMLFile поддержка объектов эти элементы HTML и атрибуты. Кроме того, HTMLFile объекты принимают HTML, который содержит пользовательские свойства CSS, которые начинаются с дефиса. Пользовательские свойства CSS поддерживаются в HTML, Microsoft® Word и PDF выход.

Элемент HTMLАтрибуты
aclass, style, hrefИмя
addressclass, style
bclass, style
bigclass, style
blockquoteclass, style
bodyclass, style
brнет данных
centerclass, style
citeclass, style
codeclass, style
ddclass, style
delclass, style
dfnclass, style
divclass, style
dlclass, style
dtclass, style
emclass, style
fontclass, style, color, faceразмер
h1, h2, h3, h4, h5, h6class, styleвыравнивание
hrclass, styleвыравнивание
iclass, style
insclass, style
imgclass, stylesrc высотаwidth
kbdclass, style
liclass, style
markclass, style
nobrclass, style
olclass, style
pclass, styleвыравнивание
preclass, style
sclass, style
sampclass, style
smallclass, style
spanclass, style
strikeclass, style
strongclass, style
subclass, style
supclass, style
tableclass, styleвыравнивание, bgcolor'Граница' , cellspacing, cellpaddingСистема координат, ruleswidth
tbodyclass, styleвыравнивание, valign
tfootclass, styleвыравнивание, valign
theadclass, styleвыравнивание, valign
tdclass, style, bgcolorвысотаwidth, colspan, rowspanвыравнивание, valign, nowrap
thclass, style, bgcolorвысотаwidth, colspan, rowspanвыравнивание, valign, nowrap
trclass, styleвыравнивание, bgcolor, valign
ttclass, style
uclass, style
ulclass, style
varclass, style

Для получения информации об этих элементах см. https://developer.mozilla.org/en-US/docs/Web/HTML/Element.

Эти форматы CSS поддерживаются:

  • background-color

  • border

  • border-bottom

  • border-bottom-color

  • border-bottom-style

  • boder-bottom-width

  • border-color

  • border-left

  • border-left-color

  • border-left-style

  • boder-left-width

  • border-right

  • border-right-color

  • border-rigtht-style

  • border-right-width

  • border-style

  • border-top

  • border-top-color

  • border-top-style

  • border-top-width

  • border-width

  • color

  • counter-increment

  • counter-reset

  • display

  • font-family

  • font-size

  • font-style

  • font-weight

  • height

  • line-height

  • list-style-type

  • margin

  • margin-bottom

  • margin-left

  • margin-right

  • margin-top

  • padding

  • padding-bottom

  • padding-left

  • padding-right

  • padding-top

  • text-align

  • text-decoration

  • text-indent

  • vertical-align

  • white-space

  • width

Для получения информации об этих форматах, https://developer.mozilla.org/en-US/docs/Web/CSS/Reference.

Входные параметры

развернуть все

Путь к файлу HTML в виде вектора символов.

Свойства

развернуть все

Примечание

Для разметки HTML, чтобы отобразиться правильно в вашем отчете, необходимо включать конечные тэги для пустых элементов и заключить значения атрибута в кавычки. Если вы хотите показать зарезервированный символ разметки XML текстом, необходимо использовать его эквивалентный именованный или числовой символ XML.

Зарезервированный символОписаниеЭквивалентный символ
>Больше, чем>
<Меньше, чем&lt;
&Амперсанд&amp;
"Двойная кавычка&quot;
'Одна кавычка&apos;
%Процент&#37;

Уникальный идентификатор сеанса сгенерирован как часть HTMLFile создание объекта. Можно задать ID, чтобы заменить сгенерированный ID.

Имя тега элемента контейнера HTML в виде вектора символов, такого как 'div', 'section', или 'article' соответствие этому HTMLFile объект. Это свойство применяется только к выводу HTML.

Этот дочерний элемент списков свойств только для чтения элементы, что HTMLFile объект содержит.

Это списки свойств только для чтения родительский элемент этого HTMLFile объект.

Форматирование, чтобы примениться к HTMLFile объект в виде массива ячеек объектов формата DOM. Дочерние элементы этого HTMLFile объект наследовал любой из этих форматов, которые они не заменяют.

Разработайте имя этого HTMLFile объект в виде вектора символов. Используйте имя стиля, заданного в таблице стилей документа который этот HTMLFile объект добавлен. Заданный стиль задает внешний вид HTMLFile объект в выходном документе, где не замененный форматами задан этим StyleName свойство HTMLFile объект.

Пометьте для HTMLFile объект в виде вектора символов.

Уникальный идентификатор сеанса сгенерирован как часть HTMLFile создание объекта. Сгенерированный тег имеет форму CLASS:ID, где CLASS класс элемента и ID значение Id свойство объекта. Можно задать тег, чтобы заменить сгенерированный тег.

Задайте свое собственное значение тега, например, чтобы облегчить идентифицировать, где проблема произошла во время генерации документов.

Примечание

HTMLFile игнорирует KeepInterElementWhiteSpace свойство. Если вы хотите сохранить пробел, использовать fileread считать ваш файл HTML как текст и затем выполнить процедуру, описанную для mlreportgen.dom.HTMLKeepInterElementWhiteSpace свойство.

Методы

добавлениеДобавьте HTML к объекту HTMLFile

Примеры

свернуть все

Создайте текстовый файл под названием myHTML.html и сохраните его в текущей папке. Добавьте этот текст в файл:

<html>
<head>
<style>p {font-size:14pt;}</style>
</head>
<body>
<p style='white-space:pre'><b>Hello</b><i style='color:green'> World</i></p>
<p>This is <u>me</u> speaking</p>
</body>
</html>

Преобразовывать myHTML.html файл к отчету Word, запустите эти команды:

import mlreportgen.dom.*; 
rpt = Document('MyReport','docx'); 
htmlFile = HTMLFile('myHTML.html'); 
append(rpt,htmlFile); 
close(rpt); 
rptview(rpt.OutputPath);

Получившийся отчет Word содержит текст, который вы задали в файле HTML.

Советы

  • MATLAB® Report Generator™ mlreportgen.dom.HTML или mlreportgen.dom.HTMLFile объекты обычно не могут принимать необработанный вывод HTML сторонних приложений, таких как Microsoft Word, тот собственный компонент экспорта документы как разметка HTML. В этих случаях ваша программа генерации отчета API Отчета может использовать mlreportgen.utils.html2dom.prepHTMLString и mlreportgen.utils.html2dom.prepHTMLFile функции, чтобы подготовить необработанный HTML к использованию с mlreportgen.dom.HTML или mlreportgen.dom.HTMLFile объекты. Как правило, ваша программа должна будет далее обработать подготовленный HTML, чтобы удалить допустимые но нежелательные объекты, такие как переводы строки, которые были в необработанном содержимом.

  • Word и документы в формате PDF требуют встроенных элементов, таких как текст и ссылки, чтобы содержаться в абзаце. Чтобы удовлетворить это требование, синтаксический анализатор HTML создает абзацы обертки, чтобы содержать встроенные элементы, которые уже не находятся в абзаце. Если вы создаете mlreportgen.dom.HTML или mlreportgen.dom.HTMLFile объект от HTML, который содержит встроенные элементы, которые не находятся в абзацах и добавляют объект в документ HTML, сгенерированный HTML, может отличаться от входа HTML. Чтобы сгенерировать встроенные элементы без добавленных абзацев обертки, вставьте разметку HTML в документ HTML при помощи mlreportgen.dom.RawText объект.

  • По умолчанию ДОМ АПИ использует основной размер шрифта 12 точек, чтобы преобразовать em модули к фактическим размерам шрифта. Например, размер шрифта, заданный как 2em преобразует в 24 точки. Чтобы задать различный основной размер шрифта, добавьте свое содержимое в отчет при помощи mlreportgen.dom.HTML объект. Установите EMBaseFontSize свойство объекта к основному размеру шрифта. Например, если вы устанавливаете EMBaseFontSize свойство к 14, размер шрифта 2em преобразует в 28 точек.

Представленный в R2015a