exponenta event banner

mlreportgen.dom.HTMLFile класс

Пакет: mlreportgen.dom

Преобразование HTML-файла в документ DOM

Описание

Преобразует содержимое HTML-файла в mlreportgen.dom.HTMLFile объект, содержащий объекты DOM, имеющие одинаковое содержимое и формат. Вы можете добавить HTMLFile объект для DOM-документа любого типа, включая документы Word и PDF.

Строительство

htmlFileObj = HTMLFile(htmlFile) преобразует HTML-файл в HTMLFile объект, содержащий объекты DOM, имеющие одинаковое содержимое и формат.

Один HTMLFile поддерживает эти HTML-элементы и атрибуты. Кроме того, HTMLFile объекты принимают HTML, содержащий пользовательские свойства CSS, которые начинаются с дефиса. Пользовательские свойства CSS поддерживаются в выходных данных HTML, Microsoft ® Word и PDF.

Элемент HTMLПризнаки
aclass, style, href, name
addressclass, style
bclass, style
bigclass, style
blockquoteclass, style
bodyclass, style
brn/a
centerclass, style
citeclass, style
codeclass, style
ddclass, style
delclass, style
dfnclass, style
divclass, style
dlclass, style
dtclass, style
emclass, style
fontclass, style, color, face, size
h1, h2, h3, h4, h5, h6class, style, align
hrclass, style, align
iclass, style
insclass, style
imgclass, style, src, height, width
kbdclass, style
liclass, style
markclass, style
nobrclass, style
olclass, style
pclass, style, align
preclass, style
sclass, style
sampclass, style
smallclass, style
spanclass, style
strikeclass, style
strongclass, style
subclass, style
supclass, style
tableclass, style, align, bgcolor, border, cellspacing, cellpadding, frame, rules, width
tbodyclass, style, align, valign
tfootclass, style, align, valign
theadclass, style, align, valign
tdclass, style, bgcolor, height, width, colspan, rowspan,align, valign, nowrap
thclass, style, bgcolor, height, width, colspan, rowspan,align, valign, nowrap
trclass, style, align,bgcolor, valign
ttclass, style
uclass, style
ulclass, style
varclass, style

Сведения об этих элементах см. в разделе https://developer.mozilla.org/en-US/docs/Web/HTML/Element.

Поддерживаются следующие форматы CSS:

  • background-color

  • border

  • border-bottom

  • border-bottom-color

  • border-bottom-style

  • boder-bottom-width

  • border-color

  • border-left

  • border-left-color

  • border-left-style

  • boder-left-width

  • border-right

  • border-right-color

  • border-rigtht-style

  • border-right-width

  • border-style

  • border-top

  • border-top-color

  • border-top-style

  • border-top-width

  • border-width

  • color

  • counter-increment

  • counter-reset

  • display

  • font-family

  • font-size

  • font-style

  • font-weight

  • height

  • line-height

  • list-style-type

  • margin

  • margin-bottom

  • margin-left

  • margin-right

  • margin-top

  • padding

  • padding-bottom

  • padding-left

  • padding-right

  • padding-top

  • text-align

  • text-decoration

  • text-indent

  • vertical-align

  • white-space

  • width

Для получения информации об этих форматах https://developer.mozilla.org/en-US/docs/Web/CSS/Reference.

Входные аргументы

развернуть все

Путь к файлу HTML, указанный как символьный вектор.

Свойства

развернуть все

Примечание

Для правильного отображения разметки HTML в отчете необходимо включить конечные теги для пустых элементов и заключить значения атрибутов в кавычки. Для отображения зарезервированного XML-знака разметки в виде текста необходимо использовать эквивалентный ему именованный или числовой символ XML.

Зарезервированный символОписаниеЭквивалентный символ
>Больше, чем>
<Меньше, чем&lt;
&Амперсанд&amp;
"Двойная кавычка&quot;
'Одинарная кавычка&apos;
%Процент&#37;

Уникальный идентификатор сеанса генерируется как часть HTMLFile создание объекта. Можно указать идентификатор для замены созданного идентификатора.

Имя тега элемента контейнера HTML, указанного как символьный вектор, например 'div', 'section', или 'article' соответствующие этому HTMLFile объект. Это свойство применяется только к HTML-выводу.

Это свойство только для чтения содержит список дочерних элементов, которые HTMLFile объект содержит.

Это свойство, доступное только для чтения, содержит список родительских элементов HTMLFile объект.

Форматирование для применения к HTMLFile , заданный как массив ячеек объектов формата DOM. Дети этого HTMLFile объект наследует любой из этих форматов, который они не переопределяют.

Имя стиля этого HTMLFile объект, указанный как символьный вектор. Использовать имя стиля, указанного в таблице стилей документа, к которому он относится HTMLFile объект добавлен. Указанный стиль определяет внешний вид HTMLFile объект в выходном документе, где он не переопределен форматами, указанными в StyleName имущества HTMLFile объект.

Тег для HTMLFile объект, указанный как символьный вектор.

Уникальный идентификатор сеанса генерируется как часть HTMLFile создание объекта. Созданный тег имеет форму CLASS:ID, где CLASS является классом элемента и ID - значение Id свойства объекта. Можно указать тег для замены созданного тега.

Укажите собственное значение тега, например, чтобы легче было определить, где возникла проблема во время создания документа.

Примечание

HTMLFile игнорирует KeepInterElementWhiteSpace собственность. Если требуется сохранить пробел, используйте fileread чтобы прочитать ваш HTML-файл в виде текста, а затем следуйте процедуре, описанной для mlreportgen.dom.HTMLKeepInterElementWhiteSpace собственность.

Методы

приложитьДобавление HTML к объекту HTMLFile

Примеры

свернуть все

Создание текстового файла с именем myHTML.html и сохраните его в текущей папке. Добавьте в файл следующий текст:

<html>
<head>
<style>p {font-size:14pt;}</style>
</head>
<body>
<p style='white-space:pre'><b>Hello</b><i style='color:green'> World</i></p>
<p>This is <u>me</u> speaking</p>
</body>
</html>

Чтобы преобразовать myHTML.html файл в отчет Word, выполните следующие команды:

import mlreportgen.dom.*; 
rpt = Document('MyReport','docx'); 
htmlFile = HTMLFile('myHTML.html'); 
append(rpt,htmlFile); 
close(rpt); 
rptview(rpt.OutputPath);

Результирующий отчет Word содержит текст, указанный в файле HTML.

Совет

  • Отчет MATLAB ® Generator™ mlreportgen.dom.HTML или mlreportgen.dom.HTMLFile объекты обычно не могут принимать необработанные HTML-данные сторонних приложений, таких как Microsoft Word, которые экспортируют собственные документы в виде разметки HTML. В этих случаях программа создания отчетов Report API может использовать mlreportgen.utils.html2dom.prepHTMLString и mlreportgen.utils.html2dom.prepHTMLFile для подготовки необработанного HTML для использования с mlreportgen.dom.HTML или mlreportgen.dom.HTMLFile объекты. Как правило, программа должна будет продолжить обработку подготовленного HTML для удаления допустимых, но нежелательных объектов, таких как каналы строк, которые находились в необработанном содержимом.

  • Для документов Word и PDF в абзаце должны содержаться встроенные элементы, такие как текст и ссылки. Для выполнения этого требования синтаксический анализатор HTML создает абзацы-оболочки, содержащие встроенные элементы, которые еще не включены в абзац. При создании mlreportgen.dom.HTML или mlreportgen.dom.HTMLFile объект из HTML, который содержит встроенные элементы, отсутствующие в абзацах, и добавляет объект в HTML-документ, созданный HTML может отличаться от входного HTML. Чтобы создать встроенные элементы без добавленных абзацев-оболочек, вставьте разметку HTML в HTML-документ с помощью mlreportgen.dom.RawText объект.

  • По умолчанию DOM API использует базовый размер шрифта 12 точек для преобразования em единиц к фактическим размерам шрифта. Например, размер шрифта, указанный как 2em преобразует в 24 точки. Чтобы указать другой размер базового шрифта, добавьте содержимое в отчет с помощью mlreportgen.dom.HTML объект. Установите EMBaseFontSize свойство объекта до базового размера шрифта. Например, если задать EMBaseFontSize свойство 14, размер шрифта 2em преобразует в 28 точек.

Представлен в R2015a