Типичный элемент HTML содержит следующие компоненты:
Имя элемента - имя HTML-тега. Имя элемента соответствует Name свойства HTML-дерева.
Атрибуты (Attributes) - дополнительная информация о теге. Атрибуты HTML имеют форму name="value", где name и value обозначают имя атрибута и значение соответственно. Атрибуты отображаются в открывающемся теге HTML. Чтобы получить значения атрибутов из HTML-дерева, используйте getAttribute.
Содержимое - содержимое элемента. Содержимое отображается между открывающими и закрывающими тегами HTML. Содержимое может представлять собой текстовые данные или вложенные элементы HTML. Извлечение текста из htmlTree объект, использование extractHTMLText. Получение вложенных элементов HTML htmlTree объект, используйте Children собственность.
Например, элемент HTML <a href="https://www.mathworks.com">Home</a> содержит:
| Компонент | Стоимость | Описание |
|---|
| Имя элемента | a | Элемент является гиперссылкой |
| Признак | Наименование атрибута | href | Ссылка на гиперссылку |
| Значение атрибута | "https://www.mathworks.com" | Ссылочное значение гиперссылки |
| Содержание | Home | Текст для отображения |