Типичный элемент HTML содержит следующие компоненты:
Имя элемента - Имя тега HTML. Имя элемента соответствует Name
свойство HTML.
Атрибуты - Дополнительная информация о теге. Атрибуты HTML имеют форму name
= «value
"
, где name
и value
обозначить имя и значение атрибута соответственно. Атрибуты появляются в открывающем HTML. Чтобы получить значения атрибутов из HTML, используйте getAttribute
.
Содержимое - Содержимое элемента. Содержимое отображается между открытием и закрытием HTML. Содержимым могут быть текстовые данные или вложенные элементы HTML. Чтобы извлечь текст из htmlTree
объект, использование extractHTMLText
. Чтобы получить вложенный HTML элементов htmlTree
объект, используйте Children
свойство.
Например, элемент HTML <a href="https://www.mathworks.com">Home</a>
содержит следующие компоненты:
Компонент | Значение | Описание |
---|
Имя элемента | a | Элемент является гиперссылкой |
Признак | Имя атрибута | href | Ссылка на гиперссылку |
Значение атрибута | "https://www.mathworks.com" | Значение ссылки гиперссылки |
Содержимое | Home | Текст для отображения |