Работа с HTML, XPath, анализ DOM дерева

Простейшие вопросы в области инженерной разработки

Работа с HTML, XPath, анализ DOM дерева

Postby kashegor on 02 Jul 2019, 20:45

Всем привет! Товарищи, появилась одна задача по которой пока не могу придумать даже с чего начать, суть следующая:
1. Имеется определенный html сайт, мы получаем его код - соответственно это реализовано
2. После, необходимо, скорее всего проанализировать DOM дерева сайта и снять с него всю текстовую информацию, после поместить ее в массив вида:
|labVIEW Portal|XPath данного объекта|
|Список форумов|XPath данного объекта|
|Форум инженеров|XPath данного объекта|
.
.
.
|IT support by TemaSM|XPath данного объекта|
Собственно в этом и есть вся загвоздка.

Может у кого есть какие мысли? Заранее спасибо!
kashegor
beginner
beginner
 
Posts: 47
Joined: 31 Jul 2017, 17:04
LabVIEW Version: 12
Karma: 0

Re: Работа с HTML, XPath, анализ DOM дерева

Postby IvanLis on 02 Jul 2019, 23:43

kashegor wrote:Может у кого есть какие мысли? Заранее спасибо!

Готового инструмента Вы вряд ли найдете.
HTML страницу можно разобрать как любой документ с текстовой разметкой.
Можно использовать XML парсер или JSON.
Посмотрите как это делают люди: https://www.rajsite.com/2016/06/25/scra ... bview.html
Примеров достаточно, даже у нас есть на форуме, например:
http://www.labviewportal.org/viewtopic.php?f=87&t=9364
http://www.labviewportal.org/viewtopic.php?f=142&t=6431
User avatar
IvanLis
professor
professor
 
Posts: 4815
Joined: 02 Dec 2009, 17:44
Location: СССР
Medals: 7
Activity (2) Professionalism (1) Tutorials (1) Gold (1) Man of the year 2012 (1)
Автор (1)
LabVIEW Version: 2015, 2016
Karma: 763
hardware VIP bloggers teachers


Return to Для чайников

Who is online

Users browsing this forum: Bing [Bot], Google and 7 guests

cron