Распарсить HTML с помощью регулярных выражений - Visual Basic .NET
Формулировка задачи:
Есть строка такая:
Необходимо переделать регулярное выражение, чтоб только выводился текст из кавычек: Лаборатория измерений в институте
Кодом ниже захватывает больше: description" content="Лаборатория измерений в институте"
Как изменить регулярку?
Листинг программы
- <meta name="description" content="Лаборатория измерений в институте">
Листинг программы
- Dim regexp As New Regex("description"" content=""(.+?)""", RegexOptions.IgnoreCase Or RegexOptions.Singleline)
- ' description"" content=""(.+?)""
- Dim m As MatchCollection
- m = regexp.Matches(TextBox2.Text)
- For i = 0 To m.Count - 1
- TextBox3.Text = m.Item(i).Value
- Next
Решение задачи: «Распарсить HTML с помощью регулярных выражений»
textual
Листинг программы
- ' 1. Загружаем html текст
- Dim html As String = File.ReadAllText("D:\Site\index.html")
- ' 2. Парсим html
- Dim htmlDoc As New HtmlAgilityPack.HtmlDocument
- htmlDoc.LoadHtml(html)
- Dim metaDescription As String = htmlDoc.DocumentNode.SelectSingleNode("/html/head/meta[@name='description']").GetAttributeValue("content", "")
ИИ поможет Вам:
- решить любую задачу по программированию
- объяснить код
- расставить комментарии в коде
- и т.д