Парсинг сайта - C# (177939)
Формулировка задачи:
Имеется страница с примерно следующим содержимым
Хотелось бы получить то что находится между <b>*</b>
Пытался сделать так
Листинг программы
- ...
- <div class="main random">
- <b>1</b>
- <b>123</b>
- <b>12</b>
- <b>63</b>
- <b>52</b>
- </div>
- ...
- <div class="main random">
- <b>112</b>
- <b>64</b>
- <b>86</b>
- <b>63</b>
- <b>52</b>
- </div>
- ...
Листинг программы
- private string Pars(string text)
- {
- var webClient = new System.Net.WebClient();
- string html = webClient.DownloadString(text);
- string pattern = @"(?<=<div class=""main random"">)(.*)(?=</div>)";
- Regex regex = new Regex(pattern);
- Match match = regex.Match(html.ToString());
- string result = "";
- while (match.Success)
- {
- result += match.Value;
- match = match.NextMatch();
- }
- return result;
- }
Решение задачи: «Парсинг сайта»
textual
Листинг программы
- foreach (HtmlAgilityPack.HtmlNode divNode in doc.DocumentNode.SelectNodes("//div[@class=\"main random\"]"))
- {
- foreach (HtmlAgilityPack.HtmlNode node in divNode.SelectNodes("b"))
- {
- string part = node.InnerText;
- }
- }
ИИ поможет Вам:
- решить любую задачу по программированию
- объяснить код
- расставить комментарии в коде
- и т.д