Парсер love.mail.ru (htmlagilitypack) - C#

Узнай цену своей работы

Формулировка задачи:

Всем добрый день. Есть проект парсинга love.mail.ru (http://love.mail.ru/search.phtml?ia=...0_0_0_0&form=1) Пришел в тупик. Задача : Спарсить ID людей .(Используюя

htmlagilitypack

) Кто-то скажет: Можно регулярками - НЕТ, учусь htmlagilitypack Проблема: Начинаю парсить и парсится нормально,но с мусором (да да ,я криво составляю запрос и у меня парсит ID не с ссылки,а со скрипта. ) Опять же - мусор можно убрать,но как спарсить ссылку? Картинка Всем спасибо кто пытается помочь. _exp10der_ если ты читаешь это,то спасибо что помогаешь новичкам
Листинг программы
  1. using HtmlAgilityPack;
  2. using System;
  3. using System.Collections.Generic;
  4. using System.ComponentModel;
  5. using System.Data;
  6. using System.Drawing;
  7. using System.Linq;
  8. using System.Text;
  9. using System.Threading.Tasks;
  10. using System.Windows.Forms;
  11. using xNet.Net;
  12. namespace WindowsFormsApplication6
  13. {
  14. public partial class Form1 : Form
  15. {
  16. CookieDictionary cookie = new CookieDictionary();
  17. HttpRequest request = new HttpRequest();
  18. public Form1()
  19. {
  20. InitializeComponent();
  21. request.Cookies = cookie;
  22. }
  23.  
  24. private void button1_Click(object sender, EventArgs e)
  25. {
  26. RTB.Clear();
  27. Go_Pars();
  28.  
  29. }
  30. public void Go_Pars() {
  31. string zapros = @"http://love.mail.ru/search.phtml?ia=F&lf=N&af=18&at=80&t=a&s_c=0_0_0_0&form=1";
  32. string content = "";
  33. request.UserAgent = HttpHelper.IEUserAgent();
  34. // Отправляем запрос.
  35. request.Referer = HttpHelper.UrlEncode(zapros);
  36. HttpResponse response = request.Get(zapros);
  37. // Принимаем тело сообщения в виде строки.
  38. content = response.ToString();
  39. HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
  40. HtmlNodeCollection nodes;
  41. doc.LoadHtml(content);
  42. //Парсим страницу на блоки со ссылками
  43. // nodes = doc.DocumentNode.SelectNodes("//div[@class='serp-list']//span[@class='serp-url__item']//a[1]");
  44. // href
  45. // nodes = doc.DocumentNode.SelectSingleNode("//a").GetAttributeValue("href", "");
  46. nodes = doc.DocumentNode
  47. .SelectNodes("//*[@class='tiles-list js-search-results-container']"); //.Attributes["href"];
  48. int count = 0;
  49. int pos = 0;
  50. if (nodes == null)
  51. return;
  52. foreach (HtmlNode node in nodes)
  53. {
  54. count++;
  55. RTB.AppendText(count + ". " + node.InnerText + "\n");
  56. pos += node.InnerText.Length + 1 + (Convert.ToString(count) + ". ").Length;
  57. }
  58. }
  59.  
  60. }
  61. }

Решение задачи: «Парсер love.mail.ru (htmlagilitypack)»

textual
Листинг программы
  1. HtmlDocument doc = new HtmlDocument();
  2.             doc.LoadHtml(html);

ИИ поможет Вам:


  • решить любую задачу по программированию
  • объяснить код
  • расставить комментарии в коде
  • и т.д
Попробуйте бесплатно

Оцени полезность:

15   голосов , оценка 4.133 из 5

Нужна аналогичная работа?

Оформи быстрый заказ и узнай стоимость

Бесплатно
Оформите заказ и авторы начнут откликаться уже через 10 минут