Как распарсить HTML-страницу - C#
Формулировка задачи:
Пытаюсь спарсить содержимое href
Облазил кучу сайтов, перепробовал кучу вариантов... не работает
Собственно нужно....
загрузить страницу
Найти на ней кусок <a title="тест" class="non_underline" href="?login=mylogin&mail=4278127">Текст ссылки</a>
Взять значение href
Поместить в textBox.Text
Вот, что я накодил
Но результата ноль.. Прога стартует без ошибок... Но в Текстбоксе пусто Что я делаю не так??? Уже второй день мучаюсь...
private void button2_Click(object sender, EventArgs e)
{
string ur = "http://"+textBox1.Text;
HttpWebRequest requestmail = HttpWebRequest.Create(ur) as HttpWebRequest;
HttpWebResponse responsemail = (HttpWebResponse)requestmail.GetResponse();
StreamReader myStream1 = new StreamReader(responsemail.GetResponseStream(), Encoding.GetEncoding(1251));
string page1 = myStream1.ReadToEnd();
HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
doc.Load(new StringReader(page1));
HtmlNodeCollection node = doc.DocumentNode.SelectNodes("//body/center/table[1]/tr[2]/td[2]/div/table/tr[4]/td[2]/a");
if (node != null)
{
foreach (HtmlNode docs in node)
{
var u = docs.Attributes["href"].Value;
textBox3.Text = u;
}
}
}Решение задачи: «Как распарсить HTML-страницу»
textual
Листинг программы
var getcode = new Regex(@"(?<upd>\d.*)<br>"); string code = getcode.Match(page3).Groups["upd"].Value;