Парсер для сайта, который получал бы цены и имена - C#
Формулировка задачи:
Понадобилось написать парсер для сайта, который выдирал бы цены и имена. и закидывал их в бд, Вот только посоветуйте на каком языке лучше писать, с С# я более менее знаком. Вот впринципе такой вопрос, Стоит ли писать на C# и есть ли где нить, хотябы примерный шаблон для парсера?
Если нужно будет представление о сайте, дам в личку, тут наверное нельзя ссылки оставлять.
Вот кусок кода, мне нужно, вытаскивал выделеное. Дайте совет. Сначала думал по title=" вытаскивать и по price-bold"> (т.е. после выполнения кода должно вернуть AARON GOODCHILDE 3.99) но титлов несколько. Кароче не могу придумать, дайте совет, или пример кода.Буду очень признателен.
HTML код по ссылке
А еще, подскажите как вытащить HTML код, по ссылке?
<img src="http://ep.yimg.com/ca/I/yhst-99140670482918_2219_301286" width="71" height="100" border="0" hspace="0" vspace="0" alt="AARON GOODCHILDE" title="AARON GOODCHILDE" /></a></td><td><div class="name"><a href="aago.html" title="AARON GOODCHILDE">AARON GOODCHILDE</a></div><div class="price-bold">$3.99</div>
Кароче код получилось выдрать. Теперь подскажите как лучше вытаскивать? Перебор с какими условиями должен быть?
HttpWebRequest req; HttpWebResponse resp; StreamReader sr; string content; req = (HttpWebRequest)WebRequest.Create("http://xxx.yyy/zzz.html"); resp = (HttpWebResponse)req.GetResponse(); sr = new StreamReader(resp.GetResponseStream(), Encoding.GetEncoding("windows-1251")); content = sr.ReadToEnd(); sr.Close(); richTextBox1.Text = content;
Дело в том что там стена текста, перебирать ее по символьно будет туговато
Решение задачи: «Парсер для сайта, который получал бы цены и имена»
textual
Листинг программы
string s = match.Groups[2].Value; test x = new test() { name = match.Groups[1].Value, old_price = s}; context.test.AddObject(x); context.SaveChanges();
ИИ поможет Вам:
- решить любую задачу по программированию
- объяснить код
- расставить комментарии в коде
- и т.д