Парсинг страниц прямо с сайта - C#

Узнай цену своей работы

Формулировка задачи:

Добрый день, помогите пожалуйста с решением проблемы, в интернете нашел способы как парсить страницу или страницы. Вот есть код:
Листинг программы
  1. string url = "ССЫЛКА";
  2. string html = string.Empty;
  3. string pattern = "<span itemprop=\"alternativeHeadline\">(.*?)</span>";
  4. HttpWebRequest myRequest = (HttpWebRequest)HttpWebRequest.Create(url);
  5. HttpWebResponse myResponse = (HttpWebResponse)myRequest.GetResponse();
  6. StreamReader sr = new StreamReader(myResponse.GetResponseStream(), Encoding.GetEncoding(1251));
  7. html = sr.ReadToEnd();
  8. Match res = Regex.Match(html, pattern);
  9. label1.Text = res.Groups[1].ToString();
Если в ссылке http://www.kinopoisk.ru/film/596001/ то код не работает, я скопировал код страницы и залил на хостинг и если ввожу http://mit.url.ph/index1.html, то он работает, почему так? С этим кодом тоже самое:
Листинг программы
  1. List<string> citys = new List<string>();
  2. List<string> dates = new List<string>();
  3. List<string> rating = new List<string>();
  4. WebClient web = new WebClient();
  5. String html = web.DownloadString("ССЫЛКА");
  6. MatchCollection m1 = Regex.Matches(html, "/sr/1/\">(.*?)</a>", RegexOptions.Singleline);
  7. //MatchCollection m1 = Regex.Matches(html, "/sr/1/\">(.*?)</a>", RegexOptions.Singleline);
  8. MatchCollection m2 = Regex.Matches(html, "<span class=\"year\">(.*?)</span></p>", RegexOptions.Singleline);
  9. MatchCollection m3 = Regex.Matches(html, "<div class=\"rating \" title=\"(.*?)\">", RegexOptions.Singleline);
  10. foreach (Match m in m1)
  11. {
  12. string city = m.Groups[1].Value;
  13. citys.Add(city);
  14. }
  15. foreach (Match m in m2)
  16. {
  17. string date = m.Groups[1].Value;
  18. dates.Add(date);
  19. }
  20. foreach (Match m in m3)
  21. {
  22. string rate = m.Groups[1].Value;
  23. rating.Add(rate);
  24. }
  25. listBox1.DataSource = citys;
  26. listBox2.DataSource = dates;
  27. listBox3.DataSource = rating;

Решение задачи: «Парсинг страниц прямо с сайта»

textual
Листинг программы
  1. [B]<a name="director"></a>[/B]
  2. <div style="padding-left: 20px; border-bottom: 2px solid #f60; font-size: 16px">Режиссер</div>
  3.  
  4. <div class="dub no_dub dub_first">
  5.    <div class="num">1.</div>
  6.    <div class="actorInfo">
  7.       <div class="photo"><a href="/name/1522619/"><img class="flap_img" src="http://st.kp.yandex.net/images/spacer.gif"  title="/images/sm_actor/1522619.jpg" alt="Гарет Эдвардс (Gareth Edwards)" /></a></div>
  8.       <div class="info">
  9.          <div class="name"><a href="/name/1522619/">Гарет Эдвардс</a> <span class="gray">Gareth Edwards</span></div>
  10.          <div class="role"></div>
  11.          <p class="MyKP_Folder_Select shortselect MyKP_Folder_1522619" objId="1522619" name="Мои звёзды" type="stars"></p>
  12.       </div>
  13.       <div class="clear"></div>
  14.    </div>
  15.    <div class="clear"></div>
  16. </div>
  17.  
  18. [B]<a name="actor"></a>[/B]
  19. <div style="padding-left: 20px; border-bottom: 2px solid #f60; font-size: 16px">Актеры</div>
  20.  
  21. <div class="dub no_dub dub_first">
  22.    <div class="num">1.</div>
  23.    <div class="actorInfo" style="min-height: 82px">
  24.       <div class="photo"><a href="/name/29859/"><img class="flap_img" src="http://st.kp.yandex.net/images/spacer.gif"  title="/images/sm_actor/29859.jpg" alt="Аарон Тейлор-Джонсон (Aaron Taylor-Johnson)" /></a></div>
  25.       <div class="info">
  26.          <div class="name"><a href="/name/29859/">Аарон Тейлор-Джонсон</a> <span class="gray">Aaron Taylor-Johnson</span></div>
  27.          <div class="role">... Ford Brody</div>
  28.          <p class="MyKP_Folder_Select shortselect MyKP_Folder_29859" objId="29859" alt="1"  name="Мои звёзды" type="stars"></p>
  29.       </div>
  30.       <div class="clear"></div>
  31.    </div>
  32.    <div class="clear"></div>
  33. </div>
  34.  
  35. [B]<a name="producer"></a>[/B]
  36. <div style="padding-left: 20px; border-bottom: 2px solid #f60; font-size: 16px">Продюсеры</div>
  37.  
  38.  
  39. <div class="dub no_dub dub_first">
  40.    <div class="num">1.</div>
  41.    <div class="actorInfo">
  42.       <div class="photo"><a href="/name/29742/"><img class="flap_img" src="http://st.kp.yandex.net/images/spacer.gif"  title="/images/sm_actor/29742.jpg" alt="Боб Дюксэй (Bob Ducsay)" /></a></div>
  43.       <div class="info">
  44.          <div class="name"><a href="/name/29742/">Боб Дюксэй</a> <span class="gray">Bob Ducsay</span></div>
  45.          <div class="role"></div>
  46.          <p class="MyKP_Folder_Select shortselect MyKP_Folder_29742" objId="29742" name="Мои звёзды" type="stars"></p>
  47.       </div>
  48.       <div class="clear"></div>
  49.    </div>
  50.    <div class="clear"></div>
  51. </div>

ИИ поможет Вам:


  • решить любую задачу по программированию
  • объяснить код
  • расставить комментарии в коде
  • и т.д
Попробуйте бесплатно

Оцени полезность:

14   голосов , оценка 4 из 5

Нужна аналогичная работа?

Оформи быстрый заказ и узнай стоимость

Бесплатно
Оформите заказ и авторы начнут откликаться уже через 10 минут