Найти отдельные куски динамической информации(имя, деят, возраст) в HTML документе - C#

Узнай цену своей работы

Формулировка задачи:

Суть программы. Есть много-много страничек с людьми и информацией о них на одном сайте. Нужно все странички сделать (грубо говоря) отдельными сайтами с одинаковым дизайном (шаблон уже есть). Так как вручную это очень долго, было решено сделать программу на C#: вставляется ссылка на старую страницу в текст. поле, нажимается кнопка и готово. Мой алгоритм программы. 1) Ввод ссылки и загрузка страницы в стр.переменную. (готово). 2) Поиск нужной информации и запись в отдельные переменные. 3) Подстановка переменных в шаблон (готово). 4) Создание отдельной папки и страницы (готово). PS: Перед этим делал похожую программу, только там были поля в которую ручками записываешь все эти данные и он формирует страницу (но это тоже весьма долго). Вот код получения страницы:
Листинг программы
  1. HttpWebRequest req;
  2. HttpWebResponse resp;
  3. StreamReader sr;
  4. string content;
  5. req = (HttpWebRequest)WebRequest.Create(textBoxAdress.Text);
  6. resp = (HttpWebResponse)req.GetResponse();
  7. sr = new StreamReader(resp.GetResponseStream(), Encoding.GetEncoding("UTF-8"));
  8. content = sr.ReadToEnd();
  9. sr.Close();
HTML документ большой(400), поэтому вот только тот кусок, по которому я хотя бы смогу понять алгоритм действий.
Листинг программы
  1. <div id="content" role="main">
  2. <header class="entry-header">
  3. <h1 class="entry-title">Иванов Иван Иванович</h1>
  4. </header>
  5. <div class="entry-content">
  6. <strong>Строитель</strong>
  7. <img src="www.oldsite.com/img.jpeg" />
  8. </div>
  9. <div>Не женат</div>
  10. <div>28 лет</div>
  11. </div>
*Поля id, class, role - как в оригинальной странице. Вопросы: 1) Так как информация и имена постоянно меняются как их находить в HTML - документе? (Например будет, Андреев Максим, Грузчик, Женат, 26 лет и т.д.) 2) Если существуют технологии более удобные для решения подобных задач/проблем я открыт для предложений.

Решение задачи: «Найти отдельные куски динамической информации(имя, деят, возраст) в HTML документе»

textual
Листинг программы
  1. HTMLDocument mypage = (HTMLDocument)wb.Document;
  2. HTMLSelectElement select = mypage.getElementById("inpbx") as HTMLSelectElement;
  3. var s = select.value;

ИИ поможет Вам:


  • решить любую задачу по программированию
  • объяснить код
  • расставить комментарии в коде
  • и т.д
Попробуйте бесплатно

Оцени полезность:

11   голосов , оценка 3.727 из 5

Нужна аналогичная работа?

Оформи быстрый заказ и узнай стоимость

Бесплатно
Оформите заказ и авторы начнут откликаться уже через 10 минут
Похожие ответы