Можно ли разобрать не валидный код с HtmlAgilityPack или только регулярки? - C#
Формулировка задачи:
Решил спарсить страничку и чуть комп не разбил скажите можно ли спасить такую страничку с помощью HtmlAgilityPack или только регулярка блок специально целый скинул как единица из кода
так стоп почему-то из браузера он валидный буду искать в чем проблема
а вот если прямо из браузера Что за фигня объясните во втором случае перед <TBODY нету закрывающего тега </tbody> как в первом а еще и уродство с кавычками и Заглавными буквами. это что защита такая, тогда как консоль разработчиков делает валидный текст есть функция какая что-ли. Помогите пожалуйста
скажите что такое копирую исходный код через правую кнопку мыши код не валидный, а вот если копирую через консоль разработчика все валидное, по крайней мере на первый взгляд. Вот через консоль разработчика
</tbody><tbody class="row1 props" style="display:" id="p4681">
<TBODY class="row1 props" style="display:" id=p4679>
Решение задачи: «Можно ли разобрать не валидный код с HtmlAgilityPack или только регулярки?»
textual
Листинг программы
HtmlAgilityPack.HtmlDocument htmlDoc = new HtmlAgilityPack.HtmlDocument(); // There are various options, set as needed htmlDoc.OptionFixNestedTags=true; // filePath is a path to a file containing the html htmlDoc.Load(filePath); // Use: htmlDoc.LoadHtml(xmlString); to load from a string (was htmlDoc.LoadXML(xmlString) // ParseErrors is an ArrayList containing any errors from the Load statement if (htmlDoc.ParseErrors != null && htmlDoc.ParseErrors.Count() > 0) { // Handle any parse errors as required } else { if (htmlDoc.DocumentNode != null) { HtmlAgilityPack.HtmlNode bodyNode = htmlDoc.DocumentNode.SelectSingleNode("//body"); if (bodyNode != null) { // Do something with bodyNode } } }
ИИ поможет Вам:
- решить любую задачу по программированию
- объяснить код
- расставить комментарии в коде
- и т.д