Парсинг текста с entity внутри - C#

Узнай цену своей работы

Формулировка задачи:

Вот так парсю значения с сайта :
        
public static string[] takeTemp(string page, string CSSStyle)
        {
            try
            {
                var parser = new HtmlParser();
                var document = parser.Parse(page);
                
                var infoFromSite = document.QuerySelectorAll(CSSStyle);
 
                string[] tommorow = new string[infoFromSite.Length];
 
                for (int i = 0; i < infoFromSite.Length; i++)
                {
                    tommorow[i] = infoFromSite[i].TextContent.ToString();
                    
                }
 
                return tommorow;
            }
            catch (Exception ex)
            {
                Log.Write(ex);
                return null;
            }
        }
Использую AngleSharp. Значение между тегами, которое мне необходимо, является отрицательным число, например "-2". Но в самой HTML разметке это выглядит вот так "&minus;2". В итоге в консоль я получаю "?2", и с этим знаком "?" ничего сделать не могу, String.Replace не помогает, метод тыка не затащил. Прошу помощи и совета.
Спарсил всю страницу, проблема в кодировке страницы, как изменить кодировку страницы?

Решение задачи: «Парсинг текста с entity внутри»

textual
Листинг программы
tommorow[i] = infoFromSite[i].TextContent.Replace("\u2212", "-");

ИИ поможет Вам:


  • решить любую задачу по программированию
  • объяснить код
  • расставить комментарии в коде
  • и т.д
Попробуйте бесплатно

Оцени полезность:

6   голосов , оценка 4.333 из 5