Какие-то странности с html, из-за этого трудности с парсингом в HtmlAgilityPack.dll - C#
Формулировка задачи:
Есть таблица в html коде:
Она же и на скриншоте, но открыта гугл хромом. И на нём видно, что там закрывающие теги </tr> расположены там, где по идее мне и нужно, а на реальном html коде они почему-то в самом низу, кроме заголовка таблицы. Вот из-за этой неправильной вложенности проблемы с парсингом значений из этой таблицы. Реальная таблица примерна такая же, только элементов в ней больше, так для краткости сократил. То есть я получаю во время парсинга узел содержащий html код, который я выложил в этой теме.
Листинг программы
- <table cellspacing="0" cellpadding="0" width="100%" border="1">
- <tbody>
- <tr>
- <th>Время</th>
- <th>Этап</th>
- <th>Номер</th>
- </tr>
- <tr bgcolor="silver">
- <td>17:05:44</td>
- <td>Первый</td>
- <td>1</td>
- <tr bgcolor="silver">
- <td>17:09:44</td>
- <td>Второй</td>
- <td>1</td>
- <tr bgcolor="silver">
- <td>22:13:12</td>
- <td>Третий</td>
- <td>1</td>
- <tr>
- <td bordercolor="white"><strong>Что-то туту было</strong></td>
- </tr>
- </tr>
- </tr>
- </tr>
- </tbody>
- </table>
Решение задачи: «Какие-то странности с html, из-за этого трудности с парсингом в HtmlAgilityPack.dll»
textual
Листинг программы
- <TR>
- <TD>
- <TABLE cellSpacing=0 cellPadding=0 width="100%" border=1>
- <TBODY>
- <TR>
- <TH>Время</TH>
- <TH>Этап</TH>
- <TH>Номер</TH>
- </TR>
- <TR bgColor=silver>
- <TD>17:05:44</TD>
- <TD>Первый</TD>
- <TD>1</TD>
- <TR bgColor=silver>
- <TD>17:09:44</TD>
- <TD>Второй</TD>
- <TD>1</TD>
- <TR bgColor=silver>
- <TD>22:13:12</TD>
- <TD>Третий</TD>
- <TD>1</TD>
- <TR>
- <TD borderColor=white><STRONG>Тут что-то было</STRONG></TD>
- </TR>
- </TBODY>
- </TABLE>
- </TD>
- </TR>
ИИ поможет Вам:
- решить любую задачу по программированию
- объяснить код
- расставить комментарии в коде
- и т.д