Посчитать слова с текста на сайте - Python

Узнай цену своей работы

Формулировка задачи:

Как посчитать слова в тексте новости на странице сайта ?

Решение задачи: «Посчитать слова с текста на сайте»

textual
Листинг программы
  1. import requests
  2. import lxml.html
  3. import re
  4.  
  5. url = 'http://www.cyberforum.ru/python-web/thread1969000.html' # этот топик
  6. css_post = 'div#post_message_10374313'   # ваш  последний пост
  7.  
  8. resp = requests.get(url)
  9. tree = lxml.html.fromstring(resp.text)
  10. posts = tree.cssselect(css_post)
  11. if posts is not None:
  12.     post_content = posts[0].text_content().strip()
  13.     print(post_content)
  14.     words = re.findall(r'\w+', post_content) # примитивный способ разбивки на слова-токены, очень не точный
  15.     print(words)
  16.     print(len(words)) # всего токенов без учета регистра и повторов
  17.  
  18.     words = {word.lower() for word in re.findall(r'\w+', post_content)} # уникальные токены с нормализованным регистром
  19.     print(words)
  20.     print(len(words))

ИИ поможет Вам:


  • решить любую задачу по программированию
  • объяснить код
  • расставить комментарии в коде
  • и т.д
Попробуйте бесплатно

Оцени полезность:

7   голосов , оценка 3.571 из 5

Нужна аналогичная работа?

Оформи быстрый заказ и узнай стоимость

Бесплатно
Оформите заказ и авторы начнут откликаться уже через 10 минут