Парсинг текста на сайте с защитой от копирования - Python
Формулировка задачи:
Уважаемые, прошу помощи: есть сайт с текстом книги, но он защищен от копирования. Помогите спарсить весь текст книги в файлик.
https://prodaman.ru/safonova/books/Lunnyj-veter?page=1
Решение задачи: «Парсинг текста на сайте с защитой от копирования»
textual
Листинг программы
- from bs4 import BeautifulSoup as BS
- import requests
- def get_html(url):
- r = requests.get(url)
- r.encoding = 'utf-8'
- return r.text
- for p in range(1, 34):
- url = f'https://prodaman.ru/safonova/books/Lunnyj-veter?page={p}'
- soup = BS(get_html(url), 'lxml')
- r = soup.find('div', class_='blog-text noselect reader-box')
- with open('out.txt', 'a', encoding='utf-8') as f:
- for i in r:
- print(i, file=f)
- soup = BS(get_html(url), 'lxml')
- r = soup.find('div', class_='blog-text noselect reader-box')
- with open('out.txt', 'a', encoding='utf-8') as f:
- for i in r:
- print(i, file=f)
ИИ поможет Вам:
- решить любую задачу по программированию
- объяснить код
- расставить комментарии в коде
- и т.д