Парсинг текста на сайте с защитой от копирования - Python
Формулировка задачи:
Уважаемые, прошу помощи: есть сайт с текстом книги, но он защищен от копирования. Помогите спарсить весь текст книги в файлик.
https://prodaman.ru/safonova/books/Lunnyj-veter?page=1
Решение задачи: «Парсинг текста на сайте с защитой от копирования»
textual
Листинг программы
from bs4 import BeautifulSoup as BS import requests def get_html(url): r = requests.get(url) r.encoding = 'utf-8' return r.text for p in range(1, 34): url = f'https://prodaman.ru/safonova/books/Lunnyj-veter?page={p}' soup = BS(get_html(url), 'lxml') r = soup.find('div', class_='blog-text noselect reader-box') with open('out.txt', 'a', encoding='utf-8') as f: for i in r: print(i, file=f) soup = BS(get_html(url), 'lxml') r = soup.find('div', class_='blog-text noselect reader-box') with open('out.txt', 'a', encoding='utf-8') as f: for i in r: print(i, file=f)
ИИ поможет Вам:
- решить любую задачу по программированию
- объяснить код
- расставить комментарии в коде
- и т.д