Парсинг текста на сайте с защитой от копирования - Python

Узнай цену своей работы

Формулировка задачи:

Уважаемые, прошу помощи: есть сайт с текстом книги, но он защищен от копирования. Помогите спарсить весь текст книги в файлик. https://prodaman.ru/safonova/books/Lunnyj-veter?page=1

Решение задачи: «Парсинг текста на сайте с защитой от копирования»

textual
Листинг программы
from bs4 import BeautifulSoup as BS
import requests
 
def get_html(url):
 
    r = requests.get(url)
    r.encoding = 'utf-8'
    return r.text
 
for p in range(1, 34):
    url = f'https://prodaman.ru/safonova/books/Lunnyj-veter?page={p}'
 
    soup = BS(get_html(url), 'lxml')
    r = soup.find('div', class_='blog-text noselect reader-box')
    with open('out.txt', 'a', encoding='utf-8') as f:
        for i in r:
            print(i, file=f)
 
    soup = BS(get_html(url), 'lxml')
    r = soup.find('div', class_='blog-text noselect reader-box')
    with open('out.txt', 'a', encoding='utf-8') as f:
        for i in r:
            print(i, file=f)

ИИ поможет Вам:


  • решить любую задачу по программированию
  • объяснить код
  • расставить комментарии в коде
  • и т.д
Попробуйте бесплатно

Оцени полезность:

14   голосов , оценка 4.071 из 5
Похожие ответы