Парсинг новостной группы в Vk - Python
Формулировка задачи:
беда какая-то с картинками, дело в том что картинок несколько бывает к новости прикрепляют, также и ауди бывает(не плоъо было бы и аудио это получать, но все по-тихоньку)как-то не сложилось у меня с картинками...так же хотел спросить, вот содержимое без проблем мы получаем, а картинки только с помощью регулярок можно достать или есть какой-то другой более удобный способ? в общем мой код.
Листинг программы
- from selenium import webdriver
- from bs4 import BeautifulSoup
- import re
- import csv
- driver = webdriver.Firefox()
- url = "http://vk.com/oldlentach"
- driver.get(url)
- driver.implicitly_wait(10)
- page = BeautifulSoup(driver.page_source, "html.parser")
- names = []
- pictures = []
- rows = page.findAll('div',{'class':"wall_post_text"})
- for name in rows:
- names.append(name.text)
- for i in range(len(names)):
- names[i] = names[i].strip()
- divs = page.find_all('img', {'class':'page_post_thumb_sized_photo'})
- p = re.compile('src="(.*?jpg)"')
- pictures = p.findall(str(divs))
- with open ('lenta.csv','w',encoding='utf8') as csvfile:
- writer = csv.writer(csvfile)
- for row in zip(names,pictures):
- writer.writerow(row)
Решение задачи: «Парсинг новостной группы в Vk»
textual
Листинг программы
- info['attachments']
ИИ поможет Вам:
- решить любую задачу по программированию
- объяснить код
- расставить комментарии в коде
- и т.д