Говнокод #23172 — Python — Говнокод.ру

Говнокод: по колено в коде.

Нашли или выдавили из себя код, который нельзя назвать нормальным, на который без улыбки не взглянешь? Не торопитесь его удалять или рефакторить, — запостите его на говнокод.ру, посмеёмся вместе!

Python / Говнокод #23172

import csv
import json

import requests

from io import StringIO

from lxml import etree


class DayPicParser(object):
    url = 'урл_до_сайта'

    def get_info(self):
        handler = open('daypic.csv', 'w+')
        page = 1
        rows = []
        tags = set()
        while page <= 1077:
            response = requests.get('{}/page/{}'.format(self.url, page))
            response.connection.close()
            parser = etree.HTMLParser()
            tree = etree.parse(StringIO(response.text), parser)
            posts = tree.xpath('//div[@class="posts"]/div[@class="post"]')
            for i, post in enumerate(posts):
                title = post.find('./h2/a')
                link_to_fulltext = title.attrib['href']

                short_text = post.find('./div[@class="text"]//p[1]')
                response = requests.get(link_to_fulltext)
                full_parser = etree.HTMLParser()
                full_tree = etree.parse(StringIO(response.text), full_parser)
                full_post = full_tree.xpath('//div[@class="text"]//p')

                main_image = None
                full_text = []
                for inner in full_post:
                    if inner.find('.//noindex') is not None:
                        continue
                    if inner.find('.//img') is not None:
                        src = inner.find('.//img').attrib['src']
                        if not main_image:
                            main_image = src
                        full_text.append({'image': src})
                    for paragraph in etree.tostring(inner, method="text", encoding='utf-8').decode('utf-8').strip().split("\n"):
                        if paragraph:
                            full_text.append({'text': paragraph})
                rows.append({'title': title.text.strip(),
                             'preview': main_image if main_image else '',
                             'short_text': short_text.text.strip(),
                             'full_text': full_text})
                print('Post {} of {}'.format(i, len(posts)))
            page += 1
            print(page)
        handler.write(json.dumps(rows))
        handler.close()
        print(tags)


DayPicParser().get_info()

Запостил:

storvus, 10 Июля 2017

Комментарии (6) RSS

Her 10.07.2017 18:25 # 0

просмотры накручиваем?
Ответить
- storvus 10.07.2017 18:28 # 0
  
  нагло используем как буфер
  Ответить
ProgRamistYshka 20.07.2017 17:35 # 0

Понос
Ответить
- storvus 21.07.2017 09:34 # 0
  
  Так это... надо лечить... мармеладки покушай
  Ответить
syoma 26.12.2017 04:27 # 0

И шо?
Ответить
alex_matviichuk 25.08.2021 19:24 # 0

- Давно? - это всё, что я смог выдавить из себя.
Ответить

Говнокод: по колено в коде.

Python / Говнокод #23172

Комментарии (6) RSS

Добавить комментарий