1. Pascal / Говнокод #13959

    +140

    1. 1
    2. 2
    3. 3
    Товарищи, подскажите, как прикрутить скриптовый движок к парсеру на Delphi (а заодно и сам движок)!
    Извращение это нужно, чтобы распарсить сайт, использующий скрипты.
    webbrowser не подходит - слишком тормозно и глючно.

    Запостил: Stertor, 16 Октября 2013

    Комментарии (35) RSS

    • вы минусуйте - бля, но хоть отписывайтесь..
      Ведь как-то же парсят такие сайты, я не поверю, что дело из-за этого стопорится...
      Ответить
      • > Ведь как-то же парсят такие сайты
        Проще всего их парсить именно полноценным браузерным движком (gecko, webkit, тот же дельфиний webbrowser). Иначе тебе придется половину его функционала пилить самому :)

        Возможно тебя заинтересует вот этот проект: http://www.seleniumhq.org/.
        Ответить
        • > именно ... браузерным движком.
          Я думал об этом. Но embeddedwb(аналог webbrowser-a) некорректно работает, будучи созданным динамически, точнее, вообще не грузит страницы.

          <ссылка>
          А чего это такое?
          Ответить
          • > А чего это такое?
            Хреновина, овладевающая разумом браузера, и повелевающая ему делать всякие непристойные вещи. Например заполнять формы, кликать ссылки, выдирать фрагменты текста и т.п.
            Ответить
            • Не, к сожалению, мне это не нужно. Автокликерством я не маюсь. Но буду иметь в виду (дьявольски улыбается), спасибо!
              Ответить
              • Ну дык заходишь им на нужный сайт. Все скрипты там отрабатывают. Тебе остается залезть в DOM, да выдрать оттуда нужные тебе фрагменты ;)
                Ответить
                • Нейн, прога должна делать все это сама ((
                  может, подскажете, какие свойства нужно указать вебброузеру, при его динамическом создании?
                  Ответить
                  • > Нейн, прога должна делать все это сама ((
                    Насколько я понимаю, выгода будет только за счёт отсутствия отрисовки, а для перфоманса будет проще расковырять какой-нибудь опенсорсный браузер и выдрать из него отображалку.
                    Ответить
                    • Да там у селениума, насколько помню, даже был недобраузер без гуя. Правда он на яве.
                      Ответить
        • Вот про "распарсить сайт браузерным движком" гугль твой пост выдает первым. Дай ссылку на такую статью.
          Ответить
      • Отписываюсь: иди на любой форум, говнокод.ру не для этого.
        Ответить
        • Пошел на хуй, говнокод.ру не для таких, как ты.

          монополистов/кармадрочеров/замполитов/зазвездившихся полно на programmersforum-е. Туда иди.
          Ответить
        • Оффтопну: а какие сайты живые?
          Ответить
          • Хотя бы тот же StackOverflow. Не совсем форум, но для подобного самое то.
            Ответить
            • Обычно когда я что-то ищу, это не обьясняется не в одном форуме. Поэтому я не верю в форумы. Они полезны разве что синтаксис узнать, или название функции.
              Ответить
    • устроили тут фонд помоши Старперу
      Ответить
    • >Извращение это нужно, чтобы распарсить сайт, использующий скрипты.
      Обычно ловят http запросы и повторяют их. А вообще WGH прав http://govnokod.ru/13959#comment200401
      Ответить
      • > Обычно ловят http запросы и повторяют их.
        Да это как раз самая легкая часть. Сложнее потом распарсить ответ. О чем собственно он и спрашивает.
        Ответить
        • Если поиски библиотеки для парсинга занимают там много времени, что он помощи просит, то проще свою специфичную написать под задачу
          Ответить
          • > то проще свою специфичную написать под задачу
            Дык он уже показывал что ему нужно парсить. Там полный трешак с обфусцированным яваскриптом. Можно, конечно написать парсер под каждый конкретный случай обфускации убив кучу времени на разбор каждого случая. Но настоящий двиг, имхо, поюзать проще: если браузер показывает что-то человеку, и это не рисунок, то это всяко можно выдрать из DOM.
            Ответить
      • >> А вообще WGH прав http://govnokod.ru/13959#comment200401
        Я до недавнего времени плюсовал твои посты, чтобы они подольше оставались на плаву. Посмотрим же теперь, на сколько их хватит.

        Не знаю, как другие, но лично я не позволю превратить govnokod.ru в место тупого стеба над быдлокодерами - я слишком хорошо изучил нравы местных, чтобы слушать таких идиотов, как он. Тут принято не только обличать, но и указывать на ошибки, а для того, чтобы указывать на ошибки, нужно и самому что-то знать. Улавливаете мою логику? Я не вижу ничего зазорного в том, чтобы спросить совета у более опытных товарищей.
        Ответить
        • Боже, каким додиком ты был. Унижался, цацкался, лез сосаться с быдлом...
          Ответить
    • Может кто знает как на dir-320 tftp запустить и записать в него OpenWrt. Раз топик вопросов.
      Ответить
    • юзай IHTMLDocument2
      Ответить

    Добавить комментарий