- 1
- 2
- 3
Товарищи, подскажите, как прикрутить скриптовый движок к парсеру на Delphi (а заодно и сам движок)!
Извращение это нужно, чтобы распарсить сайт, использующий скрипты.
webbrowser не подходит - слишком тормозно и глючно.
Нашли или выдавили из себя код, который нельзя назвать нормальным, на который без улыбки не взглянешь? Не торопитесь его удалять или рефакторить, — запостите его на говнокод.ру, посмеёмся вместе!
+140
Товарищи, подскажите, как прикрутить скриптовый движок к парсеру на Delphi (а заодно и сам движок)!
Извращение это нужно, чтобы распарсить сайт, использующий скрипты.
webbrowser не подходит - слишком тормозно и глючно.
Ведь как-то же парсят такие сайты, я не поверю, что дело из-за этого стопорится...
Проще всего их парсить именно полноценным браузерным движком (gecko, webkit, тот же дельфиний webbrowser). Иначе тебе придется половину его функционала пилить самому :)
Возможно тебя заинтересует вот этот проект: http://www.seleniumhq.org/.
Я думал об этом. Но embeddedwb(аналог webbrowser-a) некорректно работает, будучи созданным динамически, точнее, вообще не грузит страницы.
<ссылка>
А чего это такое?
Хреновина, овладевающая разумом браузера, и повелевающая ему делать всякие непристойные вещи. Например заполнять формы, кликать ссылки, выдирать фрагменты текста и т.п.
может, подскажете, какие свойства нужно указать вебброузеру, при его динамическом создании?
Насколько я понимаю, выгода будет только за счёт отсутствия отрисовки, а для перфоманса будет проще расковырять какой-нибудь опенсорсный браузер и выдрать из него отображалку.
монополистов/кармадрочеров/замполитов/зазвездившихся полно на programmersforum-е. Туда иди.
Обычно ловят http запросы и повторяют их. А вообще WGH прав http://govnokod.ru/13959#comment200401
Да это как раз самая легкая часть. Сложнее потом распарсить ответ. О чем собственно он и спрашивает.
Дык он уже показывал что ему нужно парсить. Там полный трешак с обфусцированным яваскриптом. Можно, конечно написать парсер под каждый конкретный случай обфускации убив кучу времени на разбор каждого случая. Но настоящий двиг, имхо, поюзать проще: если браузер показывает что-то человеку, и это не рисунок, то это всяко можно выдрать из DOM.
Я до недавнего времени плюсовал твои посты, чтобы они подольше оставались на плаву. Посмотрим же теперь, на сколько их хватит.
Не знаю, как другие, но лично я не позволю превратить govnokod.ru в место тупого стеба над быдлокодерами - я слишком хорошо изучил нравы местных, чтобы слушать таких идиотов, как он. Тут принято не только обличать, но и указывать на ошибки, а для того, чтобы указывать на ошибки, нужно и самому что-то знать. Улавливаете мою логику? Я не вижу ничего зазорного в том, чтобы спросить совета у более опытных товарищей.