- 1
- 2
- 3
Товарищи, подскажите, как прикрутить скриптовый движок к парсеру на Delphi (а заодно и сам движок)!
Извращение это нужно, чтобы распарсить сайт, использующий скрипты.
webbrowser не подходит - слишком тормозно и глючно.
Нашли или выдавили из себя код, который нельзя назвать нормальным, на который без улыбки не взглянешь? Не торопитесь его удалять или рефакторить, — запостите его на говнокод.ру, посмеёмся вместе!
+140
Товарищи, подскажите, как прикрутить скриптовый движок к парсеру на Delphi (а заодно и сам движок)!
Извращение это нужно, чтобы распарсить сайт, использующий скрипты.
webbrowser не подходит - слишком тормозно и глючно.
Stertor 16.10.2013 22:10 # −1
Ведь как-то же парсят такие сайты, я не поверю, что дело из-за этого стопорится...
bormand 16.10.2013 22:34 # +2
Проще всего их парсить именно полноценным браузерным движком (gecko, webkit, тот же дельфиний webbrowser). Иначе тебе придется половину его функционала пилить самому :)
Возможно тебя заинтересует вот этот проект: http://www.seleniumhq.org/.
Stertor 16.10.2013 22:38 # −1
Я думал об этом. Но embeddedwb(аналог webbrowser-a) некорректно работает, будучи созданным динамически, точнее, вообще не грузит страницы.
<ссылка>
А чего это такое?
bormand 16.10.2013 22:43 # +1
Хреновина, овладевающая разумом браузера, и повелевающая ему делать всякие непристойные вещи. Например заполнять формы, кликать ссылки, выдирать фрагменты текста и т.п.
Stertor 16.10.2013 22:45 # 0
bormand 16.10.2013 22:46 # 0
Stertor 16.10.2013 22:48 # 0
может, подскажете, какие свойства нужно указать вебброузеру, при его динамическом создании?
1024-- 16.10.2013 22:56 # 0
Насколько я понимаю, выгода будет только за счёт отсутствия отрисовки, а для перфоманса будет проще расковырять какой-нибудь опенсорсный браузер и выдрать из него отображалку.
bormand 16.10.2013 22:58 # 0
crastinus 17.10.2013 07:06 # 0
WGH 16.10.2013 22:48 # +3
Stertor 16.10.2013 23:03 # −4
монополистов/кармадрочеров/замполитов/зазвездившихся полно на programmersforum-е. Туда иди.
anonimb84a2f6fd141 17.10.2013 01:52 # −1
WGH 17.10.2013 07:35 # 0
kegdan 17.10.2013 07:52 # 0
crastinus 17.10.2013 09:53 # −1
kegdan 17.10.2013 12:07 # −1
kegdan 16.10.2013 23:11 # −1
crastinus 17.10.2013 07:02 # −1
kegdan 17.10.2013 07:35 # 0
Abbath 17.10.2013 10:39 # +3
kegdan 17.10.2013 12:08 # 0
Abbath 17.10.2013 12:55 # 0
MaaKut 07.11.2021 20:50 # +1
Support 07.11.2021 21:11 # 0
anonimb84a2f6fd141 17.10.2013 01:52 # −1
Обычно ловят http запросы и повторяют их. А вообще WGH прав http://govnokod.ru/13959#comment200401
bormand 17.10.2013 05:36 # 0
Да это как раз самая легкая часть. Сложнее потом распарсить ответ. О чем собственно он и спрашивает.
kegdan 17.10.2013 05:38 # 0
bormand 17.10.2013 07:22 # 0
Дык он уже показывал что ему нужно парсить. Там полный трешак с обфусцированным яваскриптом. Можно, конечно написать парсер под каждый конкретный случай обфускации убив кучу времени на разбор каждого случая. Но настоящий двиг, имхо, поюзать проще: если браузер показывает что-то человеку, и это не рисунок, то это всяко можно выдрать из DOM.
Stertor 17.10.2013 11:09 # 0
Я до недавнего времени плюсовал твои посты, чтобы они подольше оставались на плаву. Посмотрим же теперь, на сколько их хватит.
Не знаю, как другие, но лично я не позволю превратить govnokod.ru в место тупого стеба над быдлокодерами - я слишком хорошо изучил нравы местных, чтобы слушать таких идиотов, как он. Тут принято не только обличать, но и указывать на ошибки, а для того, чтобы указывать на ошибки, нужно и самому что-то знать. Улавливаете мою логику? Я не вижу ничего зазорного в том, чтобы спросить совета у более опытных товарищей.
Support 07.11.2021 21:12 # 0
crastinus 17.10.2013 07:07 # −1
bormand 17.10.2013 07:23 # −1
crastinus 17.10.2013 09:51 # −1
cmepmop 08.03.2019 13:22 # 0