1. Java / Говнокод #17775

    +74

    1. 01
    2. 02
    3. 03
    4. 04
    5. 05
    6. 06
    7. 07
    8. 08
    9. 09
    10. 10
    11. 11
    12. 12
    13. 13
    for (int i = 0; i < blockNodeSize; i++) {
        String blockTitle = subBlock.getElementsByClass("b-results__drugs-title").get(i).text();
        String blockData = String.valueOf(subBlock.getElementsByTag("dd").get(i))
                //.replace("\n", "")
                .replace("<dd>", "")
                .replace("</dd>", "")
                .replace("<p><i>", "")
                .replace("</i></p>", ":")
                .replace("<p>", "")
                .replace("</p>", "")
                .replace("</i>", "")
                .replace("<br>", "")
                .replace("</br>", "\n");

    Запостил: extruder, 13 Марта 2015

    Комментарии (22) RSS

    • > .replace("</br>", "\n");
      Ой))
      Ответить

      • логично. нужно же
        System.getProperty("line.separator")
        Ответить
        • .replace(System.getProperty("html.line.separator.closing"), System.getProperty("line.separator"));
          Ответить
        • Прикольнее только "<\br>")))
          Причём \b - это backspace :D
          Ответить
    • что-то я не вижу открывающего тега <i>. Закрывающий есть, открывающего нет.
      Ответить
      • По какой причине, думаешь, код сюда попал? Отсутствие открывающего <i>
        Ответить
        • А ядумал потому что он не поддеживает таг <FONT
          Ответить
    • А почему не на регэкспах вы там совсем охуели штоле в край. Регэкспы и ХТМЛ это как рыба и вода. Они рождены для этого
      Ответить
      • да, охуели. чуть более чем полностью.
        Ответить
      • Entire HTML parsing is not possible with regular expressions, since it depends on matching the opening and the closing tag which is not possible with regexps.
        http://stackoverflow.com/questions/590747/using-regular-expressions-to-parse-html-why-not
        Regular expressions can only match regular languages but HTML is a context-free language. The only thing you can do with regexps on HTML is heuristics but that will not work on every condition. It should be possible to present a HTML file that will be matched wrongly by any regular expression.
        Ответить
        • Повторите это для Кегги. Тут помница один камрад пытался объяснить ему что регулярные грамматики можно обрабатывать регулярками, а для контекст фри нужна полноценная машина тьюринга. Так Кегги его хуями облажил почём зря
          Ответить
          • > а для контекст фри нужна полноценная машина тьюринга
            > хуями облажил
            И ведь правильно сделал.
            Ответить
            • И правильно, потому что для контекст фри хватит автомата. Умные все стали, а лес валить некому
              Ответить
              • Лес уже не валить, а садить надо, пока не поздно.
                Ответить
                • Зато тут много дубов выросло, как я погляжу.
                  Ответить
          • Двоечник, для КС достаточно автомата со стеком. Ты бы хоть вики почитал, там же все написано
            Ответить
          • >> полноценная машина тьюринга

            расскажи мне про неполноценную машину Тьюринга, неполноценный член общества
            Ответить
          • Что есть регулярки? PCRE и регулярки с точки зрения абстрактных автоматов, емнип, разные вещи.
            Ответить
        • http://stackoverflow.com/questions/590747/using-regular-expressions-to-parse-html-why-not#comment9022045_590789

          -1 This answer draws the right conclusion ("It's a bad idea to parse HTML with Regex") from wrong arguments ("Because HTML isn't a regular language"). The thing that most people nowadays mean when they say "regex" (PCRE) is well capable not only of parsing context-free grammars (that's trivial actually), but also of context-sensitive grammars (see stackoverflow.com/questions/7434272/…)

          Регулярки круче конечных автоматов.
          Ответить
    • >>>results__drugs-title
      ясно, понятно
      Ответить
    • .replace("<p><i>", "<dbr>")
      Ответить

    Добавить комментарий