1. C# / Говнокод #11577

    +107

    1. 001
    2. 002
    3. 003
    4. 004
    5. 005
    6. 006
    7. 007
    8. 008
    9. 009
    10. 010
    11. 011
    12. 012
    13. 013
    14. 014
    15. 015
    16. 016
    17. 017
    18. 018
    19. 019
    20. 020
    21. 021
    22. 022
    23. 023
    24. 024
    25. 025
    26. 026
    27. 027
    28. 028
    29. 029
    30. 030
    31. 031
    32. 032
    33. 033
    34. 034
    35. 035
    36. 036
    37. 037
    38. 038
    39. 039
    40. 040
    41. 041
    42. 042
    43. 043
    44. 044
    45. 045
    46. 046
    47. 047
    48. 048
    49. 049
    50. 050
    51. 051
    52. 052
    53. 053
    54. 054
    55. 055
    56. 056
    57. 057
    58. 058
    59. 059
    60. 060
    61. 061
    62. 062
    63. 063
    64. 064
    65. 065
    66. 066
    67. 067
    68. 068
    69. 069
    70. 070
    71. 071
    72. 072
    73. 073
    74. 074
    75. 075
    76. 076
    77. 077
    78. 078
    79. 079
    80. 080
    81. 081
    82. 082
    83. 083
    84. 084
    85. 085
    86. 086
    87. 087
    88. 088
    89. 089
    90. 090
    91. 091
    92. 092
    93. 093
    94. 094
    95. 095
    96. 096
    97. 097
    98. 098
    99. 099
    100. 100
    public Quote[] ParseQuotesFromFile(string p){
                HtmlDocument d = new HtmlDocument();
                d.Load(p, new UTF8Encoding());
    #if !DEBUG
                return
    #endif
    #if DEBUG
                var v1 =
    #endif
     d.GetElementbyId("body")//main div
    #if DEBUG
    ; var v2 = v1
    #endif
    .ChildNodes//subnodes
    #if DEBUG
    ; var v3 = v2
    #endif
    .Where(a => a.Attributes.Contains("class"))//nodes with classes
    #if DEBUG
    ; var v4 = v3
    #endif
    .Where(a => a.Attributes["class"].Value == "quote")//quotes
    #if DEBUG
    ; var v5 = v4
    #endif
    .Where(a => a.ChildNodes.Any(b => b.Attributes.Contains("class")))//only real quotes
    #if DEBUG
    ; var v6 = v5
    #endif
    .Select(a => a.ChildNodes.Where(b => b.Attributes.Contains("class")).ToArray())//only usable
    #if DEBUG
    ; var v7 = v6
    #endif
    .Where(a => a.Length == 2)//drop ads
    #if DEBUG
    ; var v8 = v7
    #endif
    .Select(a => new Quote()
    {
        Text = conv.HtmlSpecialCharsDecode(a.First(b => b.Attributes["class"].Value == "text").InnerHtml.Replace("<br>", "\r\n"),StringTools.ReplaceType.Both),
        ID=BadParse(GetIdString(a)),
        Score=BadParse(GetScoreString(a))})
    #if DEBUG
    ; var v9 = v8
    #endif
    .ToArray();
    #if DEBUG
                return v9;
    #endif
            } private static string GetScoreString(HtmlNode[] a){
    #if !DEBUG
                return
    #endif
    #if DEBUG
                var v1 =
    #endif
     a.First(b => b.Attributes["class"].Value == "actions")
    #if DEBUG
    ; var v2 = v1
    #endif
    .ChildNodes.Where(b => b.Name != "#text")
    #if DEBUG
    ; var v3 = v2
    #endif
    .First(b => b.Attributes["class"].Value == "rating-o")
    #if DEBUG
    ; var v4 = v3
    #endif
    .FirstChild
    #if DEBUG
    ; var v5 = v4
    #endif
    .InnerText;
    #if DEBUG
                return v5;
    #endif
            } private static string GetIdString(HtmlNode[] a) {
    #if !DEBUG
                return
    #endif
    #if DEBUG
                var v1=
    #endif
                a.First(b => b.Attributes["class"].Value == "actions")
    #if DEBUG
    ; var v2 = v1
    #endif
    .ChildNodes.Where(b => b.Name != "#text")
    #if DEBUG
    ; var v3 = v2
    #endif
    .First(b => b.Attributes["class"].Value == "id")
    #if DEBUG
    ; var v4 = v3
    #endif
                    .InnerText.Replace("#", "");
    #if DEBUG
                return v4;
    #endif
    }

    Это должен был быть парсер bash.org.ru
    Самоое странное, что код даже работает

    Запостил: kasthack, 12 Августа 2012

    Комментарии (18) RSS

    • А вот так уже не кошерно?

      public Quote[] ParseQuotesFromFile(string p){
                  HtmlDocument d = new HtmlDocument();
                  d.Load(p, new UTF8Encoding());
                  var v1 = d.GetElementbyId("body"); //main div
                  var v2 = v1.ChildNodes; //subnodes
                  var v3 = v2.Where(a => a.Attributes.Contains("class")); //nodes with classes
                  var v4 = v3.Where(a => a.Attributes["class"].Value == "quote"); //quotes
                  var v5 = v4.Where(a => a.ChildNodes.Any(b => b.Attributes.Contains("class"))); //only real quotes
                  var v6 = v5.Select(a => a.ChildNodes.Where(b => b.Attributes.Contains("class")).ToArray()); //only usable
                  var v7 = v6.Where(a => a.Length == 2); //drop ads
                  var v8 = v7.Select(a => new Quote() {
                      Text = conv.HtmlSpecialCharsDecode(a.First(b =>b.Attributes["class"].Value == "text").InnerHtml.Replace("<br>", "\r\n"),StringTools.ReplaceType.Both),
                      ID=BadParse(GetIdString(a)),
                      Score=BadParse(GetScoreString(a))
                  });
                  var v9 = v8.ToArray();
                  return v9;
      }
      Ответить
      • Нет конечно. AssParallol забыл.
        Ответить
        • AssTrollollel?
          Ответить
          • >AssTrollollel
            Кстати, очень даже созвучно:
            АссПараллел
            АссТроллоллел
            Только л вторая лишняя как мне кажется.
            Ответить
      • А теперь версия не для отладки
        public Quote[] ParseQuotesFromFile(string p){
        	HtmlDocument d = new HtmlDocument();
        	d.Load(p, new UTF8Encoding());
        	return  d.GetElementbyId("body")//main div
        		.ChildNodes//subnodes
        		.Where(a => a.Attributes.Contains("class"))//nodes with classes
        		.Where(a => a.Attributes["class"].Value == "quote")
        		.Where(a => a.ChildNodes.Any(b => b.Attributes.Contains("class")))
        		.Select(a => a.ChildNodes.Where(b => b.Attributes.Contains("class")).ToArray())//only usable
        		.Where(a => a.Length == 2)//drop ads
        		.Select(a => new Quote()
        		{
        			Text = conv.HtmlSpecialCharsDecode(a.First(b => b.Attributes["class"].Value == "text").
        				InnerHtml.Replace("<br>", "\r\n"),StringTools.ReplaceType.Both),
        			ID=BadParse(GetIdString(a)),
        			Score=BadParse(GetScoreString(a))
        		})
        		.ToArray();
        }
        private static string GetScoreString(HtmlNode[] a){
        	return a.First(b => b.Attributes["class"].Value == "actions")
        		.ChildNodes.Where(b => b.Name != "#text")
        		.First(b => b.Attributes["class"].Value == "rating-o")
        		.FirstChild
        		.InnerText;
        }
        private static string GetIdString(HtmlNode[] a){
        	return a.First(b => b.Attributes["class"].Value == "actions")
        		.ChildNodes.Where(b => b.Name != "#text")
        		.First(b => b.Attributes["class"].Value == "id")
        		.InnerText.Replace("#", "");
        }
        Ответить
      • Быдло хоть чуть-чуть не освоило xpath
        Ответить
    • Боюсь себе представить, что там в неотладочной версии.
      Ответить
      • В неотладочной версии там... *барабанная дробь*... LINQ!
        Ответить
      • LINQ, но без промежуточных переменных.
        Писалось где-то в пять утра.
        Со сна показалось, что так проще дебажить
        Ответить
        • > Со сна показалось, что так проще дебажить
          А самое главное - проще поддерживать ;)
          Ответить
          • Одноразовый код код же.
            С парсингом он справился, а дальше в /dev/null его.
            Проще потом нормально написать, если пригодится
            Ответить
            • > Одноразовый код код же.
              Ну и нафига тогда весь этот геморрой с дебагами? Чем мешали временные переменные в релизном режиме - даже не могу придумать.
              Ответить
    • не проще ли было набросать xsl-преобразование, чем ковырять c#
      Ответить
    • Посмотрел на такой парсер как на г-но.
      Ответить
    • ОЛОЛО LINQ НА БАШОРГ!!!
      Простите не удержался.
      Ответить
      • башим!
        HTTP Error 301 - Moved permanently
        Please update your bookmarks
        Ответить
        • >Error
          >301
          Ответить
        • $ wget bash.org
          --2012-08-14 08:41:23-- http://bash.org/
          Распознаётся bash.org... 69.61.106.93
          Подключение к bash.org|69.61.106.93|:80... соединение установлено.
          HTTP-запрос отправлен. Ожидание ответа... 200 OK
          Ответить

    Добавить комментарий