1. C++ / Говнокод #25490

    +3

    1. 1
    2. 2
    3. 3
    //  https://stackoverflow.com/questions/313970/how-to-convert-stdstring-to-lower-case?__=1746193182#
    
    std::transform(data.begin(), data.end(), data.begin(), ::tolower);

    Какой багор )))

    Запостил: BOKCEJIbHblu_nemyx, 31 Марта 2019

    Комментарии (21) RSS

    • Неужели нет всроенной функции?
      Ответить
    • <?php
      
      $s = 'КаКоЙ бАгОр )))';
      
      echo array_reduce(
          array_map(
              function($i)use($s){return mb_strtolower(mb_substr($s, $i, 1));},
              range(0, mb_strlen($s) - 1)
          ),
          function($carry, $item){return $carry . $item;},
          ''
      );
      Ответить
      • <?php
        
        class std {
            static function transform($begin, $end, $line, $op) {
                return array_reduce(
                   array_map(
                       function($i)use($line,$op){return $op(mb_substr($line, $i, 1));},
                       range($begin, $end)
                   ),
                   function($carry, $item){return $carry . $item;},
                   ''
                );
            }
        }
        
        $s = 'КаКоЙ бАгОр )))';
        
        echo std::transform(0, mb_strlen($s) - 1, $s, 'mb_strtolower');
        Ответить
    • Самый багор в том, что в новом стандарте это будет ub. Там запретили брать адреса библиотечных функций. Придется tolower в лямбду оборачивать
      Ответить
      • Да и в старых тоже не рекомендуют так делать:
        std::string str_tolower(std::string s) {
            std::transform(s.begin(), s.end(), s.begin(), 
                        // static_cast<int(*)(int)>(std::tolower)         // wrong
                        // [](int c){ return std::tolower(c); }           // wrong
                        // [](char c){ return std::tolower(c); }          // wrong
                           [](unsigned char c){ return std::tolower(c); } // correct
                          );
            return s;
        }

        https://en.cppreference.com/w/cpp/string/byte/tolower
        Ответить
      • > Самый багор в том, что в новом стандарте это будет ub.

        А можно пруфлинк?
        Ответить
        • UPD: http://eel.is/c++draft/namespace.std#def:addressable_function
          Ответить
          • Стандартная функция может быть реализована как обязательная inline-вставка и поэтому может не иметь адреса?
            Ответить
            • Уотето уже другой вопрос. Стандарт обычно не говорит *почему* UB, он только говорит *что* UB. Я не возьмусь утверждать почему оно так. Чтоб наверняка найти причину, надо наверное колупать списки рассылки коммитета.
              Ответить
            • Я слышал, это сделали, чтобы добавление новых перегрузок библиотечных функций не ломало старый код
              Ответить
    • Какое же говно эти наши кресты.
      https://en.cppreference.com/w/cpp/locale/ctype/tolower
      #include <locale>
      #include <iostream>
       
      void try_lower(const std::ctype<wchar_t>& f, wchar_t c)
      {
          wchar_t up = f.tolower(c);
          if (up != c) {
              std::wcout << "Lower case form of \'" << c << "' is " << up << '\n';
          } else {
              std::wcout << '\'' << c << "' has no lower case form\n";
          }
      }
       
      int main()
      {
          std::locale::global(std::locale("en_US.utf8"));
          std::wcout.imbue(std::locale());
          std::wcout << "In US English UTF-8 locale:\n";
          auto& f = std::use_facet<std::ctype<wchar_t>>(std::locale());
          try_lower(f, L'Σ');
          try_lower(f, L'Ɛ');
          try_lower(f, L'A');
       
          std::wstring str = L"HELLo, wORLD!";
          std::wcout << "Lowercase form of the string '" << str << "' is ";
          f.tolower(&str[0], &str[0] + str.size());
          std::wcout << "'" << str << "'\n";
      }

      Какие-то, блядь, шаблоны, фасеты, локали, std::ctype, «Class ctype encapsulates character classification features. All stream input operations performed through std::basic_istream<charT> use the std::ctype<charT> of the locale imbued in the stream to identify whitespace characters for input tokenization. Stream output operations apply std::ctype<charT>::widen() to narrow-character arguments prior to output» — про что несут? Вообще охуеть.
      И вот вроде бы выглядит пиздец как заумно, наверняка такая сложная штука может правильно перевести в нижний регистр вообще что угодно и в любых условиях, включая иероглифы. А вот хуй там плавал:
      Only 1:1 character mapping can be performed by this function, e.g.
      the Greek uppercase letter 'Σ' has two lowercase forms, depending
      on the position in a word: 'σ' and 'ς'. A call to do_tolower cannot be
      used to obtain the correct lowercase form in this case.

      Пиздец. Это не даже не оверинжиниринг, это уже просто какой-то овербагор.
      Ответить

    Добавить комментарий