Говнокод #27025 — C++ — Говнокод.ру

guest8 13.10.2020 14:16 # −999

Ответить

gost 13.10.2020 14:22 # +1

>>> bool
Ответить
- defecate-plusplus 13.10.2020 14:24 # 0
  
  <<< #define bool int
  Ответить

gost 13.10.2020 14:27 # +1

Давайте флудить и троллить!

bool checkRepeatImpl(const char *prev, const char *cur)
{
    return *cur && (*cur == *prev || checkRepeatImpl(prev + 1, cur + 1));
}

bool checkRepeat(const char *word)
{
    return word && *word && checkRepeatImpl(word, word + 1);
}

int main()
{
    std::cout << checkRepeat("") << std::endl      // 0
        << checkRepeat("a") << std::endl           // 0
        << checkRepeat("aa") << std::endl          // 1
        << checkRepeat("aaa") << std::endl         // 1
        << checkRepeat("bab") << std::endl         // 0
        << checkRepeat("baab") << std::endl        // 1
        << checkRepeat("bbaaabb") << std::endl     // 1
        << checkRepeat("bbabc") << std::endl       // 1
        << checkRepeat("abcbb") << std::endl;      // 1

    return EXIT_SUCCESS;
}

Ответить

gost 13.10.2020 14:29 # 0
https://gcc.godbolt.org/z/617WYe
```
checkRepeatImpl(char const*, char const*):
        movzx   eax, BYTE PTR [rsi]
        xor     r8d, r8d
        test    al, al
        je      .L1
.L3:
        cmp     BYTE PTR [rdi], al
        jne     .L11
.L7:
        mov     r8d, 1
.L1:
        mov     eax, r8d
        ret
.L11:
        movzx   eax, BYTE PTR [rsi+1]
        test    al, al
        je      .L6
        cmp     al, BYTE PTR [rdi+1]
        je      .L7
        movzx   eax, BYTE PTR [rsi+2]
        add     rsi, 2
        add     rdi, 2
        test    al, al
        jne     .L3
.L6:
        xor     r8d, r8d
        mov     eax, r8d
        ret
checkRepeat(char const*):
        test    rdi, rdi
        je      .L26
        movzx   edx, BYTE PTR [rdi]
        test    dl, dl
        je      .L26
        movzx   ecx, BYTE PTR [rdi+1]
        test    cl, cl
        je      .L26
        mov     eax, 1
        cmp     dl, cl
        je      .L12
        movzx   edx, BYTE PTR [rdi+2]
        test    dl, dl
        je      .L26
        cmp     cl, dl
        je      .L12
        movzx   ecx, BYTE PTR [rdi+3]
        test    cl, cl
        je      .L26
        cmp     dl, cl
        je      .L12
        movzx   edx, BYTE PTR [rdi+4]
        test    dl, dl
        je      .L26
        cmp     cl, dl
        je      .L12
        movzx   ecx, BYTE PTR [rdi+5]
        test    cl, cl
        je      .L26
        cmp     dl, cl
        je      .L12
        movzx   edx, BYTE PTR [rdi+6]
        test    dl, dl
        je      .L26
        cmp     cl, dl
        je      .L12
        lea     rsi, [rdi+7]
        add     rdi, 6
        jmp     checkRepeatImpl(char const*, char const*)
.L26:
        xor     eax, eax
.L12:
        ret
```
Какой анролл в checkRepeat() )))
А вот в Impl говнище какое-то.

P. S. Особенно умиляет .L6. Кажется, компилятор немного ёбнулся.
Ответить
- DypHuu_niBEHb 13.10.2020 14:33 # 0
  
  а что не так с очищением r8d и eax? ненужное действие?
  Ответить
  - gost 13.10.2020 14:42 # 0
    
    В eax — разврат значения, а r8d он очищает просто потому что может.
    Ответить
    - DypHuu_niBEHb 13.10.2020 14:49 # 0
      
      типа можно
      mov eax, 0
      ?
      Ответить
      - gost 13.10.2020 14:51 # 0
        
        Просто xor eax, eax и ret. Очищение r8d — это действительно совершенно ненужное действие.
        Ответить
        
        guest8 13.10.2020 14:53 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        defecate-plusplus 13.10.2020 14:56 # 0
        
        xor небось меньше места занимает, чем целый mov
        Ответить
        
        DypHuu_niBEHb 13.10.2020 14:59 # 0
        
        вероятно, чем mov с литералом/immediate, да?
        
        то есть для "xor eax,eax" один махонький опкод, а для mov eax, "immediate" нужно еще место для этого самого immediate
        Ответить
        
        Raj_Kapoor 13.10.2020 15:01 # 0
        
        Можно было сразу ксорить eax, а r8d не использовать.
        Ответить
  - guest8 13.10.2020 14:47 # −999
    
    показать все, что скрытоvanished
    Ответить
    - DypHuu_niBEHb 13.10.2020 14:49 # 0
      
      похуй, конечно
      я глупый
      Ответить
      - guest8 13.10.2020 14:50 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        guest8 13.10.2020 14:54 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        guest8 13.10.2020 14:55 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        DypHuu_niBEHb 13.10.2020 14:55 # 0
        
        возьми отпуск, выспись, и неделю вообще не трогай программирование
        
        через неделю самого потянет
        Ответить
        
        6e3By3HbIu_nemyx 13.10.2020 14:57 # 0
        
        У меня был запланированый отпуск, но он сорвался из-за второй волны ковида.
        Ответить
        
        Raj_Kapoor 13.10.2020 14:59 # 0
        
        Бодюрыч говорит, что это не вторая волна. Вторая волна — это когда переболевшие болеют повторно, а сейчас заражаются новые люди.
        Ответить
        
        6e3By3HbIu_nemyx 13.10.2020 15:02 # +1
        
        Тогда заебись.
        Ответить
        
        DypHuu_niBEHb 13.10.2020 15:02 # 0
        
        ох блядь, я и забыл, что нормальные люди в отпуск куда-то езядт
        Ответить
        
        6e3By3HbIu_nemyx 13.10.2020 15:03 # 0
        
        Вот бы тоже стать нормальным. А так домой я собирался.
        Ответить
        
        DypHuu_niBEHb 13.10.2020 15:07 # 0
        
        я нихуя не понел: у тебя дисер дописали, а ты решил взять отпуск, и съебаца за 1,5К километров?*
        
        *числа примерные, я не знаю сколько до твоего родного Безвузопетухска
        Ответить
        
        6e3By3HbIu_nemyx 13.10.2020 15:08 # 0
        
        Я к этому времени планировал вернуться.
        Ответить
bootcamp_dropout 13.10.2020 15:33 # 0

А можно написать парсер грамматики в которой запрещены повторы и ему скармливать? Если невалидный текс значит и повторы есть
Ответить
bormand 13.10.2020 15:39 # 0

Там вроде не соседние буквы проверялись, а вообще все.
Ответить
bormand 13.10.2020 15:47 # 0
```
bool cc(const char *p, char c) { return *p ? p == c ? true : cc(p + 1, c) : false; }
bool cr(const char *p) { return cc(p + 1, *p) || cr(p + 1); }
bool checkRepeat(const char *p) { return p && *p && cr(p); }
```
Ответить
- bormand 13.10.2020 15:58 # 0
  bool cr(const char *p, const char *q = p + 1) { return *p && (*q ? *p == *q || cr(p, q + 1) : cr(p + 1)); }
  Ответить
  - Desktop 13.10.2020 16:08 # 0
    test
    Ответить
- bormand 13.10.2020 16:11 # 0
  bool cr(const char *p, const char *q = 0) { return q ? (*q ? *p == *q || cr(p, q + 1) : cr(p + 1)) : *p && cr(p, p + 1); }
  https://ideone.com/a2lStZ
  Ответить
- bormand 13.10.2020 16:23 # 0
  
  Ответить
- bormand 13.10.2020 16:30 # 0
  bool cr(const char *p, const char *q = 0) { return *p && (q || (q = p + 1)) && (*q ? *p == *q || cr(p, q + 1) : cr(p + 1)); }
  https://ideone.com/egpRBW
  Ответить
- bormand 13.10.2020 16:47 # 0
  bool cr(const char *p, char c = 0) { return *p && (*p == c || c && cr(p + 1, c) || cr(p + 1, *p)); }
  https://ideone.com/ONM3RC
  
  Всё, пора завязывать с этим безумием.
  Ответить
  - bormand 13.10.2020 16:58 # 0
    bool cr(const char *p, char c = 0) { return *p && (c ? *p == c || cr(p + 1, c) : cr(p + 1, *p) || cr(p + 1)); }
    Чтобы сложность всё-таки квадратичная была, а не экспоненциальная.
    Ответить
    - gost 13.10.2020 17:03 # 0
      
      Многословно, зато O(N).
      
      #include <iostream> #include <cstdint> void checkRepeatImpl(const char *word, uint64_t *tsar) { if (*word) { tsar[*word++]++; checkRepeatImpl(word, tsar); // Реку-ку-курсия. Хвостовая! } } bool checkRepeatImpl(const uint64_t *tsar, size_t idx = 0) { return (idx < 256) && (tsar[idx] > 1 || checkRepeatImpl(tsar, idx + 1)); } bool checkRepeat(const char *word) { uint64_t tsar[256] = {}; checkRepeatImpl(word, tsar); return checkRepeatImpl(tsar); } int main() { std::cout << checkRepeat("") << std::endl // 0 << checkRepeat("a") << std::endl // 0 << checkRepeat("aa") << std::endl // 1 << checkRepeat("abc") << std::endl // 0 << checkRepeat("aaa") << std::endl // 1 << checkRepeat("bab") << std::endl // 1 << checkRepeat("baab") << std::endl // 1 << checkRepeat("bbaaabb") << std::endl // 1 << checkRepeat("bbabc") << std::endl // 1 << checkRepeat("abcbb") << std::endl; // 1 return EXIT_SUCCESS; }
      
      https://ideone.com/6jveEq
      Ответить
      - bormand 13.10.2020 17:14 # +2
        
        bool cr(const char *p, char *c) { return c[*p] || *p && ++c[*p] && cr(p + 1, c); } bool checkRepeat(const char *word) { char cache[256] {}; return cr(word, cache); }
        https://ideone.com/FyjeNl
        Ответить
        
        gost 13.10.2020 17:15 # 0
        
        Инженерный отдел сильно сбоит.
        Ответить
        
        bormand 13.10.2020 17:18 # 0
        
        > контр-пример — «'a'*256».
        
        Оно же сразу выйдет на c[*p], не? Там вообще бул можно, но на нём ++ не работает.
        Ответить
        
        gost 13.10.2020 17:20 # 0
        
        Подтверждаю.
        Ответить
        
        rotoeb 13.10.2020 17:20 # −1
        
        Что за хуйню вы тут обсуждаете? В "PHP" нет никаких звёздочек.
        Ответить
        
        bormand 13.10.2020 17:21 # +2
        
        constexpr bool cr(const char *p, std::array<char, 256> c = {}) { return c[*p] || *p && ++c[*p] && cr(p + 1, c); }
        Во нахуй!
        
        З.Ы. Правда массив копируется если не в компайлтайме :(
        Ответить
        
        bormand 13.10.2020 17:34 # +2
        
        gcc-проблемы, шланг нормально свернул хвостовую рекурсию и кеш не копирует.
        Ответить
      - CHayT 13.10.2020 17:22 # +2
        
        > uint64_t tsar[256] = {};
        
        А теперь сделай для юникода ^___~
        Ответить
        
        bormand 13.10.2020 17:24 # +1
        
        Под юникод всего 16 метров уйдёт. Ну или std::unordered_set вместо него, но это чит уже.
        Ответить
        
        rotoeb 13.10.2020 17:26 # 0
        
        Я вообще не понимаю, зачем нужны какие-то "Юникоды", иные кодировки... Почему нельзя просто хранить буквы, цифры и прочие символы в чистом виде?
        Ответить
        
        digitalEugene 14.10.2020 05:23 # −1
        
        это как?))
        В растровом варианте чтоль?
        Ответить
        
        Mithun_Chakraborty 14.10.2020 11:12 # 0
        
        Ну вот в фантастических фильмах никто не пердолится с кодировками, подобрал произвольный носитель информации на помойке, вставил в компьютер и тут же прочитал. И форматов изображений там нет, любая картинка тут же отображается на экране.
        Ответить
        
        rotoeb 14.10.2020 11:39 # 0
        
        Это - картинки. Я имею в виду именно хранение символов, как plain-текста, безо всяких ебучих кодировок.
        Ответить
        
        Mithun_Chakraborty 14.10.2020 15:41 # −21
        
        показать все, что скрытоПриведи определение plain-текста.
        Ответить
        
        rotoeb 14.10.2020 19:00 # 0
        
        Просто текст, блядь, без кучи циферок, слэшей и прочей хуеты. Можно взять и сохранить на жёсткий диск тупо текст, текст, ТЕКСТ, блядь, без "ASCII", "ANSI", "KOI", "UTF" и прочего говна?
        Ответить
        
        bootcamp_dropout 14.10.2020 19:04 # −1
        
        да, конечно
        нацарапай на нем то что надо сохранить
        можешь еще стикер приклеить
        Ответить
        
        rotoeb 14.10.2020 19:06 # 0
        
        А, буквы кодируют в нули и единицы потому, что нет технологии, которая позволяла бы "выцарапывать" на диске микроскопические буквы, так?
        Ответить
        
        bootcamp_dropout 14.10.2020 19:09 # +46
        
        думаю что потому что жесткие диски делали байтоебы какие-то
        Ответить
        
        defecate-plusplus 14.10.2020 19:23 # +1
        
        не разговаривай с уебком
        совсем уже поехавший
        Ответить
        
        bootcamp_dropout 15.10.2020 00:12 # 0
        
        okay dad
        Ответить
        
        guest8 14.10.2020 20:07 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        CHayT 13.10.2020 17:37 # 0
        
        У unordered set небось логарифмический доступ. Тогда уж проще за n (log n) отсортировать строку и пройтись один раз без буфера.
        Ответить
        
        bormand 13.10.2020 17:38 # +1
        
        Амортизированный O(1) по идее, хешмапа всё-таки.
        Ответить
        
        DypHuu_niBEHb 13.10.2020 17:46 # 0
        
        >Амортизированный
        у жабоёбов есть шутка про
        
        long hashCode() { return 42; }
        
        эффектно превращающая 1 и N.
        
        unordered_set так же?
        Ответить
        
        bormand 13.10.2020 17:47 # +1
        
        Ну да, костылей типа дерева-внутри-хешмапы там вроде нет.
        Ответить
        
        CHayT 13.10.2020 17:48 # 0
        
        Мне кажется, конкретно в этой ситуации ты не получишь инсерт за O(1), т.к. большую часть времени вставляешь новые элементы (получил хит — сразу вышел). Пруфов не будет.
        Ответить
        
        gost 13.10.2020 22:23 # +1
        
        > не получишь инсерт за O(1), т.к. большую часть времени вставляешь новые элементы
        А чому нi? Хэшмапа же, вставка дешёвая. Не то что в этих ваших «деревьях»: пройди вниз, да покрути налево, да покрути направо, да обменяй дядю с прадедом…
        Ответить
        
        bormand 13.10.2020 22:27 # 0
        
        Реаллокации дорогие. Из-за них будет что-то в духе O(log(N)) на элемент.
        Ответить
        
        gost 13.10.2020 22:31 # 0
        
        Ну дык сделать hashmap.reserve(strlen(str)) и всё.
        Ответить
        
        bormand 13.10.2020 22:34 # +3
        
        Х.з., а вдруг там гигабайт английского текста?
        
        З.Ы. Хотя, если там больше 16МБ можно возвращать true не читая.
        Ответить
        
        gost 13.10.2020 22:36 # +1
        
        > Х.з., а вдруг там гигабайт английского текста?
        Так и запишем: O(N) по памяти…
        
        > З.Ы. Хотя, если там больше 16МБ можно возвращать true не читая.
        Это если ты Страйкер.
        Ответить
        
        XYPO3BO3 13.10.2020 22:36 # 0
        
        Воспользовался принципом Дирихле?
        Ответить
        
        CHayT 13.10.2020 22:37 # 0
        
        Неправда, может там 16МБ zalgo.
        Ответить
        
        XYPO3BO3 13.10.2020 22:37 # 0
        
        Т. е. надстрочные значки (акценты) не считаются за буквы?
        Ответить
        
        gost 13.10.2020 22:38 # 0
        
        > не считаются за буквы
        На опасную дорожку вступаем.
        Ответить
        
        XYPO3BO3 13.10.2020 22:41 # +1
        
        Кстати, в «Unicode» же есть композиция и декомпозиция. Немецкую букву «а умляут» можно записать двумя способами:
        1. Одним кодпоинтом: ä.
        2. Двумя кодпоинтами: ä (написали букву «a», а потом добавили надстрочный элемент).
        Ответить
        
        gost 13.10.2020 22:42 # +2
        
        >>> В стандарте Юникода определены четыре алгоритма нормализации текста: NFD, NFC, NFKD и NFKC.
        Ответить
        
        bormand 13.10.2020 22:44 # 0
        
        А комбо-смайлики в духе негр+негр под эту нормализацию попадают или у них своя атмосфера?
        Ответить
        
        Desktop 13.10.2020 22:46 # 0
        
        а как же NSFW
        Ответить
        
        XYPO3BO3 13.10.2020 22:53 # 0
        
        Я думал, что это что-то страшное, а оказывается, NFKD и NFKC — это те же декомпозиция и композиция, только ещё альтернативные начертания (готический шрифт, буквы в кружочках) заменяем на основные начертания.
        
        Тем не менее, мне не всё ясно про декомпозицию. Если у буквы два акцента (во вьетнамском такое бывает (ờ, ề), то в каком порядке эти акценты ставить при декомпозиции?
        Ответить
        
        bormand 13.10.2020 22:54 # 0
        
        Я думаю там в правилах декомпозиции все эти моменты описаны. Скорее всего у акцентов есть какой-то порядок в котором они навешиваются.
        Ответить
        
        bormand 13.10.2020 22:38 # +1
        
        > zalgo
        
        Т.е. символы с разным "обвесом" мы считаем разными? А визуально одинаковые - одинаковыми. Ох бля, нафиг ты этот юникод притащил...
        Ответить
        
        CHayT 13.10.2020 22:40 # +1
        
        Интересно, возможен ли 16 мегабайтный символ.
        Ответить
        
        bormand 13.10.2020 22:45 # 0
        
        > 16 мегабайтный символ.
        
        Боюсь, что большинство библиотек сольются гораздо раньше.
        Ответить
        
        CHayT 13.10.2020 22:30 # 0
        
        > Не то что в этих ваших «деревьях»: пройди вниз, да покрути налево, да покрути направо
        
        Ну да, при ресайзе всего-то надо выделить бóльший кусок памяти и перехешировать всё (или ебаться с поколениями). Ну или выделить сразу дохрена памяти, но тогда тупой массив будет быстрее.
        Ответить
        
        Desktop 13.10.2020 22:39 # 0
        
        поясни
        Ответить
        
        bormand 13.10.2020 22:41 # 0
        
        В среднем втыкает за O(1) но на некоторых вставках тупит и лагает пока увеличивает буфера и пересчитывает хеши. Именно поэтому хешмапы не особо любят в реалтайм коде.
        Ответить
        
        Desktop 13.10.2020 22:42 # 0
        
        так вы про вставку или про доступ?
        Ответить
        
        bormand 13.10.2020 22:43 # 0
        
        Ну а доступа тут почти не будет. На первом совпадении return true.
        Ответить
        
        Desktop 13.10.2020 22:45 # 0
        
        я не въезжаю, а O(1) на вставке обеспечивается тем, что там заранее выделенный массив и элемент тупо вставляется на последний занятый индекс + 1?
        Ответить
        
        guest8 13.10.2020 22:48 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        Desktop 13.10.2020 22:50 # 0
        
        хм, ок.
        
        и что будет, если someHashFunc вернёт 100500? аллокация?
        Ответить
        
        DypHuu_niBEHb 13.10.2020 22:54 # 0
        
        Я думаю, шта память выделяеца заранее.
        
        например, я хочу N бакетов, и выделяю память, и так настраиваю свою функцию, чтобы она выдавала равномерно число от 0 до N-1.
        
        А в какой момент увеличиваеца -- Борманд ниже поснил
        Ответить
        
        bormand 13.10.2020 22:52 # +4
        
        От ключа считается хеш. Хеш делится по модулю текущего размера буфера. И в этот слот буфера втыкается значение. Если там уже что-то есть - не повезло, применяется какой-нибудь из вариантов разрешения коллизий.
        
        Обычно везёт. Но если мапа забилась процентов на 80, то коллизии начинаются всё чаще и чаще. Поэтому выделяется новый буфер раза в 1.5-2 больше и в него переносятся все значения из старого (с пересчётом их позиций, само собой). И дальше опять какое-то время всё работает быстро и почти за O(1).
        Ответить
        
        Desktop 13.10.2020 22:54 # 0
        
        понятно.
        
        для разрешения коллизий обычно по хешу сохраняются все экземпляры. если на хеше их несколько, то тогда сравнивают ещё как-то иначе (IComparable в общем). но это только одна из реализаций, как я понимаю
        Ответить
        
        DypHuu_niBEHb 13.10.2020 22:57 # 0
        
        Да можно и без компарабл впринципе, а просто "Equals".
        В самом тупом варианте ты бежишь по списку всех, у кого хеши совпали, и ищешь нужный.
        Ответить
        
        bormand 13.10.2020 17:45 # 0
        
        Кстати, а как в коке сформулировать теорему в духе "для всех списков, в которых нет одинаковых элементов, checkRepeat возвращает false"?
        Ответить
        
        CHayT 13.10.2020 18:04 # +1
        
        Require Import List. Import ListNotations. Inductive no_dupes {A : Type} : list A -> Prop := | no_dupes0 : no_dupes [] | no_dupes1 : forall a l, ~In a l -> no_dupes (a :: l). Definition checkRepeat {A} (l : list A) : bool. ... Defined. Theorem checkRepeatCorrect {A} : forall (l : list A), no_dupes l <-> checkRepeat l = false.
        Ответить
        
        CHayT 13.10.2020 18:10 # 0
        
        P.S. это более строгое утверждение, которое говорит, что false возвращается _только_ когда в списке нет повторов, а не, скажем, всегда ^____~. "const false" подошло бы под оригинальное определение теоремы. Ну плюс, очевидно, это сформулировано для коковских списков, а не сишных. В доказательства про императивщину с кучей я не умею, там нужно iris вкуривать, а мне лень.
        Ответить
        
        bormand 13.10.2020 18:20 # 0
        
        Ну я хотел рядом вторую теорему, что он возвращает true если повторы таки есть.
        
        З.Ы. Такое ощущение, что после формулировки no_dupes писать реализацию checkRepeat уже бессмысленно. Разве что какую-то более оптимизированную версию.
        Ответить
        
        CHayT 13.10.2020 18:26 # 0
        
        Вообще говоря, стоит. Индуктивное определение ты не можешь взять и вычислить: т.е. для конкретной строки с его помощью ты фиг поймёшь, содержит ли она повторы или нет, придётся пилить доказательство. Это определение — способ описать все возможные строки без повторов, а не способ определить, есть ли повторы.
        Ответить
        
        bormand 13.10.2020 18:30 # 0
        
        А не забыл ли ты no_dupes(l) после ~In a l?
        
        А то получится, что в списке [1, 2, 2, 2] нет повторов.
        Ответить
        
        CHayT 13.10.2020 18:31 # +2
        
        Забыл. Главная проблема формальной верификации: скормишь ей мусор — получишь верифицированный мусор.
        
        P.S. Поэтому для подобных определений я обычно тесты пилю.
        Ответить
        
        bormand 13.10.2020 18:34 # 0
        
        Ну всегда можно рядом традиционный юнит-тест через Example написать, чтобы спокойнее было.
        Ответить
        
        rotoeb 13.10.2020 18:35 # 0
        
        Тесты не нужны.
        Ответить
        
        DypHuu_niBEHb 13.10.2020 18:37 # 0
        
        А формальные доказательства?
        Ответить
        
        bormand 13.10.2020 18:40 # 0
        
        Тем более. Ты что, не уверен в себе и не можешь написать код правильно?
        Ответить
        
        DypHuu_niBEHb 13.10.2020 18:43 # +3
        
        Issue trackerы не нужны, потому что у меня нормально с памятью.
        
        Тесты и доказательства не нужны, потому что я в состоянии нормально написать код.
        
        По этой же причине не нужны QA. И статические анализаторы.
        
        Ничего этого не было у Дурова, когда он написал "Вконтакте".
        Ответить
        
        rotoeb 13.10.2020 19:43 # 0
        
        >>>"Ничего этого не было у Дурова, когда он написал "Вконтакте"."
        
        Между прочим. И где Дуров? А где вы все?
        Ответить
        
        DypHuu_niBEHb 13.10.2020 19:44 # −1
        
        А где Дуров, кстати?
        Ответить
        
        rotoeb 13.10.2020 19:45 # 0
        
        Он богат, успешен, известен, читает ваши переписки, ему завидуют, на него хотят быть похожими. А резиденты "Говнокода"... Ой, всё...
        Ответить
        
        DypHuu_niBEHb 13.10.2020 19:47 # −1
        
        Но ты так и не ответил, где он.
        Переписок моих он не читает (я его говном не пользуюсь), а еще он живет один, в какой-то тьмутаракани, пива не пьет, мяса не ест, ужасно же. Не хотел бы я так
        Ответить
        
        rotoeb 13.10.2020 19:50 # 0
        
        Он постоянно мигрирует.
        
        >>>"он живет один, в какой-то тьмутаракани, пива не пьет, мяса не ест"
        
        Ты уверен, что это был не пиздёж?
        Ответить
        
        DypHuu_niBEHb 13.10.2020 19:54 # −1
        
        А зачем он постоянно мигрирует? Он в бегах? Прячется?
        Бедный парень(( Я бы с ума сошел так жить.
        
        >Ты уверен, что это был не пиздёж?
        А зачем ему врать?
        Ответить
        
        rotoeb 13.10.2020 20:00 # 0
        
        Бегает не бегает, а в лучших отелях всё-таки живёт, мир видит и в комфортабельных автомобилях разъезжает. А чего добился ты?
        
        >>>"А зачем ему врать?"
        
        Чтобы казаться не таким, как все.
        Ответить
        
        guest8 13.10.2020 20:10 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        CHayT 13.10.2020 17:45 # 0
        
        P.S. Туплю. В случае длинной строки уже сам сорт память отожрёт.
        Ответить
        
        bormand 13.10.2020 17:48 # 0
        
        Ну есть же inplace алгоритмы, которые не отожрут. Но строку после этого только выбрасывать, конечно.
        Ответить
        
        CHayT 13.10.2020 17:58 # 0
        
        Даже in-place алгоритмам обычно нужна память для хранения вспомогательной питушни, вроде того, какие куски массива ещё не отсортированы.
        Ответить
        
        bormand 13.10.2020 18:42 # 0
        
        Ну у большинства это О(1) или O(log(N)), так что сойдёт. Наивный квиксорт мы тут упоминать не будем.
        Ответить

rotoeb 13.10.2020 15:16 # 0

Кто-нибудь?...

Ответить

Raj_Kapoor 13.10.2020 15:42 # −21
показать все, что скрыто
```
<?php

function CheckRepeat($cur, $i, &$word) {
	return ($word[$cur] != "\0") ? (($word[$i] != "\0") ? (($word[$cur] == $word[$i] && $cur != $i) ? true : CheckRepeat($cur, $i + 1, $word)) : CheckRepeat($cur + 1, 0, $word)) : false;
}
```
Ответить
- oaoaoammm 13.10.2020 17:22 # −1
  
  > $word
  
  Меня этот знак доллара всегда прикалывает, потому что я его читаю как С, которая английская С, то есть как русская Г.
  
  Так executable превращается в sexecutable, многие другие слова тоже забавно коверкаются.
  Ответить
  - DypHuu_niBEHb 13.10.2020 18:09 # +1
    
    у лисперов есть sexpr
    а у тебя нету
    Ответить
- rotoeb 13.10.2020 17:30 # −20
  
  показать все, что скрытоНу почему на этот код приятнее смотреть, чем на оригинал?
  Ведь можно обойтись без "була" в начале, без долбоёбских звёздочек, без указания типов...
  Ответить

guest8 13.10.2020 17:59 # −999

показать все, что скрытоvanished

Ответить

bormand 13.10.2020 18:00 # 0

В дебаге - запросто. В релизе не должно, рекурсия всё-таки хвостовая.
Ответить

6e3By3HbIu_nemyx 13.10.2020 23:11 # −1

Приведи реальный пример, когда тебе в работе нужно было проверять слово на повтор букв.

Ответить

rotoeb 14.10.2020 00:18 # −20

показать все, что скрытоУ меня такой хуйни не было. Так что ситуация в посте явно надуманная.
Ответить
- guest8 14.10.2020 00:20 # −999
  
  показать все, что скрытоvanished
  Ответить
- G0_G4 14.10.2020 00:31 # −1
  
  Какое дали задание, такое и выполняем. Вот полное условие: Сформировать строку из слов исходной строки, содержащих повторяющиеся буквы. Плюс требования от преподавателя использовать рекурсию и 60 строк на подпрограммы
  Ответить
  - rotoeb 14.10.2020 11:55 # +2
    
    В шею гнать преподавателя, дающего неприменимые на практике задания.
    Ответить
  - bormand 14.10.2020 14:10 # 0
    
    > полное условие
    
    Слово "Bob" содержит повторяющиеся буквы?
    Ответить
    - G0_G4 14.10.2020 14:49 # −1
      
      А вот этого не уточнялось
      Ответить
      - Desktop 14.10.2020 14:51 # −1
        
        неграмотно сформулированная постановка задачи
        
        можешь нассать преподу на усы (уверен, что они у него есть)
        Ответить
        
        G0_G4 14.10.2020 14:52 # −1
        
        это женщина
        Ответить
        
        bormand 14.10.2020 14:58 # 0
        
        Тем более.
        Ответить
        
        guest8 14.10.2020 15:05 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        guest8 14.10.2020 15:16 # −999
        
        показать все, что скрытоvanished
        Ответить
      - bormand 14.10.2020 15:26 # +2
        
        Является ли "字" буквой? Есть ли повторяющиеся буквы в слове "Straße"?
        Ответить
        
        Desktop 14.10.2020 15:30 # 0
        
        В вузе за пределами ascii жизни нет
        Ответить
        
        bormand 14.10.2020 15:32 # 0
        
        За пределами ascii жизни вообще нет. Только анальная боль.
        Ответить
      - bormand 14.10.2020 15:46 # 0
        
        Что делать с языками, в которых нет букв?
        Ответить
        
        Desktop 14.10.2020 15:48 # +3
        
        ты хочешь, чтобы он ушёл в вагоновожатые?))
        Ответить
        
        Mithun_Chakraborty 14.10.2020 15:54 # +1
        
        Борманд вроде не любит личный транспорт, поэтому пользуется общественным. Значит, он заинтересован в том, чтобы вагоновожатых было много, чтобы долго не стоять на остановке в ожидании.
        Ответить
        
        Desktop 14.10.2020 15:56 # 0
        
        > Борманд вроде не любит личный транспорт
        - не все знают, но в аббревиатуре BMW первая буква на самом деле означает Bormand
        Ответить
        
        bormand 14.10.2020 16:01 # +1
        
        Да я просто подумал, что я не могу решить эту задачу.
        
        Как, к примеру, разделить японский текст на слова? Боюсь, что даже «icu» с его многомегабайтными таблицами тут не справится.
        
        З.Ы. Походу справится, у них есть таблички с word boundary для таких языков.
        Ответить
        
        Desktop 14.10.2020 16:04 # 0
        
        да это ж задача не про текст, на самом деле, а про дискретные множества
        
        а как в общем работают рагулярки для японского текста?
        Ответить
        
        bormand 14.10.2020 16:13 # 0
        
        В душе не ебу. Регулярками естественные языки лучше не парсить, имхо.
        Ответить
        
        Desktop 14.10.2020 16:16 # 0
        
        http://www.localizingjapan.com/blog/2012/01/20/regular-expressions-for-japanese-text/
        
        кодепоинты и Unicode block properties, в общем
        Ответить
        
        bormand 14.10.2020 16:21 # +1
        
        Ну суть в том, что ты слова регулярками там никак не выпарсишь. Разве что весь словарь японского языка загнать в регулярку. Но это будет покруче знаменитой регулярки про проверку email.
        
        В «icu» специальный итератор для этого завезли. Который для любого языка умеет прыгать по границам слов, предложений и чего-то там ещё.
        Ответить
        
        Mithun_Chakraborty 14.10.2020 16:22 # +1
        
        Проблему обозначил Борманд: «У японцев слово может быть записано как 1-2 иероглифа + ещё немного каны».
        
        Есть слова, для которых нет готового иероглифа, поэтому их пишут иероглифом с суффиксом, представленным каной. Эти же слова могут быть записаны и полностью каной. Для поиска слов придётся учитывать оба варианта.
        
        Почему нельзя для поиска нормализовать? В японском жуткая омофония: есть слова, у которых разный смысл, но в современном японском произносятся они одинаково, поэтому каной пишутся тоже одинаково, а вот иероглифами пишутся по-разному, чтобы различать омонимы. При нормализации мы рискуем потерять полезную информацию.
        
        Это примерно как в дореволюционной орфографии русского были слова «миръ» и «міръ», которые звучали одинаково, а смысл был разным (одно из них — весь свет, другое — отсутствие войны). Русский пережил «нормализацию», потому что таких реальных примеров было немного, а вот в японском они на каждом шагу.
        Ответить
        
        Desktop 14.10.2020 16:31 # +2
        
        ну студент в лабе в любом случае проверяет слово на повторение букв
        
        поменяй буквы на кодпоинты и это будет работать для любого языка, если ты точно знаешь, что передал в функцию одно слово
        
        а вы как обычно усложнили задачу зачем-то)
        Ответить
        
        bormand 14.10.2020 16:32 # +1
        
        > кодпоинты
        
        В какой из четырёх нормальных форм?
        Ответить
        
        Desktop 14.10.2020 16:35 # 0
        
        какая разница?
        
        один символ можно записать четырьмя разными кодпоинтами что ли?
        
        я вот смотрю в статью и вижу, что у хираганы свой интервал, у катаканы свой, у защеканы свой
        Ответить
        
        Mithun_Chakraborty 14.10.2020 16:37 # 0
        
        Выше обсуждали композицию-декомпозицию для буков типа немецкого «ä»:
        http://govnokod.ru/27025#comment584463
        Ответить
        
        bormand 14.10.2020 16:38 # +1
        
        Ну вот есть у меня кодепоинт 'á' (форма NKC), а есть пара из кодепоинта 'a' и кодепоинта '´' (форма NKD). Визуально они выглядят одинаково, а твоя прога на них сломается.
        
        И это обычный еврогейский язык, никаких иероглифов.
        
        Именно поэтому придумали нормальные формы.
        Ответить
        
        Desktop 14.10.2020 16:55 # +1
        
        да уж
        
        я бы предполагал, что разный набор кодпоинтов подразумевает разные строки для технического сравнения, но сравнение выходит семантическое (проверил на свифте)
        Ответить
        
        bormand 14.10.2020 17:19 # 0
        
        > семантическое
        
        Более того, всякие ⑦ и ⁷ тоже могут быть равны 7 если включить более мягкий режим сравнения (не во всех либах есть, но в icu точно был).
        Ответить
        
        Desktop 14.10.2020 17:27 # 0
        
        а road и rоаd?
        
        ё-моё, мне даже фф второе слово не подчёркивает лол
        Ответить
        
        bormand 14.10.2020 17:28 # +1
        
        Да, с NFKC нормализацией о и o должны совпасть.
        Ответить
        
        bormand 14.10.2020 17:40 # +1
        
        Хуй там, не совпали :) Кириллическая о в латинскую o почему-то не превращается.
        Ответить
        
        Mithun_Chakraborty 14.10.2020 16:05 # −1
        
        Китайцы тоже шпарят без пробелов. Это традиция письменностей, основанных на иероглифах.
        Ответить
        
        bormand 14.10.2020 16:12 # +1
        
        Я не настоящий сварщик, но у китайцев вроде попроще.
        
        У японцев слово может быть записано как 1-2 иероглифа + ещё немного каны. Или целиком каной. Или вообще ромадзи.
        Ответить
        
        Mithun_Chakraborty 14.10.2020 16:16 # 0
        
        Смесь иероглифов со слоговой азбукой (с каной) встречается вроде только у японцев. Это всё равно, что вместо слова «домик» поставить эмодзи с изображением домика и пририсовать суффикс «ик». Выглядит как ребус.
        Ответить
        
        Desktop 14.10.2020 16:18 # +1
        
        https://registraciyakarty.ru/wp-content/uploads/2019/04/www-7ya-ru-kartareg-4.jpg
        Ответить
        
        Mithun_Chakraborty 14.10.2020 16:30 # 0
        
        О5 зожимаешь?
        Ответить
        
        Desktop 14.10.2020 16:32 # 0
        
        хороший магазин 5очка
        Ответить
        
        guest8 14.10.2020 16:39 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        Mithun_Chakraborty 14.10.2020 16:07 # 0
        
        Кстати, по-японски можно писать хираганой. Тогда алгоритмы для европейских языков будут пригодны (с поправкой на то, что единицей письменности будет слог, а не буква).
        Ответить
        
        bormand 14.10.2020 16:19 # +1
        
        Ну вот опять же, 「ツ」и 「つ」считать одинаковыми?
        
        Или слова с «iteration mark»「ゝ」, который повторяет предыдущий слог.
        Ответить
        
        Mithun_Chakraborty 14.10.2020 16:28 # 0
        
        Про «iteration mark» не знал. Похоже, что это такая же питушня, как реприза у музыкантов. Но если у музыкантов в этом есть смысл (там повторяется длинный отрывок), то тут повторяется всего лишь один слог? Зачем? Зачем?
        Ответить
        
        bormand 14.10.2020 16:30 # 0
        
        Ещё маленькая 「っ」 есть, которая повторяет согласную (не путать с 「つ」!).
        Ответить
        
        bormand 14.10.2020 16:44 # +1
        
        Иногда реально хочется уйти в вагоновожатые...
        
        В старые добрые времена я знал что такое длина строки, всё было просто и понятно.
        
        А теперь нет. В байтах (в какой-то кодировке)? В соснольных квадратиках? В глифах? В пикселях (может зависеть от предыдущего куска и вообще быть вертикальной)? В кодепоинтах (какой-то нормальной формы)?
        Ответить
        
        guest8 14.10.2020 16:52 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        bormand 14.10.2020 16:56 # 0
        
        Ну вот например 字 — это один кодепоинт, 3 байта, один глиф и два соснольных квадратика (занимает джва слота в "моноширинном" шрифте).
        А á - это один-два кодепоинта, два-три байта, один глиф и один соснольный квадратик.
        
        > от порядка букв и наличия кернинга в шрифте
        
        В какую сторону измеряется "длина" в монгольской вертикальной письменности?
        // 字test // --test // мда, в браузере "моноширинный шрифт" вообще распидорасило
        Ответить
        
        MAPTbIwKA 14.10.2020 17:07 # 0
        
        > два соснольных квадратика (занимает джва слота в "моноширинном" шрифте).
        
        аа, пиздец, я не умею фар ист хуйни, слава богу.
        
        От отсос я почуял еще в момент появления utf-8, когда стало непросто за O(1) указать середину текста.
        
        > "длина" в монгольской вертикальной письменности?
        в высоту, очевидно
        
        body width это высота у вертикальных алфавитов
        Ответить
        
        bormand 14.10.2020 17:10 # 0
        
        > аа, пиздец
        
        Ну вот кстати таблички в mc и ls не разносит от японских символов, т.е. они реально это учитывают (актуально для каталога с торрентами, лол).
        Ответить
        
        guest8 14.10.2020 17:12 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        bormand 14.10.2020 17:15 # 0
        
        man wcwidth
        Ответить
        
        guest8 14.10.2020 17:16 # −999
        
        показать все, что скрытоvanished
        Ответить
        
        bormand 14.10.2020 17:24 # 0
        
        Ну что, у кого хватит слабоумия и отваги чтобы решить задачку с учётом юникода?
        Ответить
        
        bormand 14.10.2020 20:42 # 0
        
        https://govnokod.ru/27029
        Ответить

bormand 14.10.2020 19:01 # −1

Лол, СlangFormat'у крышу снесло от иврита, начал код пидорасить, вставляя пробелы в рандомные места.

Ответить

rotoeb 14.10.2020 19:03 # 0

Что за наезды на иврит? Ты антисемит, что ли?
Ответить
- bormand 14.10.2020 19:03 # 0
  
  Я то что, это кланг-формат писали антисемиты.
  Ответить
guest8 14.10.2020 20:14 # −999

показать все, что скрытоvanished
Ответить
- bormand 14.10.2020 20:18 # 0
  
  Да нет, просто строка в кавычках.
  Ответить

Говнокод: по колено в коде.

C++ / Говнокод #27025

Комментарии (185) RSS

Добавить комментарий