Вариант для распечатки |
Пред. тема | След. тема | ||
Форум Разговоры, обсуждение новостей | |||
---|---|---|---|
Режим отображения отдельной подветви беседы | [ Отслеживать ] |
Оглавление |
Сообщения | [Сортировка по времени | RSS] |
2. "Выпуск GNU grep 2.26" | +/– | |
Сообщение от Crazy Alex (ok), 03-Окт-16, 21:02 | ||
Именно. Оставили бы одну латиницу - 256 символов как раз бы хватило на все умляуты и подобное. Всё равно дикарям с кириллицей и прочими иероглифами сложную технику давать нежелательно. | ||
Ответить | Правка | Наверх | Cообщить модератору |
3. "Выпуск GNU grep 2.26" | –4 +/– | |
Сообщение от Аноним (-), 03-Окт-16, 21:31 | ||
Вы или крестик снимите (хватить жопничать байты для UCS-4), или трусы оденьте (KOI8-R во все стринги и чары). | ||
Ответить | Правка | Наверх | Cообщить модератору |
4. "Выпуск GNU grep 2.26" | +1 +/– | |
Сообщение от Stax (ok), 03-Окт-16, 21:43 | ||
А UCS-4 не текст, символы с кодом 0, однако. Вы предложите вариант, чтобы без управляющих символов в тексте. | ||
Ответить | Правка | Наверх | Cообщить модератору |
8. "Выпуск GNU grep 2.26" | –2 +/– | |
Сообщение от Аноним (-), 03-Окт-16, 23:15 | ||
Я вообще предлагаю, разработать новую кодировку - машслово со времён 8битовых кодировок выросло в 8 раз, нет ни единой веской причины, кроме legacy, цепляться за эти волшебные 2^8. И да, память в "веские причины" не входит. | ||
Ответить | Правка | Наверх | Cообщить модератору |
13. "Выпуск GNU grep 2.26" | +/– | |
Сообщение от Аноним (-), 04-Окт-16, 10:21 | ||
Нет ни единой веской причины разрабатывать кодировку с 8-байтным символом. Ошибки в некоторых продуктах при работе с символами переменной длины в "веские причины" не входят. | ||
Ответить | Правка | Наверх | Cообщить модератору |
30. "Выпуск GNU grep 2.26" | –1 +/– | |
Сообщение от Аноним (-), 04-Окт-16, 17:35 | ||
Т.е. фортеля с сегментной памятью это хорошо и удобно, что аж перешли на модель плоской памяти? А уж как все были в восторге от циркового фокуса под названием PAE, когда в 32битные указатели вдруг вся эта плоская память стала не помещаться. | ||
Ответить | Правка | Наверх | Cообщить модератору |
5. "Выпуск GNU grep 2.26" | +2 +/– | |
Сообщение от Аноним (-), 03-Окт-16, 21:46 | ||
Помню, какая истерика была при переходе на 64-битную архитектуру, что, дескать, память жрёт, а тут все строки в 4 раза увеличить. Ну да, ну да. | ||
Ответить | Правка | К родителю #3 | Наверх | Cообщить модератору |
10. "Выпуск GNU grep 2.26" | +2 +/– | |
Сообщение от Crazy Alex (ok), 04-Окт-16, 00:50 | ||
Лично меня текущая ситуация - UTF-8 на диске и то, что удобнее в каждом конкретном случае - в памяти - полностью устраивает. Это Шигорина опечалило то, что алгоритм поменяли. А ведь - слава utf-8 - поменяли не из-за того, что поломан, а только ради оптимизации. | ||
Ответить | Правка | К родителю #3 | Наверх | Cообщить модератору |
19. "Выпуск GNU grep 2.26" | +/– | |
Сообщение от Аноноим (?), 04-Окт-16, 13:48 | ||
UTF-8 не нужно по причине непредсказуемости того, сколько символов в этой кодировке можно запихнуть в массив размером столько-то байт. Чисто для примера возьмём максимальную длину имени файла в линуксовых файловых системах, то есть 255 байт. Сколько это будет не латинских букв и цифр при UTF-8? А хз: с кириллицей один результат, с иероглифами другой, с каким-нибудь санскритом или греческим третий. Как выделить в оперативке буфер для текста размером, например, в 1024 символа? Умножай это дело на 6, поскольку в теории символ utf-8 может весить до 6 байт и выделяй, ага:) И прочее и прочее. | ||
Ответить | Правка | Наверх | Cообщить модератору |
21. "Выпуск GNU grep 2.26" | +2 +/– | |
Сообщение от Аноним (-), 04-Окт-16, 14:09 | ||
А зачем нужно ровно 1024 символа? | ||
Ответить | Правка | Наверх | Cообщить модератору |
25. "Выпуск GNU grep 2.26" | –1 +/– | |
Сообщение от Аноноим (?), 04-Окт-16, 14:27 | ||
1024 - просто для примера. Ёмкость какого-нибудь буфера для сетевых/файловых операций или ещё чего типа длины строки при использовании паскалеподобных языков, у которых она задаётся заранее вместо нулевого символа в качестве признака конца строки. Вот и думай что лучше: то ли вместо одного килобайта оперативки сразу шесть выделить и не мучиться, то ли ждать грабель из серии "последний символ в отведённой памяти целиком не поместился", либо "ой, блин, файл из архива не вынимается по причине русского и слишком длинного имени". | ||
Ответить | Правка | Наверх | Cообщить модератору |
22. "Выпуск GNU grep 2.26" | +3 +/– | |
Сообщение от Stax (ok), 04-Окт-16, 14:18 | ||
Аллокация с запасом, realloc, аллокация связанных структур и т.д. и т.п. | ||
Ответить | Правка | К родителю #19 | Наверх | Cообщить модератору |
23. "Выпуск GNU grep 2.26" | –2 +/– | |
Сообщение от iZEN (ok), 04-Окт-16, 14:21 | ||
> Как выделить в оперативке буфер для текста размером, например, в 1024 символа? Умножай это дело на 6, поскольку в теории символ utf-8 может весить до 6 байт и выделяй, ага:) И прочее и прочее. | ||
Ответить | Правка | К родителю #19 | Наверх | Cообщить модератору |
26. "Выпуск GNU grep 2.26" | +2 +/– | |
Сообщение от Аноноим (?), 04-Окт-16, 14:28 | ||
>> Как выделить в оперативке буфер для текста размером, например, в 1024 символа? Умножай это дело на 6, поскольку в теории символ utf-8 может весить до 6 байт и выделяй, ага:) И прочее и прочее. | ||
Ответить | Правка | Наверх | Cообщить модератору |
37. "Выпуск GNU grep 2.26" | +1 +/– | |
Сообщение от iZEN (ok), 04-Окт-16, 21:11 | ||
>>> Как выделить в оперативке буфер для текста размером, например, в 1024 символа? Умножай это дело на 6, поскольку в теории символ utf-8 может весить до 6 байт и выделяй, ага:) И прочее и прочее. | ||
Ответить | Правка | Наверх | Cообщить модератору |
48. "Выпуск GNU grep 2.26" | +/– | |
Сообщение от Аноним Аналитег (?), 05-Окт-16, 20:23 | ||
Проблемы несколько шире, в MariaDB/MySQL на символ utf8 аллокируется 3 байта, для четырех байтовых символов есть отдельный characterset, для пяти уже нету. | ||
Ответить | Правка | К родителю #23 | Наверх | Cообщить модератору |
27. "Выпуск GNU grep 2.26" | –1 +/– | |
Сообщение от Michael Shigorin (ok), 04-Окт-16, 14:41 | ||
> Это Шигорина опечалило то, что алгоритм поменяли. | ||
Ответить | Правка | К родителю #10 | Наверх | Cообщить модератору |
6. "Выпуск GNU grep 2.26" | –8 +/– | |
Сообщение от Michael Shigorin (ok), 03-Окт-16, 22:04 | ||
> Именно. Оставили бы одну латиницу - 256 символов как раз бы хватило | ||
Ответить | Правка | К родителю #2 | Наверх | Cообщить модератору |
9. "Выпуск GNU grep 2.26" | +1 +/– | |
Сообщение от Crazy Alex (ok), 04-Окт-16, 00:47 | ||
Ну дык - дикарское желание пробиться + образование/цивилизация... ;-) | ||
Ответить | Правка | Наверх | Cообщить модератору |
20. "Выпуск GNU grep 2.26" | +/– | |
Сообщение от Michael Shigorin (ok), 04-Окт-16, 14:08 | ||
> P.S. Если кто-то не понял - предыдущий коммент - сарказм. | ||
Ответить | Правка | Наверх | Cообщить модератору |
51. "Выпуск GNU grep 2.26" | +/– | |
Сообщение от noko (?), 31-Окт-16, 02:41 | ||
Ахах, до сих пор 100% ватан) | ||
Ответить | Правка | Наверх | Cообщить модератору |
17. "Выпуск GNU grep 2.26" | –1 +/– | |
Сообщение от Клыкастый (ok), 04-Окт-16, 12:13 | ||
Михаил заработался и не смог в сарказм :) | ||
Ответить | Правка | К родителю #6 | Наверх | Cообщить модератору |
11. "Выпуск GNU grep 2.26" | +/– | |
Сообщение от Vkni (ok), 04-Окт-16, 01:17 | ||
> Всё равно дикарям с кириллицей и прочими иероглифами сложную технику давать нежелательно. | ||
Ответить | Правка | К родителю #2 | Наверх | Cообщить модератору |
16. "Выпуск GNU grep 2.26" | +/– | |
Сообщение от вотак (?), 04-Окт-16, 11:46 | ||
>> Всё равно дикарям с кириллицей и прочими иероглифами сложную технику давать нежелательно. | ||
Ответить | Правка | Наверх | Cообщить модератору |
45. "Выпуск GNU grep 2.26" | –1 +/– | |
Сообщение от Аноним (-), 05-Окт-16, 01:55 | ||
Гуглите, что такое "внутренняя монголия" и где она находится. | ||
Ответить | Правка | Наверх | Cообщить модератору |
18. "Выпуск GNU grep 2.26" | –1 +/– | |
Сообщение от Клыкастый (ok), 04-Окт-16, 12:14 | ||
> Алекс, через 30 лет вы на первое место поставите иероглифы, а дикари у вас будут с алфавитами. | ||
Ответить | Правка | К родителю #11 | Наверх | Cообщить модератору |
24. "Выпуск GNU grep 2.26" | –1 +/– | |
Сообщение от iZEN (ok), 04-Окт-16, 14:22 | ||
>> Алекс, через 30 лет вы на первое место поставите иероглифы, а дикари у вас будут с алфавитами. | ||
Ответить | Правка | Наверх | Cообщить модератору |
28. "Выпуск GNU grep 2.26" | –1 +/– | |
Сообщение от Клыкастый (ok), 04-Окт-16, 14:50 | ||
> В Японии же. | ||
Ответить | Правка | Наверх | Cообщить модератору |
33. "Выпуск GNU grep 2.26" | +/– | |
Сообщение от Crazy Alex (ok), 04-Окт-16, 19:20 | ||
Японская письменность весьма условно иероглифы - их там что-то около трёх тысяч употребляется, всё остальное добирается слоговым письмом. Примерным аналогом их иероглифов в алфавитных языках можно считать корни слов. | ||
Ответить | Правка | К родителю #24 | Наверх | Cообщить модератору |
34. "Выпуск GNU grep 2.26" | +/– | |
Сообщение от Crazy Alex (ok), 04-Окт-16, 19:21 | ||
Я ж говорю - дикари | ||
Ответить | Правка | К родителю #18 | Наверх | Cообщить модератору |
32. "Выпуск GNU grep 2.26" | +/– | |
Сообщение от Crazy Alex (ok), 04-Окт-16, 19:16 | ||
Я (возможно, предвзято) придерживаюсь мнения, что цивилизация в её современном/будущем виде с иероглифами совместима плохо. По причинам в основном психологического толка. Пока это подтверждается - товарищи, у которых нет алфавита, всё ещё догоняют и копируют, хоть и на очень хорошем уровне. Оригинальных открытий/изобретений особо не видно. | ||
Ответить | Правка | К родителю #11 | Наверх | Cообщить модератору |
36. "Выпуск GNU grep 2.26" | +/– | |
Сообщение от Michael Shigorin (ok), 04-Окт-16, 19:57 | ||
> товарищи, у которых нет алфавита | ||
Ответить | Правка | Наверх | Cообщить модератору |
38. "Выпуск GNU grep 2.26" | +/– | |
Сообщение от Vkni (ok), 04-Окт-16, 21:26 | ||
> Я (возможно, предвзято) придерживаюсь мнения, что цивилизация в её современном/будущем | ||
Ответить | Правка | К родителю #32 | Наверх | Cообщить модератору |
43. "Выпуск GNU grep 2.26" | +/– | |
Сообщение от fail (?), 05-Окт-16, 00:04 | ||
>> Я (возможно, предвзято) придерживаюсь мнения, что цивилизация в её современном/будущем | ||
Ответить | Правка | Наверх | Cообщить модератору |
Архив | Удалить |
Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема |
Закладки на сайте Проследить за страницей |
Created 1996-2024 by Maxim Chirkov Добавить, Поддержать, Вебмастеру |