The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Режим отображения отдельной подветви беседы [ Отслеживать ]

Оглавление

Шрифты, разработанные для офисного пакета МойОфис, опубликов..., opennews (??), 21-Дек-16, (0) [смотреть все]

Сообщения [Сортировка по времени | RSS]


8. "Шрифты, разработанные для офисного пакета МойОфис, опубликов..."  +7 +/
Сообщение от Аноним (-), 21-Дек-16, 12:23 
Я так думаю, что в этом предложении встречаются все буквы русского языка. Смысла тут искать не надо.
Ответить | Правка | Наверх | Cообщить модератору
Часть нити удалена модератором

17. "Шрифты, разработанные для офисного пакета МойОфис, опубликов..."  +9 +/
Сообщение от Аноним (-), 21-Дек-16, 13:08 
'южно-эфиопский грач увёл мышь за хобот на съезд ящериц'.scan(/\p{alpha}/).sort.uniq
=> ["а", "б", "в", "г", "д", "е", "ж", "з", "и", "й", "к", "л", "м", "н", "о", "п", "р", "с", "т", "у", "ф", "х", "ц", "ч", "ш", "щ", "ъ", "ы", "ь", "э", "ю", "я", "ё"]
33 буквы
Ответить | Правка | Наверх | Cообщить модератору

26. "Шрифты, разработанные для офисного пакета МойОфис, опубликов..."  +/
Сообщение от Аноним (-), 21-Дек-16, 13:38 
А где остальные 16?
Ответить | Правка | Наверх | Cообщить модератору

28. "Шрифты, разработанные для офисного пакета МойОфис, опубликов..."  +2 +/
Сообщение от Аноним (-), 21-Дек-16, 13:50 
в старославянском было 44-46, какие "ещё 14"?
Ответить | Правка | Наверх | Cообщить модератору

32. "Шрифты, разработанные для офисного пакета МойОфис, опубликов..."  +/
Сообщение от Аноним (-), 21-Дек-16, 13:52 
пардон, 16
Ответить | Правка | Наверх | Cообщить модератору

33. "Шрифты, разработанные для офисного пакета МойОфис, опубликов..."  +/
Сообщение от Аноним (-), 21-Дек-16, 13:53 
хотя я не спец, цпш не оканчивал
Ответить | Правка | К родителю #28 | Наверх | Cообщить модератору

48. "Шрифты, разработанные для офисного пакета МойОфис, опубликов..."  +2 +/
Сообщение от Аноним (-), 21-Дек-16, 17:05 
церковно-славянский и старо-славянский не одно и то же
Ответить | Правка | Наверх | Cообщить модератору

56. "Шрифты, разработанные для офисного пакета МойОфис, опубликов..."  +/
Сообщение от Аноним (-), 21-Дек-16, 19:25 
Вот за что мы все любим юникод, так это за корректно работающую сортировку, не что что эти ваши однобайтовые. Вот в юникоде и ё идёт после я, и символы сравниваются не последовательно, а в понятном простому пользователю порядке:

$ printf -- %s\\n "-a" "/a" "-b" "/b" |LC_ALL=ru_RU.UTF-8 sort
-a
/a
-b
/b/code]
Ответить | Правка | К родителю #17 | Наверх | Cообщить модератору

59. "Шрифты, разработанные для офисного пакета МойОфис, опубликов..."  +/
Сообщение от botman (ok), 21-Дек-16, 21:55 
а нафига тебе в LC_ALL чего-то загонять?
Ответить | Правка | Наверх | Cообщить модератору

82. "Шрифты, разработанные для офисного пакета МойОфис, опубликов..."  –8 +/
Сообщение от trdm (ok), 22-Дек-16, 11:23 
В юникоде каждый стринг весит 2 раза больше чем нужно.
И соответственно программы жрут памяти в 2 раза больше чем нужно.
Хотя непонятно зачем юникод для русских, если есть windows-1251 или кои++ кодировки.
Исключительно что-бы линь не глючил?
Пристрастие к юникоду сделало большую выручку производителям железа. За счет иногда что-то подозревающих пользователей.
С точки зрения добросовестного софтописателя юникод удобен, но оверхед по памяти увеличивается в 2 раза. Когда приходится бороться за юзера - это сложный выбор.
Вспомним эклипсу к примеру. Или старые программы на яве.
Ответить | Правка | К родителю #56 | Наверх | Cообщить модератору

86. "Шрифты, разработанные для офисного пакета МойОфис, опубликов..."  +1 +/
Сообщение от zfs (??), 22-Дек-16, 13:10 
> В юникоде каждый стринг весит 2 раза больше чем нужно.

Срочно читать про UTF-8, UTF-16, UTF-32.
> непонятно зачем юникод для русских, если есть windows-1251 или кои++ кодировки.

Виндовый поклонник Штирлица и т.п.?
> но оверхед по памяти увеличивается в 2 раза.

Это у вас на винде sizeof(wchar_t)==2, в gcc sizeof(wchar_t)==4. Но, тем не менее, это не значит, что памяти всегда тупо в 4 раза больше надо (см. выше про UTF-8)/

Ответить | Правка | Наверх | Cообщить модератору

87. "Шрифты, разработанные для офисного пакета МойОфис, опубликов..."  +/
Сообщение от nuclight (??), 22-Дек-16, 19:52 
Для тех, кому оверхед UTF-8 по размеру _действительно_ представляет проблему, есть SCSU.
Ответить | Правка | К родителю #82 | Наверх | Cообщить модератору

88. "Шрифты, разработанные для офисного пакета МойОфис, опубликов..."  +4 +/
Сообщение от Orduemail (ok), 22-Дек-16, 23:24 
Однобайтовые кодировки -- убожество. Они еле-еле справляются два алфавита в себя вместить. Когда же вдруг я скачиваю с ютуба видяшку, у которой в заглавии иероглифы, то... oh shit... Или может быть эта видяшка озаглавлена на немецком, испанском или ещё каком языке, который использует какие-нибудь странные буквы, которых нет в koi8-r?
Это не проблема с utf-8. Ну, точнее это может создавать проблем: с такими файлами трудно из командной строки работать, потому что я не умею на клавиатуре иероглифы набирать. Но в консольке можно скопипастить. А для тех, кто работает с гуёвым файлменагером это вообще не проблема.
И именно поэтому, когда я узрел возможность мигрировать на utf-8 с убогой koi8-r, я сделал это моментально.

> И соответственно программы жрут памяти в 2 раза больше чем нужно.

Гы. Лол. Кто тебе сказал? Грамотно написанные программы вне зависимости от локали используют многобайтовые кодировки для внутреннего представления строк. И если у тебя локаль однобайтовая, то они всё равно перекодируют текст, читая его из файла, в многобайтовую кодировку. На всякий случай. Скажем, на примере браузера: с одного сайта он читает cp1251, с другого koi8-r, а третий в какой-то там кодировке, и весь набит греческими буковками... Как можно единообразно работать со всеми этими веб-страничками? Единственный способ -- использовать внутри программы многобайтовое представление текста. И, я полагаю, веб-браузеры делают именно так. Текстовые редакторы делают так -- может не все, но, например, emacs совершенно точно. И, кстати, тебе не захочется работать с текстовым редактором, который так не делает, потому что у него будут серьёзные проблемы с работой с текстами, прочитанными из файлов с разными кодировками.

Короче: расход памяти практически не изменится от перехода на utf-8, потому что внутренняя кодировка приложений и кодировка локали -- это разные вещи. Изменится объём места, который тексты занимают на диске. Но тут опять же всё очень любопытно. Много ли у тебя на диске текстовых файлов содержащих кириллицу? Именно текстовых -- не .odt, а .txt. Я подозреваю, что очень мало. И если что и лежит, то лежит в более интересных форматах, типа .odt, .fb2 и проч. Но ты заглядывал в спецификацию .odt? Я нет, но я практически уверен в том, что там вся кириллица хранится в utf8, вне зависимости от выбранной тобою локали. Но огорчаться рано: содержимое таких файликов как правило пожато всякими там zip'ами, и таким образом их объём оказывается практически независимым от того, какая кодировка выбрана для символов.

Таким образом, даже расход места на диске практически не изменится. И если ты из-за мнимой экономии памяти страдаешь от использования однобайтовых кодировок, то... Ну, в общем, можешь прекращать.

Ответить | Правка | К родителю #82 | Наверх | Cообщить модератору

100. "Шрифты, разработанные для офисного пакета МойОфис, опубликов..."  +/
Сообщение от ммнюмнюмус (?), 20-Ноя-22, 17:28 
> Но огорчаться рано: содержимое таких файликов как правило пожато всякими там zip'ами...

Ещё лучше - odt и есть zip.
Например, у меня xarchiver показывает, что архиватор - "/usr/bin/7z -tzip".

Ответить | Правка | Наверх | Cообщить модератору

101. "Шрифты, разработанные для офисного пакета МойОфис, опубликов..."  +/
Сообщение от ммнюмнюмус (?), 20-Ноя-22, 17:29 
ой... а я некропостер
Ответить | Правка | Наверх | Cообщить модератору

89. "Шрифты, разработанные для офисного пакета МойОфис, опубликов..."  +/
Сообщение от Аноним (-), 23-Дек-16, 01:06 
> В юникоде каждый стринг весит 2 раза больше чем нужно.

А можно вот работать как опеннет. С какой-то псевдографикой на ссылки в вике. Ну и что что ссылка не работает, зато 10 байтов сэкономили.

Ответить | Правка | К родителю #82 | Наверх | Cообщить модератору

94. "Шрифты, разработанные для офисного пакета МойОфис, опубликов..."  +/
Сообщение от ptremail (??), 27-Дек-16, 10:37 
Очевидно, что использоание юникода требует больше памяти. Например, список сообщений в однобайтовой кодировке в моей программе занимает больше 1 килобайта. В юникоде потребовалось бы больше 2 килобайт. Так как программа выполняется на МК, имеющем всего 8 килобайт флеша - это имеет большое значение.
Но если бы эта программа выполнялась на МК хотя бы с мегбайтом памяти, это имело бы малое значение. А на ПК разница вообще только умозрительная. Флеш-реклама на этой странице потребляет памяти на порядки больше, чем мой текст, хоть в юникоде, хоть без него.
Ответить | Правка | К родителю #82 | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру