форум vBSupport.ru > vBulletin > All versions of vBulletin
  • »
VBsupport перешел с домена .ORG на родной .RU Ура! Пожалуйста, обновите свои закладки - VBsupport.ru
 
 
 
 
liner
Эксперт
 
liner's Avatar
Default Смена кодировки форума cp1251 -> UTF8
1

Вопрос "за поговорить".
Смысл смены кодировки cp на UTF?
В поиске шквал тем, но все , в основном, за конкретику: как, где.

Интересуют ответы на принципиально-теоретические вопросы:
1. какая мотивация смены кодировки? От чего уходим и что получим из благостей?
2. чем плох cp по сравнению с UTF
3. какие проблемы при перекодировке
4. что ожидать от работоспособности возросшей БД?
5. нафиг это надо, с сущности? В двух словах.

и т.д.

Спасибо.

Last edited by liner : 11-03-2012 at 11:55 AM.
Bot
Yandex Bot Yandex Bot is online now
 
Join Date: 05.05.2005
Реклама на форуме А что у нас тут интересного? =)
 
 
kerk
k0t
 
kerk's Avatar
Default
2

0. если в конце концов все перейдут на унифицированную кодировку, то программерам будет легче писать код, не нужно будет ставить стопицот костылей в своем коде при работе со строковыми данными
в основном с этим сталкиваются кодеры, которые пишут код для узеров использующих НЕ только латинский набор символов, сейчас я говорю только о кириллице в CP1251 которая ВСЕГДА приходит краказяблами если запрос отправляется аяксом
приходится писать костыль:
определение текущей кодировки
если она отличается от UTF-8, конвертирование в UTF-8 и обратно (js => php / php => js)
1. меньше гемороя со скриптами и в последствии написания каких то специфических скриптов, специально под проект и без костылей (кодеру - меньше кода, заказчику - дешевле)
2. ничем, это две разные кодировки, каждая годится для своего случая
3. трудно сказать однозначно, не попробуешь - не узнаешь
4. см. п.3
 
 
liner
Эксперт
 
liner's Avatar
Default
0

Quote:
Originally Posted by kerk View Post
каждая годится для своего случая
например?
 
 
kerk
k0t
 
kerk's Avatar
Default
2

например если это местечковый проект, "аля" дворовый форум куда заходят только знакомые поцоны или где вообще не предусмотрено никаких "иноземцев"
если же это серьезный проект, к которому прицеплена куча внешних сервисов, где обитатели - не только носители "великого и могучего"...
 
 
madbadjack
Эксперт
 
madbadjack's Avatar
Default
0

Добавлю - нужен прямой мост - другой движок - вобля, лучше что бы БД было общим, а сейчас почти все двиги предполагают UTF. Я поленился менять кодировку форума, поэтому нормального моста не получилось, сейчас вот, благодаря одному хорошему человеку, реализую просто вывод последних тем.
 
 
Кот Бегемот
Мартовский Кот
 
Кот Бегемот's Avatar
Default
0

Quote:
Originally Posted by liner View Post
Смысл смены кодировки cp на UTF?
Чтобы можно было делать ники типа ??Winner??.
 
 
liner
Эксперт
 
liner's Avatar
Default
0

Winner,
такой ник - проблема для хака [DB Tech] User Tagging
 
 
SMak044
Эксперт
 
SMak044's Avatar
Default
1

Как и сказал kerk, это в основном упрощение кодинга. Но в то же время, даже для работы кода для ср и ютф необходимо сейчас использовать разные функции и применять разные параметры регекспа, что увеличивает код минимум в 1. раза и добавляет кучу ифов, что естественно не делает код лучше.
http://ru.wikipedia.org/wiki/%D0%AE%...BA%D0%BE%D0%B4
Мне понравилась статья, отвечает на многие вопросы, в частности на те, что ты задал.
 
 
Luvilla
Гость
Default

Quote:
Originally Posted by Winner View Post
Чтобы можно было делать ники типа ??Winner??.
я знаю пару форумов на 1251, там блондинки умудряются ещё и не такие символы пихать, причём в заголовок темы
и всё шикарно... кроме тех моментов, когда на мыло приходит уведомление об ответе или жалобе
 
 
Luntick
На доске почёта
Прощаемся
 
banned nax
Default
0

Никогда не было на моих форумах СР1251. С самого начала выбор пал на UTF-8. Поэтому напишу о том, что определило мой выбор.

Первое что насторожило меня в СР, это то, что есть проблемы при переезде - русские буквы на новом хостинге исчезают, а на их месте появляются крякозябры или вопросики.
Второе, то, что при переключении языка на английский русские буквы отображаются крякозябрами., попросту функция смены языка на форуме не работает.
Третье, это, то что при просмотре базы в ПМА русских букв нет, а в место них крякозябры.

Из перечисленного выше не было проблем с UTF-8. Таким образом, выбрав UTF-8 решил посмотреть, что пишут про эту кодировку. В частности, отмечали, что поиск на форуме в UTF-8 качественнее, чем в СР. Объём базы не прямо пропорционален размеру текста, если брать суммарный объём базы, то он будет мало отличаться в зависимости от кодировки базы.

Были проблемы с установкой форума в кодировке UTF-8. На локальном хосте проблемы с Денвером, а у хостера проблемы с тем, что на российских хостингах базы находились по у молчанию в кодировке СР1251. Эти проблемы решил тем, что вначале обновил ПХП на Денвере, а потом и вовсе отказался от него, также нашёл хостинг, на котором кодировка базы не была установлена по умолчанию. Ради истины отмечу, что проблемы с установкой были связаны, отчасти, с отсутствием опыта.
 

Tags
cp1251, utf, кодировка, перекодировка, смена кодировки


Posting Rules
You may not post new threads
You may not post replies
You may not post attachments
You may not edit your posts

BB code is On
Smilies are On
[IMG] code is On
HTML code is Off




All times are GMT +4. The time now is 07:16 AM.


Powered by vBulletin® Version 3.0.4
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Loading...