VBsupport перешел с домена .ORG на родной .RU
Ура!
Пожалуйста, обновите свои закладки - VBsupport.ru
Блок РКН снят, форум доступен на всей территории России, включая новые терртории, без VPN
На форуме введена премодерация ВСЕХ новых пользователей
Почта с временных сервисов, типа mailinator.com, gawab.com и/или прочих, которые предоставляют временный почтовый ящик без регистрации и/или почтовый ящик для рассылки спама, отслеживается и блокируется, а так же заносится в спам-блок форума, аккаунты удаляются
Если вы хотите приобрести какой то скрипт/продукт/хак из каталогов перечисленных ниже: Каталог модулей/хаков
Ещё раз обращаем Ваше внимание: всё, что Вы скачиваете и устанавливаете на свой форум, Вы устанавливаете исключительно на свой страх и риск.
Сообщество vBSupport'а физически не в состоянии проверять все стили, хаки и нули, выкладываемые пользователями.
Помните: безопасность Вашего проекта - Ваша забота. Убедительная просьба: при обнаружении уязвимостей или сомнительных кодов обязательно отписывайтесь в теме хака/стиля
Спасибо за понимание
Старый форум phpBB 2.0.22 в кодировке cp1251 конвертируется без проблем в VB 4.0.4 Patch Level 1, если в VB использовать ту же cp1251. Но, чтобы два раза не вставать, хочу уже сейчас перевести форум на utf8. И тут возникают проблемы. При первых попытках конвертации кириллические символы просто не попадали в базу данных VB, вместо них было пустое место в сообщениях, а кириллические имена пользователей заменялись на "Imported". После экспериментов с содержимым ImpExConfig.php и некоторых других манипуляций удалось добиться того, что вместо пустоты в базе данных появились кракозябры. Это, безусловно, победа )) , но для полного удовлетворения ее недостаточно )) Не могли бы благородные доны подсказать, в какую сторону мне двигаться, чтобы добиться корректного импорта старой базы с одновременной сменой кодировки?
P.S. На всякий случай, еще раз уточню, что проблемы возникают именно в процессе импорта, т.е. кракозябры попадают в базу данных.
P.P.S Все настройки новой базы данных выставлены в utf8, никаких намеков на другие кодировки в новой БД нет.
aenigmatista, попробуйте, как вариант, восстановить в cp1251. А потом скриптом sypex.net импортировать принудительно в utf-8. (forced->utf-8).
С какой целью конвертировать хотите? = )
@aenigmatista
Простоузер
Join Date: Jun 2010
Posts: 42
Версия vB: 4.1.8
Reputation:
Novice 5
Репутация в разделе: 5
0
Quote:
Originally Posted by OldEr
попробуйте, как вариант, восстановить в cp1251. А потом скриптом sypex.net импортировать принудительно в utf-8. (forced->utf-8)
Этот вариант я тоже рассматривал, но мне кажется, что в моем случае более логично будет попытаться "добить" вариант с Импексом (для чего-то же там есть возможность указать кодировки базы-источника и целевой базы). Я уже поэкспериментировал с настройками его конфига, но вменяемого результата не добился. Настроек там много )) И наобум их все перебирать как-то не хочется. Вот и решил задать вопрос сообществу - может, кто-то в курсе, как мне добиться правильного результата.
Quote:
Originally Posted by OldEr
С какой целью конвертировать хотите?
Из опасения, что в будущем кодировка форума utf8 может стать, пусть и маленьким, но конкурентным преимуществом. Возможно, для многих это смешная причина, но для меня это весьма веский аргумент для того, чтобы сейчас потратить лишнее время на решение проблемы. Конечно, можно сейчас оставить в ср1251, а потом, когда припрет, переконвертировать базу. Но ведь в этом случае придется конвертировать и заново перепроверять работу многочисленных хаков и модов, которыми форум успеет обрасти за это время. Такая перспектива не особо радует ))
OldEr
Специалист
Join Date: Jun 2007
Награды в конкурсах:
Posts: 4,731
Версия vB: 3.8.x
Пол:
Reputation:
Мастер 4230
Репутация в разделе: 2624
0
Quote:
Originally Posted by aenigmatista
Этот вариант я тоже рассматривал, но мне кажется, что в моем случае более логично будет попытаться "добить" вариант с Импексом (для чего-то же там есть возможность указать кодировки базы-источника и целевой базы). Я уже поэкспериментировал с настройками его конфига, но вменяемого результата не добился. Настроек там много )) И наобум их все перебирать как-то не хочется. Вот и решил задать вопрос сообществу - может, кто-то в курсе, как мне добиться правильного результата.
А вы попробуйте. = )
Quote:
Originally Posted by aenigmatista
Из опасения, что в будущем кодировка форума utf8 может стать, пусть и маленьким, но конкурентным преимуществом. Возможно, для многих это смешная причина, но для меня это весьма веский аргумент для того, чтобы сейчас потратить лишнее время на решение проблемы. Конечно, можно сейчас оставить в ср1251, а потом, когда припрет, переконвертировать базу. Но ведь в этом случае придется конвертировать и заново перепроверять работу многочисленных хаков и модов, которыми форум успеет обрасти за это время. Такая перспектива не особо радует ))
А в чем, собственно, преимущество?)
@aenigmatista
Простоузер
Join Date: Jun 2010
Posts: 42
Версия vB: 4.1.8
Reputation:
Novice 5
Репутация в разделе: 5
0
Quote:
Originally Posted by OldEr
А вы попробуйте
Я не совсем Вас понял.Разъясните, пожалуйста. Либо Вы точно знаете, что моя проблема (импорт с одновременной перекодировкой) Импексом не решается и предлагаете перейти к плану "Б" (sypex.net). Либо Вам неизвестны методы заставить Импекс произвести подобный импорт.
В первом случае, действительно, мне имеет смысл перейти к плану "Б". Во втором, логичнее будет попробовать "добить" Импекс.
AleX
Гость
Posts: n/a
Quote:
Originally Posted by aenigmatista
Из опасения, что в будущем кодировка форума utf8 может стать, пусть и маленьким, но конкурентным преимуществом.
Только в фантазиях. cp1251 как использовали, так и будут использовать. А utf8 всегда будет на шаг позади. Да хоть из-за того, что с ней проблем больше.
kerk
k0t
Join Date: May 2005
Location: localhost
Posts: 28,844
Версия vB: 3.8.x
Пол:
Reputation:
Гуру 20333
Репутация в разделе: 8468
0
Quote:
Originally Posted by AleX
А utf8 всегда будет на шаг позади. Да хоть из-за того, что с ней проблем больше.
да ладно =)
нет проблем ни с виндовской ни с утф...
у каждого свои потребности
если форум только русскоязычный, разумнее поставить cp1251
а если там народ из разных стран, то тут без UTF-8 не обойдешься
@aenigmatista
Простоузер
Join Date: Jun 2010
Posts: 42
Версия vB: 4.1.8
Reputation:
Novice 5
Репутация в разделе: 5
0
Quote:
Originally Posted by kerk
если форум только русскоязычный, разумнее поставить cp1251 а если там народ из разных стран, то тут без UTF-8 не обойдешься
Народ русскоязычный, но из разных стран )) Если не секрет, в чем преимущество ср1251 по сравнению с utf8 в случае с русскоязычной аудиторией? Только экономия трафика из-за однобайтной модели? Или еще что-то есть?
Про конкурентные преимущества, ну, не знаю... UTF-8, вроде, все чаще в разных системах используется как основа, а для функционирования ср1251 в этих системах костыли необходимы. Но тут я не досконально разбирался - ознакомился с мнениями специалистов. Но это больше про будущее. Что касается настоящего, то тоже при желании можно найти к чему придраться. Ну, например, захочет юзер копипастнуть что-то (содержащее спецсимволы) из другого форума. И, насколько я понимаю (правда, не проверял), обломается именно в части этих спецсимволов. Чем не конкурентное преимущество? ))
Удалось побороть проблему? Весь вечер промучался, так и не переборол эти "крякозябры" :(
Весь вечер промучился, так ни чего и не получилось.
Старая база в кодировке utf8, булка по умолчанию создает в latin1. Пробовал перед импортом поменять кодировку БД на utf8. Пробовал в конфиге перед инсталяцией прописывать utf8... Все безрезультатно.
Есть способы справиться с этими кодировками?
kerk
k0t
Join Date: May 2005
Location: localhost
Posts: 28,844
Версия vB: 3.8.x
Пол:
Reputation:
Гуру 20333
Репутация в разделе: 8468
1
БД создавать нужно изначально в той кодировке, в которой потом будут данные храниться
**тут был скрин, он умер**
так же, нужно смотреть на параметр "Сопоставление соединения с MySQL"
если БД уже создана (не с той кодировкой, что нужна)
**тут был скрин, он умер**
тогда и все новые таблицы будут создаваться в нужной кодировке