Виникли проблеми з некоректним відображенням вебсторінки? Замість тексту незрозуміла абракадабра? Скоріше за все автоматично було невірно визначено кодування. Кілька слів про UTF-8, Windows-1251 і KOI8. А ще про те, як виправити помилку й правильно відобразити контент, про розширення «Charset» для браузера Google Chrome, або куди зникли вбудовані опції.
Розповідаю про багатобайтове кодування, unicode і рядкові функції в мові програмування PHP. Чому strllen('Hello World') — Ok, а strllen('Привіт Світ') — не Ok! Про розширення mbstring і налаштування php.ini. А ще даю повний перелік існуючих PHP функцій «mb_» для роботи з мультибайтовим кодуванням. Зверніть увагу, далеко не всі аналоги класичних функцій доступні розробнику.
В попередньому огляді ми розглядали питання багатобайтових кодувань і опрацювання української мови засобами рядкових функцій mbstring в PHP. Я продублював повний список доступних «mb_» функцій і наголосив, що далеко не для всіх вбудованих однобайтових існує аналогічна мультибайтова «mb_» функція. Сьогодні ми напишемо аналог стандартної рядкової функції ucfirst.