PHP.mk документација
Резимеа на поддржани кодовирања
Почист и полокален преглед на PHP референцата, со задржана структура од PHP.net и подобра читливост за примери, секции и белешки.
Патека
mbstring.encodings.php
Локална патека за оваа страница.
Извор
php.net/manual/en
Оригиналниот HTML се реупотребува и локално се стилизира.
Режим
Прокси + превод во позадина
Кодовите, табелите и белешките остануваат читливи во истиот тек.
Референца
mbstring.encodings.php
Резимеа на поддржани кодовирања
Референца за `mbstring.encodings.php` со подобрена типографија и навигација.
Резимеа на поддржани кодовирања
| Име во регистарот на IANA за множество знаци | Основно множество знаци | = NULL | Дополнителна забелешка |
|---|---|---|---|
| ISO-10646-UCS-4 | ISO 10646 | Универзално множество знаци со 31-битен простор на кодови, стандардизирано како UCS-4 од ISO/IEC 10646. Се одржува синхронизирано со најновата верзија на мапата на кодови на Unicode. | Ако ова име се користи во објектот за конверзија на кодирање, конверторот се обидува да го идентификува со претходниот BOM (маркер за редослед на бајти) во кој крај на бајтите се претставени следните бајти. |
| ISO-10646-UCS-4 | UCS-4 | Види погоре. |
За разлика од UCS-4, низите секогаш се претпоставуваат дека се во биг ендијан форма.
|
| ISO-10646-UCS-4 | UCS-4 | Види погоре. |
За разлика од UCS-4, низите секогаш се претпоставуваат дека се во литл ендијан форма.
|
| ISO-10646-UCS-2 | UCS-2 | Универзално множество знаци со 16-битен простор на кодови, стандардизирано како UCS-2 од ISO/IEC 10646. Се одржува синхронизирано со најновата верзија на мапата на кодови на Unicode. | Ако ова име се користи во објектот за конверзија на кодирање, конверторот се обидува да го идентификува со претходниот BOM (маркер за редослед на бајти) во кој крај на бајтите се претставени следните бајти. |
| ISO-10646-UCS-2 | UCS-2 | Види погоре. |
За разлика од UCS-2, низите секогаш се претпоставуваат дека се во биг ендијан форма.
|
| ISO-10646-UCS-2 | UCS-2 | Види погоре. |
За разлика од UCS-2, низите секогаш се претпоставуваат дека се во литл ендијан форма.
|
| UTF-32 | Unicode | Unicode формат за трансформација со 32-битна ширина на единица, чиј простор за кодирање се однесува на стандардот на множеството кодови на Unicode. Оваа шема за кодирање не беше идентична со UCS-4 бидејќи просторот на кодови на Unicode беше ограничен на 21-битна вредност. | Ако ова име се користи во објектот за конверзија на кодирање, конверторот се обидува да го идентификува со претходниот BOM (маркер за редослед на бајти) во кој крај на бајтите се претставени следните бајти. |
| UTF-32BE | Unicode | Види погоре |
За разлика од UTF-32, низите секогаш се претпоставуваат дека се во биг ендијан форма.
|
| UTF-32LE | Unicode | Види погоре |
За разлика од UTF-32, низите секогаш се претпоставуваат дека се во литл ендијан форма.
|
| UTF-16 | Unicode | Unicode формат за трансформација со 16-битна ширина на единица. Вреди да се напомене дека UTF-16 веќе не е иста спецификација како UCS-2 бидејќи механизмот за сурогат е воведен од Unicode 2.0 и UTF-16 сега се однесува на 21-битен простор на кодови. | Ако ова име се користи во објектот за конверзија на кодирање, конверторот се обидува да го идентификува со претходниот BOM (маркер за редослед на бајти) во кој крај на бајтите се претставени следните бајти. |
| UTF-16BE | Unicode | Види погоре. |
За разлика од UTF-16, низите секогаш се претпоставуваат дека се во биг ендијан форма.
|
| UTF-16LE | Unicode | Види погоре. |
За разлика од UTF-16, низите секогаш се претпоставуваат дека се во литл ендијан форма.
|
| UTF-8 | Unicode / UCS | Unicode формат за трансформација со 8-битна ширина на единица. | none |
| UTF-7 | Unicode | Формат за трансформација на Unicode безбеден за пошта, специфициран во » RFC2152. | none |
| (ништо) | Unicode | Варијанта на UTF-7 која е специјализирана за употреба во » IMAP протокол. | none |
| US-ASCII (претпочитано MIME име) / iso-ir-6 / ANSI_X3.4-1986 / ISO_646.irv:1991 / ASCII / ISO646-US / us / IBM367 / CP367 / csASCII | ASCII / ISO 646 | American Standard Code for Information Interchange е често користен 7-битен кодер. Исто така стандардизиран како меѓународен стандард, ISO 646. | (ништо) |
| EUC-JP (претпочитано MIME име) / Extended_UNIX_Code_Packed_Format_for_Japanese / csEUCPkdFmtJapanese | Составен од US-ASCII / JIS X0201:1997 (hankaku kana дел) / JIS X0208:1990 / JIS X0212:1990 | Како што гледате името е изведено од кратенка на Extended UNIX Code Packed Format for Japanese, овој кодер најчесто се користи на UNIX или слични платформи. Оригиналната шема на кодирање, Extended UNIX Code, е дизајнирана врз основа на ISO 2022. | Множеството знаци на кое се однесува EUC-JP е различно од IBM932 / CP932, кои се користат од OS/2® и Microsoft® Windows®. За размена на информации со тие платформи, користете EUCJP-WIN наместо тоа. |
| Shift_JIS (претпочитано MIME име) / MS_Kanji / csShift_JIS | Составен од JIS X0201:1997 / JIS X0208:1997 | Shift_JIS беше развиен во раните 80-ти, во време кога личните јапонски процесори за текст беа пуштени на пазарот, со цел да се одржи компатибилност со наследената шема на кодирање JIS X 0201:1976. Според дефиницијата на IANA, кодот на Shift_JIS е малку различен од IBM932 / CP932. Сепак, имињата "SJIS" / "Shift_JIS" често погрешно се користат за да се однесуваат на овие кодови. | За CP932 кодна карта, користете SJIS-WIN наместо тоа. |
| (ништо) | Составен од JIS X0201:1997 / JIS X0208:1997 / IBM екстензии / NEC екстензии | Иако овој "кодер" користи иста шема на кодирање како EUC-JP, основниот сет на знаци е различен. Тоа е, некои точки на кодот се мапираат на различни знаци од EUC-JP. | none |
| Windows-31J / csWindows31J | Составен од JIS X0201:1997 / JIS X0208:1997 / IBM екстензии / NEC екстензии | Иако овој "кодер" користи иста шема на кодирање како Shift_JIS, основниот сет на знаци е различен. Тоа значи дека некои точки на кодот се мапираат на различни знаци од Shift_JIS. | (ништо) |
| ISO-2022-JP (претпочитано MIME име) / csISO2022JP | US-ASCII / JIS X0201:1976 / JIS X0208:1978 / JIS X0208:1983 | » RFC1468 | (ништо) |
| JIS | |||
| ISO-8859-1 | |||
| ISO-8859-2 | |||
| ISO-8859-3 | |||
| ISO-8859-4 | |||
| ISO-8859-5 | |||
| ISO-8859-6 | |||
| ISO-8859-7 | |||
| ISO-8859-8 | |||
| ISO-8859-9 | |||
| ISO-8859-10 | |||
| ISO-8859-13 | |||
| ISO-8859-14 | |||
| ISO-8859-15 | |||
| ISO-8859-16 | |||
| byte2be | |||
| byte2le | |||
| byte4be | |||
| byte4le | |||
| BASE64 | |||
| HTML-ENTITIES | |||
| 7бита | |||
| 8бита | |||
| EUC-CN | |||
| CP936 | |||
| HZ | |||
| EUC-TW | |||
| CP950 | |||
| BIG-5 | |||
| EUC-KR | |||
| UHC (CP949) | |||
| ISO-2022-KR | |||
| Windows-1251 (CP1251) | |||
| Windows-1252 (CP1252) | |||
| CP866 (IBM866) | |||
| KOI8-R | |||
| KOI8-U |
Белешки од корисници
Нема белешки од корисници за оваа страница.