Formatting: for a performance boost in remove_accents()
, convert chr()
calls to string literals.
Props gitlost. Fixes #37643. git-svn-id: https://develop.svn.wordpress.org/trunk@38359 602fd350-edb4-49c9-b593-d223f7449a82
This commit is contained in:
parent
62fe5001ba
commit
8a667f3036
@ -1503,222 +1503,222 @@ function remove_accents( $string ) {
|
||||
if (seems_utf8($string)) {
|
||||
$chars = array(
|
||||
// Decompositions for Latin-1 Supplement
|
||||
chr(194).chr(170) => 'a', chr(194).chr(186) => 'o',
|
||||
chr(195).chr(128) => 'A', chr(195).chr(129) => 'A',
|
||||
chr(195).chr(130) => 'A', chr(195).chr(131) => 'A',
|
||||
chr(195).chr(132) => 'A', chr(195).chr(133) => 'A',
|
||||
chr(195).chr(134) => 'AE',chr(195).chr(135) => 'C',
|
||||
chr(195).chr(136) => 'E', chr(195).chr(137) => 'E',
|
||||
chr(195).chr(138) => 'E', chr(195).chr(139) => 'E',
|
||||
chr(195).chr(140) => 'I', chr(195).chr(141) => 'I',
|
||||
chr(195).chr(142) => 'I', chr(195).chr(143) => 'I',
|
||||
chr(195).chr(144) => 'D', chr(195).chr(145) => 'N',
|
||||
chr(195).chr(146) => 'O', chr(195).chr(147) => 'O',
|
||||
chr(195).chr(148) => 'O', chr(195).chr(149) => 'O',
|
||||
chr(195).chr(150) => 'O', chr(195).chr(153) => 'U',
|
||||
chr(195).chr(154) => 'U', chr(195).chr(155) => 'U',
|
||||
chr(195).chr(156) => 'U', chr(195).chr(157) => 'Y',
|
||||
chr(195).chr(158) => 'TH',chr(195).chr(159) => 's',
|
||||
chr(195).chr(160) => 'a', chr(195).chr(161) => 'a',
|
||||
chr(195).chr(162) => 'a', chr(195).chr(163) => 'a',
|
||||
chr(195).chr(164) => 'a', chr(195).chr(165) => 'a',
|
||||
chr(195).chr(166) => 'ae',chr(195).chr(167) => 'c',
|
||||
chr(195).chr(168) => 'e', chr(195).chr(169) => 'e',
|
||||
chr(195).chr(170) => 'e', chr(195).chr(171) => 'e',
|
||||
chr(195).chr(172) => 'i', chr(195).chr(173) => 'i',
|
||||
chr(195).chr(174) => 'i', chr(195).chr(175) => 'i',
|
||||
chr(195).chr(176) => 'd', chr(195).chr(177) => 'n',
|
||||
chr(195).chr(178) => 'o', chr(195).chr(179) => 'o',
|
||||
chr(195).chr(180) => 'o', chr(195).chr(181) => 'o',
|
||||
chr(195).chr(182) => 'o', chr(195).chr(184) => 'o',
|
||||
chr(195).chr(185) => 'u', chr(195).chr(186) => 'u',
|
||||
chr(195).chr(187) => 'u', chr(195).chr(188) => 'u',
|
||||
chr(195).chr(189) => 'y', chr(195).chr(190) => 'th',
|
||||
chr(195).chr(191) => 'y', chr(195).chr(152) => 'O',
|
||||
'ª' => 'a', 'º' => 'o',
|
||||
'À' => 'A', 'Á' => 'A',
|
||||
'Â' => 'A', 'Ã' => 'A',
|
||||
'Ä' => 'A', 'Å' => 'A',
|
||||
'Æ' => 'AE','Ç' => 'C',
|
||||
'È' => 'E', 'É' => 'E',
|
||||
'Ê' => 'E', 'Ë' => 'E',
|
||||
'Ì' => 'I', 'Í' => 'I',
|
||||
'Î' => 'I', 'Ï' => 'I',
|
||||
'Ð' => 'D', 'Ñ' => 'N',
|
||||
'Ò' => 'O', 'Ó' => 'O',
|
||||
'Ô' => 'O', 'Õ' => 'O',
|
||||
'Ö' => 'O', 'Ù' => 'U',
|
||||
'Ú' => 'U', 'Û' => 'U',
|
||||
'Ü' => 'U', 'Ý' => 'Y',
|
||||
'Þ' => 'TH','ß' => 's',
|
||||
'à' => 'a', 'á' => 'a',
|
||||
'â' => 'a', 'ã' => 'a',
|
||||
'ä' => 'a', 'å' => 'a',
|
||||
'æ' => 'ae','ç' => 'c',
|
||||
'è' => 'e', 'é' => 'e',
|
||||
'ê' => 'e', 'ë' => 'e',
|
||||
'ì' => 'i', 'í' => 'i',
|
||||
'î' => 'i', 'ï' => 'i',
|
||||
'ð' => 'd', 'ñ' => 'n',
|
||||
'ò' => 'o', 'ó' => 'o',
|
||||
'ô' => 'o', 'õ' => 'o',
|
||||
'ö' => 'o', 'ø' => 'o',
|
||||
'ù' => 'u', 'ú' => 'u',
|
||||
'û' => 'u', 'ü' => 'u',
|
||||
'ý' => 'y', 'þ' => 'th',
|
||||
'ÿ' => 'y', 'Ø' => 'O',
|
||||
// Decompositions for Latin Extended-A
|
||||
chr(196).chr(128) => 'A', chr(196).chr(129) => 'a',
|
||||
chr(196).chr(130) => 'A', chr(196).chr(131) => 'a',
|
||||
chr(196).chr(132) => 'A', chr(196).chr(133) => 'a',
|
||||
chr(196).chr(134) => 'C', chr(196).chr(135) => 'c',
|
||||
chr(196).chr(136) => 'C', chr(196).chr(137) => 'c',
|
||||
chr(196).chr(138) => 'C', chr(196).chr(139) => 'c',
|
||||
chr(196).chr(140) => 'C', chr(196).chr(141) => 'c',
|
||||
chr(196).chr(142) => 'D', chr(196).chr(143) => 'd',
|
||||
chr(196).chr(144) => 'D', chr(196).chr(145) => 'd',
|
||||
chr(196).chr(146) => 'E', chr(196).chr(147) => 'e',
|
||||
chr(196).chr(148) => 'E', chr(196).chr(149) => 'e',
|
||||
chr(196).chr(150) => 'E', chr(196).chr(151) => 'e',
|
||||
chr(196).chr(152) => 'E', chr(196).chr(153) => 'e',
|
||||
chr(196).chr(154) => 'E', chr(196).chr(155) => 'e',
|
||||
chr(196).chr(156) => 'G', chr(196).chr(157) => 'g',
|
||||
chr(196).chr(158) => 'G', chr(196).chr(159) => 'g',
|
||||
chr(196).chr(160) => 'G', chr(196).chr(161) => 'g',
|
||||
chr(196).chr(162) => 'G', chr(196).chr(163) => 'g',
|
||||
chr(196).chr(164) => 'H', chr(196).chr(165) => 'h',
|
||||
chr(196).chr(166) => 'H', chr(196).chr(167) => 'h',
|
||||
chr(196).chr(168) => 'I', chr(196).chr(169) => 'i',
|
||||
chr(196).chr(170) => 'I', chr(196).chr(171) => 'i',
|
||||
chr(196).chr(172) => 'I', chr(196).chr(173) => 'i',
|
||||
chr(196).chr(174) => 'I', chr(196).chr(175) => 'i',
|
||||
chr(196).chr(176) => 'I', chr(196).chr(177) => 'i',
|
||||
chr(196).chr(178) => 'IJ',chr(196).chr(179) => 'ij',
|
||||
chr(196).chr(180) => 'J', chr(196).chr(181) => 'j',
|
||||
chr(196).chr(182) => 'K', chr(196).chr(183) => 'k',
|
||||
chr(196).chr(184) => 'k', chr(196).chr(185) => 'L',
|
||||
chr(196).chr(186) => 'l', chr(196).chr(187) => 'L',
|
||||
chr(196).chr(188) => 'l', chr(196).chr(189) => 'L',
|
||||
chr(196).chr(190) => 'l', chr(196).chr(191) => 'L',
|
||||
chr(197).chr(128) => 'l', chr(197).chr(129) => 'L',
|
||||
chr(197).chr(130) => 'l', chr(197).chr(131) => 'N',
|
||||
chr(197).chr(132) => 'n', chr(197).chr(133) => 'N',
|
||||
chr(197).chr(134) => 'n', chr(197).chr(135) => 'N',
|
||||
chr(197).chr(136) => 'n', chr(197).chr(137) => 'n',
|
||||
chr(197).chr(138) => 'N', chr(197).chr(139) => 'n',
|
||||
chr(197).chr(140) => 'O', chr(197).chr(141) => 'o',
|
||||
chr(197).chr(142) => 'O', chr(197).chr(143) => 'o',
|
||||
chr(197).chr(144) => 'O', chr(197).chr(145) => 'o',
|
||||
chr(197).chr(146) => 'OE',chr(197).chr(147) => 'oe',
|
||||
chr(197).chr(148) => 'R',chr(197).chr(149) => 'r',
|
||||
chr(197).chr(150) => 'R',chr(197).chr(151) => 'r',
|
||||
chr(197).chr(152) => 'R',chr(197).chr(153) => 'r',
|
||||
chr(197).chr(154) => 'S',chr(197).chr(155) => 's',
|
||||
chr(197).chr(156) => 'S',chr(197).chr(157) => 's',
|
||||
chr(197).chr(158) => 'S',chr(197).chr(159) => 's',
|
||||
chr(197).chr(160) => 'S', chr(197).chr(161) => 's',
|
||||
chr(197).chr(162) => 'T', chr(197).chr(163) => 't',
|
||||
chr(197).chr(164) => 'T', chr(197).chr(165) => 't',
|
||||
chr(197).chr(166) => 'T', chr(197).chr(167) => 't',
|
||||
chr(197).chr(168) => 'U', chr(197).chr(169) => 'u',
|
||||
chr(197).chr(170) => 'U', chr(197).chr(171) => 'u',
|
||||
chr(197).chr(172) => 'U', chr(197).chr(173) => 'u',
|
||||
chr(197).chr(174) => 'U', chr(197).chr(175) => 'u',
|
||||
chr(197).chr(176) => 'U', chr(197).chr(177) => 'u',
|
||||
chr(197).chr(178) => 'U', chr(197).chr(179) => 'u',
|
||||
chr(197).chr(180) => 'W', chr(197).chr(181) => 'w',
|
||||
chr(197).chr(182) => 'Y', chr(197).chr(183) => 'y',
|
||||
chr(197).chr(184) => 'Y', chr(197).chr(185) => 'Z',
|
||||
chr(197).chr(186) => 'z', chr(197).chr(187) => 'Z',
|
||||
chr(197).chr(188) => 'z', chr(197).chr(189) => 'Z',
|
||||
chr(197).chr(190) => 'z', chr(197).chr(191) => 's',
|
||||
'Ā' => 'A', 'ā' => 'a',
|
||||
'Ă' => 'A', 'ă' => 'a',
|
||||
'Ą' => 'A', 'ą' => 'a',
|
||||
'Ć' => 'C', 'ć' => 'c',
|
||||
'Ĉ' => 'C', 'ĉ' => 'c',
|
||||
'Ċ' => 'C', 'ċ' => 'c',
|
||||
'Č' => 'C', 'č' => 'c',
|
||||
'Ď' => 'D', 'ď' => 'd',
|
||||
'Đ' => 'D', 'đ' => 'd',
|
||||
'Ē' => 'E', 'ē' => 'e',
|
||||
'Ĕ' => 'E', 'ĕ' => 'e',
|
||||
'Ė' => 'E', 'ė' => 'e',
|
||||
'Ę' => 'E', 'ę' => 'e',
|
||||
'Ě' => 'E', 'ě' => 'e',
|
||||
'Ĝ' => 'G', 'ĝ' => 'g',
|
||||
'Ğ' => 'G', 'ğ' => 'g',
|
||||
'Ġ' => 'G', 'ġ' => 'g',
|
||||
'Ģ' => 'G', 'ģ' => 'g',
|
||||
'Ĥ' => 'H', 'ĥ' => 'h',
|
||||
'Ħ' => 'H', 'ħ' => 'h',
|
||||
'Ĩ' => 'I', 'ĩ' => 'i',
|
||||
'Ī' => 'I', 'ī' => 'i',
|
||||
'Ĭ' => 'I', 'ĭ' => 'i',
|
||||
'Į' => 'I', 'į' => 'i',
|
||||
'İ' => 'I', 'ı' => 'i',
|
||||
'IJ' => 'IJ','ij' => 'ij',
|
||||
'Ĵ' => 'J', 'ĵ' => 'j',
|
||||
'Ķ' => 'K', 'ķ' => 'k',
|
||||
'ĸ' => 'k', 'Ĺ' => 'L',
|
||||
'ĺ' => 'l', 'Ļ' => 'L',
|
||||
'ļ' => 'l', 'Ľ' => 'L',
|
||||
'ľ' => 'l', 'Ŀ' => 'L',
|
||||
'ŀ' => 'l', 'Ł' => 'L',
|
||||
'ł' => 'l', 'Ń' => 'N',
|
||||
'ń' => 'n', 'Ņ' => 'N',
|
||||
'ņ' => 'n', 'Ň' => 'N',
|
||||
'ň' => 'n', 'ʼn' => 'n',
|
||||
'Ŋ' => 'N', 'ŋ' => 'n',
|
||||
'Ō' => 'O', 'ō' => 'o',
|
||||
'Ŏ' => 'O', 'ŏ' => 'o',
|
||||
'Ő' => 'O', 'ő' => 'o',
|
||||
'Œ' => 'OE','œ' => 'oe',
|
||||
'Ŕ' => 'R','ŕ' => 'r',
|
||||
'Ŗ' => 'R','ŗ' => 'r',
|
||||
'Ř' => 'R','ř' => 'r',
|
||||
'Ś' => 'S','ś' => 's',
|
||||
'Ŝ' => 'S','ŝ' => 's',
|
||||
'Ş' => 'S','ş' => 's',
|
||||
'Š' => 'S', 'š' => 's',
|
||||
'Ţ' => 'T', 'ţ' => 't',
|
||||
'Ť' => 'T', 'ť' => 't',
|
||||
'Ŧ' => 'T', 'ŧ' => 't',
|
||||
'Ũ' => 'U', 'ũ' => 'u',
|
||||
'Ū' => 'U', 'ū' => 'u',
|
||||
'Ŭ' => 'U', 'ŭ' => 'u',
|
||||
'Ů' => 'U', 'ů' => 'u',
|
||||
'Ű' => 'U', 'ű' => 'u',
|
||||
'Ų' => 'U', 'ų' => 'u',
|
||||
'Ŵ' => 'W', 'ŵ' => 'w',
|
||||
'Ŷ' => 'Y', 'ŷ' => 'y',
|
||||
'Ÿ' => 'Y', 'Ź' => 'Z',
|
||||
'ź' => 'z', 'Ż' => 'Z',
|
||||
'ż' => 'z', 'Ž' => 'Z',
|
||||
'ž' => 'z', 'ſ' => 's',
|
||||
// Decompositions for Latin Extended-B
|
||||
chr(200).chr(152) => 'S', chr(200).chr(153) => 's',
|
||||
chr(200).chr(154) => 'T', chr(200).chr(155) => 't',
|
||||
'Ș' => 'S', 'ș' => 's',
|
||||
'Ț' => 'T', 'ț' => 't',
|
||||
// Euro Sign
|
||||
chr(226).chr(130).chr(172) => 'E',
|
||||
'€' => 'E',
|
||||
// GBP (Pound) Sign
|
||||
chr(194).chr(163) => '',
|
||||
'£' => '',
|
||||
// Vowels with diacritic (Vietnamese)
|
||||
// unmarked
|
||||
chr(198).chr(160) => 'O', chr(198).chr(161) => 'o',
|
||||
chr(198).chr(175) => 'U', chr(198).chr(176) => 'u',
|
||||
'Ơ' => 'O', 'ơ' => 'o',
|
||||
'Ư' => 'U', 'ư' => 'u',
|
||||
// grave accent
|
||||
chr(225).chr(186).chr(166) => 'A', chr(225).chr(186).chr(167) => 'a',
|
||||
chr(225).chr(186).chr(176) => 'A', chr(225).chr(186).chr(177) => 'a',
|
||||
chr(225).chr(187).chr(128) => 'E', chr(225).chr(187).chr(129) => 'e',
|
||||
chr(225).chr(187).chr(146) => 'O', chr(225).chr(187).chr(147) => 'o',
|
||||
chr(225).chr(187).chr(156) => 'O', chr(225).chr(187).chr(157) => 'o',
|
||||
chr(225).chr(187).chr(170) => 'U', chr(225).chr(187).chr(171) => 'u',
|
||||
chr(225).chr(187).chr(178) => 'Y', chr(225).chr(187).chr(179) => 'y',
|
||||
'Ầ' => 'A', 'ầ' => 'a',
|
||||
'Ằ' => 'A', 'ằ' => 'a',
|
||||
'Ề' => 'E', 'ề' => 'e',
|
||||
'Ồ' => 'O', 'ồ' => 'o',
|
||||
'Ờ' => 'O', 'ờ' => 'o',
|
||||
'Ừ' => 'U', 'ừ' => 'u',
|
||||
'Ỳ' => 'Y', 'ỳ' => 'y',
|
||||
// hook
|
||||
chr(225).chr(186).chr(162) => 'A', chr(225).chr(186).chr(163) => 'a',
|
||||
chr(225).chr(186).chr(168) => 'A', chr(225).chr(186).chr(169) => 'a',
|
||||
chr(225).chr(186).chr(178) => 'A', chr(225).chr(186).chr(179) => 'a',
|
||||
chr(225).chr(186).chr(186) => 'E', chr(225).chr(186).chr(187) => 'e',
|
||||
chr(225).chr(187).chr(130) => 'E', chr(225).chr(187).chr(131) => 'e',
|
||||
chr(225).chr(187).chr(136) => 'I', chr(225).chr(187).chr(137) => 'i',
|
||||
chr(225).chr(187).chr(142) => 'O', chr(225).chr(187).chr(143) => 'o',
|
||||
chr(225).chr(187).chr(148) => 'O', chr(225).chr(187).chr(149) => 'o',
|
||||
chr(225).chr(187).chr(158) => 'O', chr(225).chr(187).chr(159) => 'o',
|
||||
chr(225).chr(187).chr(166) => 'U', chr(225).chr(187).chr(167) => 'u',
|
||||
chr(225).chr(187).chr(172) => 'U', chr(225).chr(187).chr(173) => 'u',
|
||||
chr(225).chr(187).chr(182) => 'Y', chr(225).chr(187).chr(183) => 'y',
|
||||
'Ả' => 'A', 'ả' => 'a',
|
||||
'Ẩ' => 'A', 'ẩ' => 'a',
|
||||
'Ẳ' => 'A', 'ẳ' => 'a',
|
||||
'Ẻ' => 'E', 'ẻ' => 'e',
|
||||
'Ể' => 'E', 'ể' => 'e',
|
||||
'Ỉ' => 'I', 'ỉ' => 'i',
|
||||
'Ỏ' => 'O', 'ỏ' => 'o',
|
||||
'Ổ' => 'O', 'ổ' => 'o',
|
||||
'Ở' => 'O', 'ở' => 'o',
|
||||
'Ủ' => 'U', 'ủ' => 'u',
|
||||
'Ử' => 'U', 'ử' => 'u',
|
||||
'Ỷ' => 'Y', 'ỷ' => 'y',
|
||||
// tilde
|
||||
chr(225).chr(186).chr(170) => 'A', chr(225).chr(186).chr(171) => 'a',
|
||||
chr(225).chr(186).chr(180) => 'A', chr(225).chr(186).chr(181) => 'a',
|
||||
chr(225).chr(186).chr(188) => 'E', chr(225).chr(186).chr(189) => 'e',
|
||||
chr(225).chr(187).chr(132) => 'E', chr(225).chr(187).chr(133) => 'e',
|
||||
chr(225).chr(187).chr(150) => 'O', chr(225).chr(187).chr(151) => 'o',
|
||||
chr(225).chr(187).chr(160) => 'O', chr(225).chr(187).chr(161) => 'o',
|
||||
chr(225).chr(187).chr(174) => 'U', chr(225).chr(187).chr(175) => 'u',
|
||||
chr(225).chr(187).chr(184) => 'Y', chr(225).chr(187).chr(185) => 'y',
|
||||
'Ẫ' => 'A', 'ẫ' => 'a',
|
||||
'Ẵ' => 'A', 'ẵ' => 'a',
|
||||
'Ẽ' => 'E', 'ẽ' => 'e',
|
||||
'Ễ' => 'E', 'ễ' => 'e',
|
||||
'Ỗ' => 'O', 'ỗ' => 'o',
|
||||
'Ỡ' => 'O', 'ỡ' => 'o',
|
||||
'Ữ' => 'U', 'ữ' => 'u',
|
||||
'Ỹ' => 'Y', 'ỹ' => 'y',
|
||||
// acute accent
|
||||
chr(225).chr(186).chr(164) => 'A', chr(225).chr(186).chr(165) => 'a',
|
||||
chr(225).chr(186).chr(174) => 'A', chr(225).chr(186).chr(175) => 'a',
|
||||
chr(225).chr(186).chr(190) => 'E', chr(225).chr(186).chr(191) => 'e',
|
||||
chr(225).chr(187).chr(144) => 'O', chr(225).chr(187).chr(145) => 'o',
|
||||
chr(225).chr(187).chr(154) => 'O', chr(225).chr(187).chr(155) => 'o',
|
||||
chr(225).chr(187).chr(168) => 'U', chr(225).chr(187).chr(169) => 'u',
|
||||
'Ấ' => 'A', 'ấ' => 'a',
|
||||
'Ắ' => 'A', 'ắ' => 'a',
|
||||
'Ế' => 'E', 'ế' => 'e',
|
||||
'Ố' => 'O', 'ố' => 'o',
|
||||
'Ớ' => 'O', 'ớ' => 'o',
|
||||
'Ứ' => 'U', 'ứ' => 'u',
|
||||
// dot below
|
||||
chr(225).chr(186).chr(160) => 'A', chr(225).chr(186).chr(161) => 'a',
|
||||
chr(225).chr(186).chr(172) => 'A', chr(225).chr(186).chr(173) => 'a',
|
||||
chr(225).chr(186).chr(182) => 'A', chr(225).chr(186).chr(183) => 'a',
|
||||
chr(225).chr(186).chr(184) => 'E', chr(225).chr(186).chr(185) => 'e',
|
||||
chr(225).chr(187).chr(134) => 'E', chr(225).chr(187).chr(135) => 'e',
|
||||
chr(225).chr(187).chr(138) => 'I', chr(225).chr(187).chr(139) => 'i',
|
||||
chr(225).chr(187).chr(140) => 'O', chr(225).chr(187).chr(141) => 'o',
|
||||
chr(225).chr(187).chr(152) => 'O', chr(225).chr(187).chr(153) => 'o',
|
||||
chr(225).chr(187).chr(162) => 'O', chr(225).chr(187).chr(163) => 'o',
|
||||
chr(225).chr(187).chr(164) => 'U', chr(225).chr(187).chr(165) => 'u',
|
||||
chr(225).chr(187).chr(176) => 'U', chr(225).chr(187).chr(177) => 'u',
|
||||
chr(225).chr(187).chr(180) => 'Y', chr(225).chr(187).chr(181) => 'y',
|
||||
'Ạ' => 'A', 'ạ' => 'a',
|
||||
'Ậ' => 'A', 'ậ' => 'a',
|
||||
'Ặ' => 'A', 'ặ' => 'a',
|
||||
'Ẹ' => 'E', 'ẹ' => 'e',
|
||||
'Ệ' => 'E', 'ệ' => 'e',
|
||||
'Ị' => 'I', 'ị' => 'i',
|
||||
'Ọ' => 'O', 'ọ' => 'o',
|
||||
'Ộ' => 'O', 'ộ' => 'o',
|
||||
'Ợ' => 'O', 'ợ' => 'o',
|
||||
'Ụ' => 'U', 'ụ' => 'u',
|
||||
'Ự' => 'U', 'ự' => 'u',
|
||||
'Ỵ' => 'Y', 'ỵ' => 'y',
|
||||
// Vowels with diacritic (Chinese, Hanyu Pinyin)
|
||||
chr(201).chr(145) => 'a',
|
||||
'ɑ' => 'a',
|
||||
// macron
|
||||
chr(199).chr(149) => 'U', chr(199).chr(150) => 'u',
|
||||
'Ǖ' => 'U', 'ǖ' => 'u',
|
||||
// acute accent
|
||||
chr(199).chr(151) => 'U', chr(199).chr(152) => 'u',
|
||||
'Ǘ' => 'U', 'ǘ' => 'u',
|
||||
// caron
|
||||
chr(199).chr(141) => 'A', chr(199).chr(142) => 'a',
|
||||
chr(199).chr(143) => 'I', chr(199).chr(144) => 'i',
|
||||
chr(199).chr(145) => 'O', chr(199).chr(146) => 'o',
|
||||
chr(199).chr(147) => 'U', chr(199).chr(148) => 'u',
|
||||
chr(199).chr(153) => 'U', chr(199).chr(154) => 'u',
|
||||
'Ǎ' => 'A', 'ǎ' => 'a',
|
||||
'Ǐ' => 'I', 'ǐ' => 'i',
|
||||
'Ǒ' => 'O', 'ǒ' => 'o',
|
||||
'Ǔ' => 'U', 'ǔ' => 'u',
|
||||
'Ǚ' => 'U', 'ǚ' => 'u',
|
||||
// grave accent
|
||||
chr(199).chr(155) => 'U', chr(199).chr(156) => 'u',
|
||||
'Ǜ' => 'U', 'ǜ' => 'u',
|
||||
);
|
||||
|
||||
// Used for locale-specific rules
|
||||
$locale = get_locale();
|
||||
|
||||
if ( 'de_DE' == $locale || 'de_DE_formal' == $locale || 'de_CH' == $locale || 'de_CH_informal' == $locale ) {
|
||||
$chars[ chr(195).chr(132) ] = 'Ae';
|
||||
$chars[ chr(195).chr(164) ] = 'ae';
|
||||
$chars[ chr(195).chr(150) ] = 'Oe';
|
||||
$chars[ chr(195).chr(182) ] = 'oe';
|
||||
$chars[ chr(195).chr(156) ] = 'Ue';
|
||||
$chars[ chr(195).chr(188) ] = 'ue';
|
||||
$chars[ chr(195).chr(159) ] = 'ss';
|
||||
$chars[ 'Ä' ] = 'Ae';
|
||||
$chars[ 'ä' ] = 'ae';
|
||||
$chars[ 'Ö' ] = 'Oe';
|
||||
$chars[ 'ö' ] = 'oe';
|
||||
$chars[ 'Ü' ] = 'Ue';
|
||||
$chars[ 'ü' ] = 'ue';
|
||||
$chars[ 'ß' ] = 'ss';
|
||||
} elseif ( 'da_DK' === $locale ) {
|
||||
$chars[ chr(195).chr(134) ] = 'Ae';
|
||||
$chars[ chr(195).chr(166) ] = 'ae';
|
||||
$chars[ chr(195).chr(152) ] = 'Oe';
|
||||
$chars[ chr(195).chr(184) ] = 'oe';
|
||||
$chars[ chr(195).chr(133) ] = 'Aa';
|
||||
$chars[ chr(195).chr(165) ] = 'aa';
|
||||
$chars[ 'Æ' ] = 'Ae';
|
||||
$chars[ 'æ' ] = 'ae';
|
||||
$chars[ 'Ø' ] = 'Oe';
|
||||
$chars[ 'ø' ] = 'oe';
|
||||
$chars[ 'Å' ] = 'Aa';
|
||||
$chars[ 'å' ] = 'aa';
|
||||
} elseif ( 'ca' === $locale ) {
|
||||
$chars[ chr(108).chr(194).chr(183).chr(108) ] = 'll';
|
||||
$chars[ 'l·l' ] = 'll';
|
||||
}
|
||||
|
||||
$string = strtr($string, $chars);
|
||||
} else {
|
||||
$chars = array();
|
||||
// Assume ISO-8859-1 if not UTF-8
|
||||
$chars['in'] = chr(128).chr(131).chr(138).chr(142).chr(154).chr(158)
|
||||
.chr(159).chr(162).chr(165).chr(181).chr(192).chr(193).chr(194)
|
||||
.chr(195).chr(196).chr(197).chr(199).chr(200).chr(201).chr(202)
|
||||
.chr(203).chr(204).chr(205).chr(206).chr(207).chr(209).chr(210)
|
||||
.chr(211).chr(212).chr(213).chr(214).chr(216).chr(217).chr(218)
|
||||
.chr(219).chr(220).chr(221).chr(224).chr(225).chr(226).chr(227)
|
||||
.chr(228).chr(229).chr(231).chr(232).chr(233).chr(234).chr(235)
|
||||
.chr(236).chr(237).chr(238).chr(239).chr(241).chr(242).chr(243)
|
||||
.chr(244).chr(245).chr(246).chr(248).chr(249).chr(250).chr(251)
|
||||
.chr(252).chr(253).chr(255);
|
||||
$chars['in'] = "\x80\x83\x8a\x8e\x9a\x9e"
|
||||
."\x9f\xa2\xa5\xb5\xc0\xc1\xc2"
|
||||
."\xc3\xc4\xc5\xc7\xc8\xc9\xca"
|
||||
."\xcb\xcc\xcd\xce\xcf\xd1\xd2"
|
||||
."\xd3\xd4\xd5\xd6\xd8\xd9\xda"
|
||||
."\xdb\xdc\xdd\xe0\xe1\xe2\xe3"
|
||||
."\xe4\xe5\xe7\xe8\xe9\xea\xeb"
|
||||
."\xec\xed\xee\xef\xf1\xf2\xf3"
|
||||
."\xf4\xf5\xf6\xf8\xf9\xfa\xfb"
|
||||
."\xfc\xfd\xff";
|
||||
|
||||
$chars['out'] = "EfSZszYcYuAAAAAACEEEEIIIINOOOOOOUUUUYaaaaaaceeeeiiiinoooooouuuuyy";
|
||||
|
||||
$string = strtr($string, $chars['in'], $chars['out']);
|
||||
$double_chars = array();
|
||||
$double_chars['in'] = array(chr(140), chr(156), chr(198), chr(208), chr(222), chr(223), chr(230), chr(240), chr(254));
|
||||
$double_chars['in'] = array("\x8c", "\x9c", "\xc6", "\xd0", "\xde", "\xdf", "\xe6", "\xf0", "\xfe");
|
||||
$double_chars['out'] = array('OE', 'oe', 'AE', 'DH', 'TH', 'ss', 'ae', 'dh', 'th');
|
||||
$string = str_replace($double_chars['in'], $double_chars['out'], $string);
|
||||
}
|
||||
|
Loading…
Reference in New Issue
Block a user