웹 메일이나 웹페이지에서 다국어 문자셋을 지원하기 위해서는 코드페이지와 문자셋의 설정이 중요합니다. PHP의 경우 다국어를 인코딩/디코딩하기 위해서는 몇개의 인코딩 라이브러리가 기본적으로 제공되지만 asp 코드로 웹페이지를 작성하거나 웹메일을 만드는 경우 이를 디코딩하려면 코드페이지와 문자셋의 제대로 된 사용이 매우 중요합니다.
특히 웹메일 상에서 문자셋 인코딩 방식이 다르면 메일이 깨지게 되므로 올바른 문자셋 선택은 매우 중요합니다.
구분 | Charset | CodePage |
한국어 | ks_c_5601-1987 | 949 |
IBM EBCDIC(미국-캐나다) | IBM037 | 37 |
OEM 미국 | IBM437 | 437 |
IBM EBCDIC(국제) | IBM500 | 500 |
아랍어(ASMO 708) | ASMO-708 | 708 |
아랍어(DOS) | DOS-720 | 720 |
그리스어(DOS) | ibm737 | 737 |
발트어(DOS) | ibm775 | 775 |
서유럽어(DOS) | ibm850 | 850 |
중앙 유럽어(DOS) | ibm852 | 852 |
OEM 키릴 자모 | IBM855 | 855 |
터키어(DOS) | ibm857 | 857 |
OEM 다국 라틴 문자 I | IBM00858 | 858 |
포르투갈어(DOS) | IBM860 | 860 |
아이슬란드어(DOS) | ibm861 | 861 |
히브리어(DOS) | DOS-862 | 862 |
프랑스어(캐나다)(DOS) | IBM863 | 863 |
아랍어(864) | IBM864 | 864 |
북유럽어(DOS) | IBM865 | 865 |
키릴 자모(DOS) | cp866 | 866 |
현대 그리스어(DOS) | ibm869 | 869 |
IBM EBCDIC(다국 라틴 문자-2) | IBM870 | 870 |
태국어(Windows) | windows-874 | 874 |
IBM EBCDIC(현대 그리스어) | cp875 | 875 |
일본어(Shift-JIS) | iso-2022-jp | 932 |
중국어 간체(GB2312) | gb2312 | 936 |
한국어 | ks_c_5601-1987 | 949 |
중국어 번체(Big5) | big5 | 950 |
IBM EBCDIC(터키어 라틴 문자-5) | IBM1026 | 1026 |
IBM 라틴어-1 | IBM01047 | 1047 |
IBM EBCDIC(미국-캐나다-유럽) | IBM01140 | 1140 |
IBM EBCDIC(독일-유럽) | IBM01141 | 1141 |
IBM EBCDIC(덴마크-노르웨이-유럽) | IBM01142 | 1142 |
IBM EBCDIC(핀란드-스웨덴-유럽) | IBM01143 | 1143 |
IBM EBCDIC(이탈리아-유럽) | IBM01144 | 1144 |
IBM EBCDIC(스페인-유럽) | IBM01145 | 1145 |
IBM EBCDIC(영국-유럽) | IBM01146 | 1146 |
IBM EBCDIC(프랑스-유럽) | IBM01147 | 1147 |
IBM EBCDIC(국제-유럽) | IBM01148 | 1148 |
IBM EBCDIC(아이슬란드어-유럽) | IBM01149 | 1149 |
유니코드 | utf-16 | 1200 |
유니코드(Big-Endian) | unicodeFFFE | 1201 |
중앙 유럽어(Windows) | windows-1250 | 1250 |
키릴 자모(Windows) | windows-1251 | 1251 |
서유럽어(Windows) | Windows-1252 | 1252 |
그리스어(Windows) | windows-1253 | 1253 |
터키어(Windows) | windows-1254 | 1254 |
히브리어(Windows) | windows-1255 | 1255 |
아랍어(Windows) | windows-1256 | 1256 |
발트어(Windows) | windows-1257 | 1257 |
베트남어(Windows) | windows-1258 | 1258 |
한국어(조합) | Johab | 1361 |
서유럽어(Mac) | macintosh | 10000 |
일본어(Mac) | x-mac-japanese | 10001 |
중국어 번체(Mac) | x-mac-chinesetrad | 10002 |
한국어(Mac) | x-mac-korean | 10003 |
아랍어(Mac) | x-mac-arabic | 10004 |
히브리어(Mac) | x-mac-hebrew | 10005 |
그리스어(Mac) | x-mac-greek | 10006 |
키릴 자모(Mac) | x-mac-cyrillic | 10007 |
중국어 간체(Mac) | x-mac-chinesesimp | 10008 |
루마니아어(Mac) | x-mac-romanian | 10010 |
우크라이나어(Mac) | x-mac-ukrainian | 10017 |
태국어(Mac) | x-mac-thai | 10021 |
중앙 유럽어(Mac) | x-mac-ce | 10029 |
아이슬란드어(Mac) | x-mac-icelandic | 10079 |
터키어(Mac) | x-mac-turkish | 10081 |
크로아티아어(Mac) | x-mac-croatian | 10082 |
중국어 번체(CNS) | x-Chinese-CNS | 20000 |
TCA 대만 | x-cp20001 | 20001 |
중국어 번체(Eten) | x-Chinese-Eten | 20002 |
IBM5550 대만 | x-cp20003 | 20003 |
TeleText 대만 | x-cp20004 | 20004 |
Wang 대만 | x-cp20005 | 20005 |
서유럽어(IA5) | x-IA5 | 20105 |
독일어(IA5) | x-IA5-German | 20106 |
스웨덴어(IA5) | x-IA5-Swedish | 20107 |
노르웨이어(IA5) | x-IA5-Norwegian | 20108 |
US-ASCII | us-ascii | 20127 |
T.61 | x-cp20261 | 20261 |
ISO-6937 | x-cp20269 | 20269 |
IBM EBCDIC(독일) | IBM273 | 20273 |
IBM EBCDIC(덴마크-노르웨이) | IBM277 | 20277 |
IBM EBCDIC(핀란드-스웨덴) | IBM278 | 20278 |
IBM EBCDIC(이탈리아) | IBM280 | 20280 |
IBM EBCDIC(스페인) | IBM284 | 20284 |
IBM EBCDIC(일본어 가타카나) | IBM290 | 20290 |
IBM EBCDIC(프랑스) | IBM297 | 20297 |
IBM EBCDIC(아랍어) | IBM420 | 20420 |
IBM EBCDIC(그리스어) | IBM423 | 20423 |
IBM EBCDIC(히브리어) | IBM424 | 20424 |
IBM EBCDIC(한국어 확장) | x-EBCDIC-KoreanExtended | 20833 |
IBM EBCDIC(태국어) | IBM-Thai | 20838 |
키릴 자모(KOI8-R) | koi8-r | 20866 |
IBM EBCDIC(아이슬란드어) | IBM871 | 20871 |
IBM EBCDIC(키릴 자모 러시아어) | IBM880 | 20880 |
IBM EBCDIC(터키어) | IBM905 | 20905 |
IBM 라틴어-1 | IBM00924 | 20924 |
일본어(JIS 0208-1990 및 0212-1990) | EUC-JP | 20932 |
중국어 간체(GB2312-80) | x-cp20936 | 20936 |
한국어(완성) | x-cp20949 | 20949 |
IBM EBCDIC(키릴 자모 세르비아어-불가리아어) | cp1025 | 21025 |
Ext Alpha 소문자 | x-cp21027 | 21027 |
키릴 자모(KOI8-U) | koi8-u | 21866 |
서유럽어(ISO) | iso-8859-1 | 28591 |
중앙 유럽어(ISO) | iso-8859-2 | 28592 |
라틴어 3(ISO) | iso-8859-3 | 28593 |
발트어(ISO) | iso-8859-4 | 28594 |
키릴 자모(ISO) | iso-8859-5 | 28595 |
아랍어(ISO) | iso-8859-6 | 28596 |
그리스어(ISO) | iso-8859-7 | 28597 |
히브리어(ISO-Visual) | iso-8859-8 | 28598 |
터키어(ISO) | iso-8859-9 | 28599 |
에스토니아어(ISO) | iso-8859-13 | 28603 |
라틴어 9(ISO) | iso-8859-15 | 28605 |
히브리어(ISO-Logical) | iso-8859-8-i | 38598 |
일본어(JIS) | iso-2022-jp | 50220 |
일본어(JIS-Allow 1 byte Kana) | iso-2022-jp | 50221 |
일본어(JIS-Allow 1 byte Kana - SO/SI) | iso-2022-jp | 50222 |
한국어(ISO) | euc-kr | 50225 |
중국어 간체(ISO-2022) | x-cp50227 | 50227 |
일본어(EUC) | euc-jp | 51932 |
중국어 간체(EUC) | EUC-CN | 51936 |
한국어(EUC) | euc-kr | 51949 |
중국어 간체(HZ) | hz-gb-2312 | 52936 |
중국어 간체(GB18030) | GB18030 | 54936 |
유니코드(UTF-7) | utf-7 | 65000 |
유니코드(UTF-8) | utf-8 | 65001 |
MBCS, SBCS, DBCS 차이 (0) | 2018.09.04 |
---|---|
character set, code set, character encoding, codepage 용어 (0) | 2018.09.04 |
ASCII CODE 표 (0) | 2018.09.04 |
ASCII 제어 문자표 (0) | 2018.09.04 |
BOM 이란? (0) | 2018.09.04 |
댓글 영역