UTF-8
出自福留子孫
UTF-8編碼位元組含義:
- ◽◾◾◾◾◾◾◾,對於UTF-8編碼中的任意位元組B,如果B的第一位為0,則B獨立的表示一個字元(ASCII碼);
- ◾◽??????,如果B的第一位為1,第二位為0,則B為一個多位元組字元中的一個位元組(非ASCII字元);
- ◾◾◽?????,如果B的前兩位為1,第三位為0,則B為兩個位元組表示的字元中的第一個位元組;
- ◾◾◾◽????,如果B的前三位為1,第四位為0,則B為三個位元組表示的字元中的第一個位元組;
- ◾◾◾◾◽???,如果B的前四位為1,第五位為0,則B為四個位元組表示的字元中的第一個位元組;