Kaip konvertuoti kinų tekstą į "Unicode"?

Kairiajame lange galite įvesti "Unicode" tekstą, kurį norite paversti kinų kalba arba kinų kalba paversti "Unicode". 

Taip pat galite naudoti mūsų konverterį, kad kinų kalbą arba pinyin paverstumėte į Unicode arba atvirkščiai. Dešiniajame lange matysite konvertavimo rezultatus (išvestį). Jei rezultatai jus tenkina, galite juos nukopijuoti ir įklijuoti į kitą dokumentą ar programą. Taip pat galite konvertuoti kelis teksto fragmentus spustelėdami "Konvertuoti".

Unicode naudojamas internete, kad tekstas būtų rodomas teisingai, kai nenaudojamos standartinės lotyniškos raidės. Unikodas padeda užtikrinti, kad interneto svetainėse būtų galima tinkamai rodyti kiniškus simbolius. Unikodo standartas nuolat atnaujinamas įtraukiant naujus simbolius, o naujausioje versijoje yra daugiau kaip 110 000 skirtingų simbolių. Būtent šis standartas užtikrina, kad kinų kalbos rašmenis interneto svetainėje būtų galima teisingai rodyti net ir tuo atveju, jei jūsų kompiuteryje nėra įdiegtų kinų kalbos šriftų.

Unikodas ypač svarbus internacionalizavimui, t. y. programinė įranga gali būti parašyta vieną kartą ir palaikyti kelias kalbas. Be "Unicode" kinų rašmenys bus rodomi keistai arba vietoje teksto bus langeliai, pavyzdžiui, 汉字. Štai kodėl "Unicode" yra standartinė HTML5 simbolių koduotė.

Unikodo simbolius galima atvaizduoti keliais būdais. Labiausiai paplitusi forma yra kodo taškas, t. y. skaičius, atitinkantis tam tikrą simbolį. Pavyzdžiui, raidės A kodo taškas yra U+0041.

Kodo taškus galima pateikti keliais būdais, tačiau labiausiai paplitusi forma yra "Unicode" kodo vienetas, kuris yra 16 arba 32 bitų skaičius, atitinkantis tam tikrą simbolį. Pavyzdžiui, raidės A kodo vienetas yra 0041. Unikodo kodų vienetai naudojami ženklams žymėti daugumoje šiuolaikinių programavimo kalbų. Pavyzdžiui, "Java" ir "JavaScript" programose visos eilutės pateikiamos kaip "Unicode" kodo vienetai.

Be kodų taškų ir kodų vienetų, yra ir kitų "Unicode" simbolių atvaizdavimo būdų, pavyzdžiui, UTF-8 ir UTF-16. Tai yra ženklų kodavimo kaip baitų sekos standartai. UTF-8 yra labiausiai paplitusi "Unicode" forma, kurią naudoja dauguma interneto naršyklių ir serverių. UTF-16 yra kitas populiarus kodavimas, naudojamas daugelyje programavimo kalbų.

Jums nebūtina žinoti visų šių dalykų apie "Unicode", tik reikia žinoti, kad galime konvertuoti "Unicode" į kinų kalbą ir kinų kalbą į "Unicode"! 





Copyright

© 2012-2023 Shudian Ltd.|Privacy Policy & Terms of Use|Contact us

- All rights reserved.