清明祭扫首个小高峰 武汉市近30万人提前扫墓
![]() |
?iam straipsniui ar jo daliai reikia daugiau nuorod? ? patikimus ?altinius. Jūs galite pad?ti Vikipedijai ?ra?ydami tinkamas i?na?as ar nuorodas ? patikimus ?altinius. |
Unikodas (angl. Unicode) – standartas, apibr??iantis beveik vis? kalb? ab?c?li? bei papildom? ra?to ?enkl? kodavim? kompiuteriuose.
Unikodas sukurtas siekiant pakeisti anks?iau naudotas ?vairias ribotas simboli? koduotes. Pirmoji standarto versija (1.0) sukurta 1995 metais, nuo tada standartas beveik kasmet atnaujinamas – 2022 metais i?leista jau 15.0.0 jo versija[1]. ?iuo metu Unikodas yra dominuojantis standartas pritaikant kompiuterines programas daugeliui kalb?. Unikodo palaikymas numatytas moderniuose standartuose (kaip XML), programavimo kalbose bei operacin?se sistemose. ?iuo metu standartas suteikia galimyb? apra?yti iki 1 112 064 ?enkl?, o apra?o 149 186 ?enklus.
Unikode kiekviena pozicija atitinka tik vien? konkret? ?enkl?, ta?iau kai kuriais atvejais vienam ?enklui skiriama keletas pozicij?. Pirmosios 256 pozicijos yra identi?kos ISO 8859-1 koduot?s ?enklams, kad būt? paprastesnis keitimas i? egzistuojan?i? Vakar? Europos kalb? tekst?. Unikodo standarte numatyti ne tik raid?s ir simboliai, bet ir pagalbiniai kodai nusakyti simbolio savyb?ms, teksto kryp?iai bei kitoms reikm?ms.
Unikode numatyta kombinacini? sek? galimyb?, kai vienas vaizduojamas simbolis koduojamas dviej? ar daugiau kod? seka. Kai kurios raid?s su diakritiniais ?enklais gali būti u?ra?omos ir vienu kodu. Pavyzd?iui, kir?iuotoji raid? a (á) gali būti u?ra?oma tiek vienu Unikodo kodu (U+0301), tiek dviej? seka (U+0061, U+0301). Standarto po?iūriu, abiem ?iais būdais u?ra?yta informacija laikoma lygiaverte.
Toliau pl?tojant standart?, laikomasi nuostatos nesuteikti atskir? kod? ?enklams, kurie gali būti u?ra?yti kombinacin?mis sekomis. Siekiant supaprastinti darb? su da?niau pasitaikan?iomis kombinacin?mis sekomis (pavyzd?iui, toki? duomen? perkodavim? i? kit? koduo?i? ar ? jas), 2005-aisiais metais (4.1 versijoje) standarte ?vesta vardini? sek? (named character sequences) s?voka.[2]
Apimtis
[redaguoti | redaguoti vikitekst?]Unikodas apima beveik visas ?iuo metu naudojamas ra?to sistemas. Kai kurios j?:
|
|
Taip pat Unikode prid?ti ir nema?ai papildom? simboli?, istorini? bei i?nykusi? ra?to sistem? (Egiptie?i? bei Maj? hieroglifai, ?umer? dantira?tis, Senov?s graik?, Finikie?i? ab?c?l?s, runos ir kt.).
Be to, naudojami ir matematiniai bei muzikiniai simboliai, numatytos vietos ateityje pridedamoms ra?to sistemoms bei asmeniniam naudojimui.
Darbas su Unikodu
[redaguoti | redaguoti vikitekst?]Pats Unikodo standartas tik numato konkre?ias koduojam? ?enkl? aib? ir vienareik?mes j? pozicijas, bet ne real? j? kodavim? fizin?je atmintyje. Yra sukurta keletas Unikodo koduo?i?, kuri? vienos pritaikytos taupesniam saugojimui, kitos – suderinamumui su senomis koduot?mis ar sistemomis. ?tai dalis j?:
- UTF-7 – pasenusia laikoma ir retai naudojama 7 bit? koduot?
- UTF-8 – 8 bit? kintamo ilgio koduot?
- UCS-2 – 16 bit? fiksuoto ilgio koduot?, palaikanti tik pirm?sias 65 535 Unikodo pozicijas
- UTF-16 – 16 bit? kintamo ilgio koduot?
- UCS-4 ir UTF-32 – identi?kos 32 bit? fiksuoto ilgio koduot?s
- GB18030 – 8 bit? kintamo ilgio koduot?, oficialus Kinijos standartas, optimizuotas tekstams, kuriuose daugiausia naudojami ASCII ir kin? ra?to ?enklai
- UTF-EBCDIC – retai naudojama 8 bit? kintamo ilgio koduot?, pana?i ? UTF-8, bet sukurta EBCDIC sistemoms
UTF-32 ir UCS-4 koduot?s yra netaupios, bet labai paprastos – jomis galima u?koduoti bet kur? Unikodo simbol? kiekvienam skiriant 32 bitus. UTF-8 koduot?je vienam ?enklui naudojama nuo 1 iki 4 bait?, ji yra suderinama su ASCII bei yra labai taupi, jei ja koduojamame tekste naudojami daugiausia lotyn? ab?c?l?s pagrindo ra?menys.
Kritika
[redaguoti | redaguoti vikitekst?]? Unikod? n?ra ?trauktos 35 (i? 68) lietuvi?kos kir?iuotos raid?s. ?ias raides tenka koduoti vardin?mis kombinacin?mis sekomis.[3]
Unikodo kritik? (daugiausiai Japonijoje) po?iūriu, standartas per daug supaprastina azijieti?kas ra?to sistemas, nepalaiko senesni? ar alternatyvi? kand?i simboli?. Taip pat yra teigian?i?, kad Unikodas palaiko per ma?ai simboli?. Kritikuota ir nelogi?ka Thai simboli? eil?s tvarka.
Standarto 2.0 versijoje pradin? 65 535 galim? u?koduoti ?enkl? aib? padidinta iki 1 112 064, prid?ta papildom? azijieti?k? ra?to ?enkl?, tod?l dalis pradin?s kritikos jau n?ra aktuali.