|
The world can greet you in 4000 different tongues, but 7 or 8 bit based legacy computer standards struggle to represent a decent percentage of this linguistic richness. Thankfully things are rapidly improving, with the UTF-8 compression of Unicode, and the MES-1 minimum Unicode subset. Gone are the days of ASCII. Welcome to the time of full Esperanto support - norms for charsets and even a norm for the keyboard 'layout' (press x for ^c, q for ^s etc).
^ UTF-8 (Unikodo) |
Kiam UTF-8-igante vian TTT-paĝon, nepre metu ene de <head></head> la jenon: <meta http-equiv="Content-type" content="text/html; charset=UTF-8">
Tiam, uzu la UTF-8-an paron por la supersignitaj literoj - nepre ĉiam uzu ne &xxx; (ekzemple Ä) sed rekte entajpu la kodon (PC-e, ALT-0xxx) (ekzemple Ĉ):
Estas iuj cimoj en TTT-legiloj (versiaj 4) rilate al UTF-8, tamen UTF-8 estas uzinda. UTF-8 estas la normo en XML, WAP-telefonoj, kaj multaj aliaj.
Kodo (dekume) | Kodo (deksesume) | Donas literon | |
---|---|---|---|
196 136 | C4 88 | Ĉ | = C kun cirkumflekso |
196 137 | C4 89 | ĉ | = c kun cirkumflekso |
196 156 | C4 9C | Ĝ | = G kun cirkumflekso |
196 157 | C4 9D | ĝ | = g kun cirkumflekso |
196 164 | C4 A4 | Ĥ | = H kun cirkumflekso |
196 165 | C4 A5 | ĥ | = h kun cirkumflekso |
196 180 | C4 B4 | Ĵ | = J kun cirkumflekso |
196 181 | C4 B5 | ĵ | = j kun cirkumflekso |
197 156 | C5 9C | Ŝ | = S kun cirkumflekso |
197 157 | C5 9D | ŝ | = s kun cirkumflekso |
197 172 | C5 AC | Ŭ | = U kun bireto |
197 173 | C5 AD | ŭ | = u kun bireto |
Kiel 196 136 el 264 ?
264 dekume = 0108 deksesume = 00000001 00001000 duume = 001 00001000 duume = 00100 001000 duume => 11000100 10001000 UTF-8 duume = C4 88 UTF-8 deksesume = 196 136 UTF-8 dekseseASCII-e, uzu 0bbbbbbb; sed Latin-1-e kaj Latin-A-e (kie estas E-o) 110bbbbb10bbbbbb.
^ UTF-7 (Unikodo) |
Se temas pri UTF-7-igante vian TTT-paĝon, nepre metu ene de <head></head> la jenon: <meta http-equiv="Content-type" content="text/html; charset=x-unicode-2-0-utf-7"> kaj simple uzu la 7-bitan &#unikodo; (memoru ke æ ktp ĉiam rilatas al ISO-8859-1, neniam ajn al ISO-8859-3) (aŭ la 7-bitan +utf7kodo-).
Kodo | Donas literon | |
---|---|---|
+AQg- | Ĉ | = C kun cirkumflekso |
+AQk- | ĉ | = c kun cirkumflekso |
+ARw- | Ĝ | = G kun cirkumflekso |
+AR0- | ĝ | = g kun cirkumflekso |
+ASQ- | Ĥ | = H kun cirkumflekso |
+ASU- | ĥ | = h kun cirkumflekso |
+ATQ- | Ĵ | = J kun cirkumflekso |
+ATU- | ĵ | = j kun cirkumflekso |
+AVw- | Ŝ | = S kun cirkumflekso |
+AV0- | ŝ | = s kun cirkumflekso |
+AWw- | Ŭ | = U kun bireto |
+AW0- | ŭ | = u kun bireto |
^ NCR de HTML (Unikodo) |
Vi ne bezonas (?) tiun <meta...> se temas pri pura HTML NCR. Simple uzu la 7-bitan &#unikodo; (memoru ke æ ktp ĉiam rilatas al ISO-8859-1, neniam ajn al ISO-8859-3).
Unikodo uzebla en HTML (version >=4) En Java kaj en ECMAscript, uzu \uHHHH kie HHHH estas deksesume.
+ = + = plussigno (singardu pri + en UTF-7)(ekzemple en UTF-7 estu ne <font size=+1> sed <font size=+-1> !)
Kodo (dekume - prefere) | Kodo (deksesume - evitinde) | Donas literon | |
---|---|---|---|
Ĉ | Ĉ | Ĉ | = C kun cirkumflekso |
ĉ | ĉ | ĉ | = c kun cirkumflekso |
Ĝ | ĝ | Ĝ | = G kun cirkumflekso |
ĝ | Ğ | ĝ | = g kun cirkumflekso |
Ĥ | Ĥ | Ĥ | = H kun cirkumflekso |
ĥ | ĥ | ĥ | = h kun cirkumflekso |
Ĵ | Ĵ | Ĵ | = J kun cirkumflekso |
ĵ | ĵ | ĵ | = j kun cirkumflekso |
Ŝ | Ŝ | Ŝ | = S kun cirkumflekso |
ŝ | ŝ | ŝ | = s kun cirkumflekso |
Ŭ | Ŭ | Ŭ | = U kun bireto |
ŭ | ŭ | ŭ | = u kun bireto |
^ Unikodaj URL-oj |
URL kodo | Donas literon | |
---|---|---|
%c4%88 | Ĉ | = C kun cirkumflekso |
%c4%89 | ĉ | = c kun cirkumflekso |
%c4%9c | Ĝ | = G kun cirkumflekso |
%c4%9d | ĝ | = g kun cirkumflekso |
%c4%a4 | Ĥ | = H kun cirkumflekso |
%c4%a5 | ĥ | = h kun cirkumflekso |
%c4%b4 | Ĵ | = J kun cirkumflekso |
%c4%b5 | ĵ | = j kun cirkumflekso |
%c4%9c | Ŝ | = S kun cirkumflekso |
%c5%9d | ŝ | = s kun cirkumflekso |
%c5%ac | Ŭ | = U kun bireto |
%c5%ad | ŭ | = u kun bireto |
^ MES-1 |
MES-1 (kaj do MES-2 & MES-3) subtenas Esperanton.
Unikodo XX__ | Unikodo __XX |
---|---|
00 | 20-7E, A0-FF |
01 | 00-13 16-2B 2E-4D 50-7F B7 EE EF |
02 | 18-1B 1E 1F 7C 92 C7 D8-DB DD |
1E | 02 03 0A 0B 1E 1F 40 41 56 57 60 61 6A 6B 80-85 9B F2 F3 |
20 | 15 18 19 1C 1D AC |
21 | 22 26 5B-5E 90-93 |
26 | 6A |
^ T.51 |
Oficiala laŭ normo de ITU, ŝajne (?) uzata en Teletekso/Videotekso (do Minitel) kaj Teleteksto 2 kaj ties tiparo.
Ekzistas 7-bita versio de T.51.
Kodo (dekume) | Kodo (deksesume) | Donas literon | |
---|---|---|---|
65 | 41 | A | = A |
195 67 | C3 43 | Ĉ | = C kun cirkumflekso |
195 99 | C3 63 | ĉ | = c kun cirkumflekso |
195 71 | C3 47 | Ĝ | = G kun cirkumflekso |
195 103 | C3 67 | ĝ | = g kun cirkumflekso |
195 72 | C3 48 | Ĥ | = H kun cirkumflekso |
195 104 | C3 68 | ĥ | = h kun cirkumflekso |
195 74 | C3 4A | Ĵ | = J kun cirkumflekso |
195 106 | C3 6A | ĵ | = j kun cirkumflekso |
195 83 | C3 53 | Ŝ | = S kun cirkumflekso |
195 115 | C3 73 | ŝ | = s kun cirkumflekso |
198 85 | C6 55 | Ŭ | = U kun bireto |
198 117 | C6 75 | ŭ | = u kun bireto |
241 | F1 | æ | = ae ligita |
^ JIS |
Malkiel Unikodo, ne estas tie ĉi Han-unuiĝo.
Tiparo | Enkodigo | Komentoj | ||
---|---|---|---|---|
JIS | Shift-JIS | EUC | ||
JIS-Latin (Japanio) | Jes | Jes | Jes | ASCII sed kun ¥ anstataŭ \, kaj kun du aliaj modifoj |
Duonlarĝa Katakana (Japanio) | Jes | Jes | Jes | Por fremd-vortoj kaj emfazoj, eĉ meze de Kanji |
JIS X 0208-1990 (Japanio) | Jes | Jes | Jes | Inkludas la sensupersignitajn Latin-literojn A-Z |
JIS X 0212-1990 (Japanio) | Jes | Ne | Jes | La Esperantaj literoj, kaj ĉiuj supersignitaj Latin-literoj, troviĝas en rangoj 10 kaj 11 |
KS C 5601-1992 (Koreio) | Jes | Ne | Jes | |
GB 2312-80 (Ĉinio) | Jes | Ne | Jes | |
Granda Kvinaĵo (Tajvano) | Ne | Ne | Jes |
^ ISO-8859-3 |
ISO-8859-3 = Latin-3.
Kiam Latin-3-igante vian TTT-paĝon, nepre metu ene de <head></head> la jenon: <meta http-equiv="Content-type" content="text/html; charset=ISO-8859-3"> (sed multaj kroziloj miskomprenas tiun ĉi linion stultece).
Metodo evitinda pro tio ke multaj ĝaĝaj sistemoj ne subtenas la normon.
La nova versio de Latin-3 (versio 1998) enhavas nenion novan krom la Unikodigon de la nomoj de la literoj/simboloj. Eĉ la simbolo por la eŭro (€) mankas!
Kodo (dekume) | Kodo (deksesume) | Donas literon | |
---|---|---|---|
198 | C6 | Ĉ | = C kun cirkumflekso |
230 | E6 | ĉ | = c kun cirkumflekso |
216 | D8 | Ĝ | = G kun cirkumflekso |
248 | F8 | ĝ | = g kun cirkumflekso |
166 | A6 | Ĥ | = H kun cirkumflekso |
182 | B6 | ĥ | = h kun cirkumflekso |
172 | AC | Ĵ | = J kun cirkumflekso |
188 | BC | ĵ | = j kun cirkumflekso |
222 | DE | Ŝ | = S kun cirkumflekso |
254 | FE | ŝ | = s kun cirkumflekso |
221 | DD | Ŭ | = U kun bireto |
253 | FD | ŭ | = u kun bireto |
^ ESPERANTO-ASCII |
charset=EO-ASCII-1 por EO-ASCII nivelo 1, charset=EO-ASCII-2 por EO-ASCII nivelo 2
Laŭ normo Z.314 de ITU, estas nur dek 7-bitaj kodoj uzeblaj por aliaj lingvoj (vidu unuan suban tabelon). (Tamen, en Teleteksto 1, uzeblaj estas dek tri, nome 23=# 24=$ 40=@ 5B=[ 5C=\ 5D=] 5E=^ 5F=_ 60=` 7B={ 7C=| 7D=} 7E=~.)
La kodoj de la normo EO-ASCII estas zorge elektitaj: pro formo [@^]$# kaj {|, pro Latin-3 }~, pro Z.314 _#, pro uskleco `{.
Ekzemple,
FELI[A @OJO E^OJ A]O $ATI LA#
La normo estas, kvankam interesa, neniam uzita kaj ne agnoskita de la Esperanta komunumo. Nivelo 1 estas ne uzinda. Nivelo 2 povus esti ie utila.
Aliaj variaĵoj de la 7-bita ISO-kodo
estus en IRV-ASCII | Kodo (deksesume) | Donas literon | |
---|---|---|---|
[ | 5B | Ĉ | = C kun cirkumflekso |
{ | 7B | ĉ | = c kun cirkumflekso |
@ | 40 | Ĝ | = G kun cirkumflekso |
` | 60 | ĝ | = g kun cirkumflekso |
^ | 5E | Ĥ | = H kun cirkumflekso |
\293; | ĥ | = h kun cirkumflekso | |
] | 5D | Ĵ | = J kun cirkumflekso |
| | 7C | ĵ | = j kun cirkumflekso |
\348; | Ŝ | = S kun cirkumflekso | |
~ | 7E | ŝ | = s kun cirkumflekso |
\364; | Ŭ | = U kun bireto | |
} | 7D | ŭ | = u kun bireto |
\ | 5C | = Unikoda dekuma numero sekvas, kaj finiĝos per ; |
estus en IRV-ASCII | Kodo (deksesume) | Donas literon | |
---|---|---|---|
[ | 5B | Ĉ | = C kun cirkumflekso |
{ | 7B | ĉ | = c kun cirkumflekso |
@ | 40 | Ĝ | = G kun cirkumflekso |
` | 60 | ĝ | = g kun cirkumflekso |
^ | 5E | Ĥ | = H kun cirkumflekso |
_ | 5F | ĥ | = h kun cirkumflekso |
] | 5D | Ĵ | = J kun cirkumflekso |
| | 7C | ĵ | = j kun cirkumflekso |
$ | 24 | Ŝ | = S kun cirkumflekso |
~ | 7E | ŝ | = s kun cirkumflekso |
# | 23 | Ŭ | = U kun bireto |
} | 7D | ŭ | = u kun bireto |
\ | 5C | = Unikoda dekuma numero sekvas, kaj finiĝos per ; |
^ Esperanto transliterade kaj transskribade |
Rimarku ke uw/vx estus multe malpli ambigua ol ŭ - tamen pro ebleco de fremd-vortoj en Esperanta teksto, neniu solvaĵo estas perfekta.
En Latin-1, multe prefere uzu ù (Ù) anstataŭ ú (Ú). Kial, nu, ù pli oftas, ekzemple ĉe GSM, kaj aldone, 1) ù estas pli kutima (dum longa tempo ĝin havis la "Heroldo de Esperanto"); kaj 2) la maldekstra korno aludas ligon kun la ĵusa a aŭ e; kaj 3) en kelkaj lingvoj (ekzemple ĉeĥa, slovaka, hungara) la dekstra korno markas longajn vokalojn - do, la malon de la Esperanta ŭ.
Malkiel transskriba helpalfabeto, translitera helpalfabeto devas esti (komputile) neambigua (*). Nur kie Unikodo ne uzeblas, ekzemple en DNS kaj oldaj telefonoj, uzu prefere la transliteradon. Nur kie ù ne uzeblas, ekzemple en DNS, uzu u.
Transskribado & Transliterado | |||||||
---|---|---|---|---|---|---|---|
Transskribado por ASCII (Zamenhofa) | Transskribado por Latin-1 | Transliterado por ASCII | Transliterado por Latin-1 | Amuzaĵe por ASCII | Amuzaĵe por Latin-1 | Alia ebleco | |
Ch | Ch | Ĉ | Ĉ | Ĉ | Ç | C' | Ĉ = C kun cirkumflekso |
ch | ch | ĉ | ĉ | ĉ | ç | c' | ĉ = c kun cirkumflekso |
Gh | Gh | Ĝ | Ĝ | Gy | Q | G' | Ĝ = G kun cirkumflekso |
gh | gh | ĝ | ĝ | gy | q | g' | ĝ = g kun cirkumflekso |
Hh | Hh | Ĥ | Ĥ | Hh | Hh | H' | Ĥ = H kun cirkumflekso |
hh | hh | ĥ | ĥ | hh | hh | h' | ĥ = h kun cirkumflekso |
Jh | Jh | Ĵ | Ĵ | Jy | Ý | J' | Ĵ = J kun cirkumflekso |
jh | jh | ĵ | ĵ | jy | ý | j' | ĵ = j kun cirkumflekso |
Sh | Sh | Ŝ | Ŝ | Ŝ | X | S' | Ŝ = S kun cirkumflekso |
sh | sh | ŝ | ŝ | ŝ | x | s' | ŝ = s kun cirkumflekso |
vokalo lige kun U | Ù | Ŭ | Ù | W | Ù | U | Ŭ = U kun bireto |
vokalo lige kun u | ù | ŭ | ù | w | ù | u ekz. au | ŭ = u kun bireto |
vokalo plus U | U | U | U | U | U | Ü | U = U sen bireto |
vokalo plus u | u | u | u | u | u | ü ekz. neü | u = u sen bireto |
Ekzemple: Ĉiuĵaŭde --> Ĉiuĵaùde
Ekzemple: ĝi --> ĝi
Ekzemple: EĤOŜANĜO ĈIUĴAŬDE --> EĤOŜANĜO ĈIUĴAÙDE.
^ Morso |
Oficiala laŭ FCC.
Morsa kodo | Donas literon |
---|---|
-.-.. | Ĉ = C kun cirkumflekso |
-.-.. | ĉ = c kun cirkumflekso |
--.-. | Ĝ = G kun cirkumflekso |
--.-. | ĝ = g kun cirkumflekso |
-.--. | Ĥ = H kun cirkumflekso |
-.--. | ĥ = h kun cirkumflekso |
.---. | Ĵ = J kun cirkumflekso |
.---. | ĵ = j kun cirkumflekso |
...-. | Ŝ = S kun cirkumflekso |
...-. | ŝ = s kun cirkumflekso |
..-- | Ŭ = U kun bireto |
..-- | ŭ = u kun bireto |
^ Brajlo |
Oni uzas 6-punktan Brajlo:
14 25 36
Notu ke w/W estas 23456.
Brajlaj punktoj | Donas literon |
---|---|
146 ** | Ĉ = C kun cirkumflekso |
same | ĉ = c kun cirkumflekso |
12456 ** | Ĝ = G kun cirkumflekso |
same | ĝ = g kun cirkumflekso |
1256 *- | Ĥ = H kun cirkumflekso |
same | ĥ = h kun cirkumflekso |
2456 -* | Ĵ = J kun cirkumflekso |
same | ĵ = j kun cirkumflekso |
2346 -* | Ŝ = S kun cirkumflekso |
same | ŝ = s kun cirkumflekso |
346 -* | Ŭ = U kun bireto |
same | ŭ = u kun bireto |
^ Signolingvo |
Uzo de manalfabeto de Signuno (bazita sur Gestuno) estas proponata.
^ La klavaro por Esperanto |
Nur estas unu klavaro por Esperanto.
Ĉu QWERTY, ĉu AZERTY, ĉu DVORJAK, premu x por ĉ, q por ŝ, ktp.
Foje HH/Hh/hh ne estas subtenata. Metodo entajpi oŭ aŭ sŭ ktp ne estas normigita.
Rimarku la sensuperhokajn vortojn kiaj balau, pereu, reutili, praulo, posteulo, ktp.
Klavare | Donas litero(j)n |
---|---|
X | Ĉ = C kun cirkumflekso |
x | ĉ = c kun cirkumflekso |
Y | Ĝ = G kun cirkumflekso |
y | ĝ = g kun cirkumflekso |
HH | Ĥ = H kun cirkumflekso |
Hh | Ĥ = H kun cirkumflekso |
hh | ĥ = h kun cirkumflekso |
W | Ĵ = J kun cirkumflekso |
w | ĵ = j kun cirkumflekso |
Q | Ŝ = S kun cirkumflekso |
q | ŝ = s kun cirkumflekso |
AU | AŬ = A U kun bireto |
Au | Aŭ = A u kun bireto |
au | aŭ = a u kun bireto |
EU | EŬ = E U kun bireto |
Eu | Eŭ = E u kun bireto |
eu | eŭ = e u kun bireto |
^ Lokalo -- datoj, tempoj, monkvantoj |
FORMATO DE TEMPOJ KAJ DATOJ | |
---|---|
JJJJ.MMM.TT | |
JJJJ.MMM.TT-TT | |
JJJJ.MMM.TT-MMM.TT | |
JJJJ.MMM.TT-JJJJ.MMM.TT | |
ekzemple: 1998.JUL.12-25 | |
hh:mm | |
hh:mm:ss.s | |
ekzemple: 23:50 |
FORMATO DE MONKVANTOJ | |
---|---|
estas | aŭ egale |
GBP 1.500,99 | £ 1.500,99 |
EUR 1.000 | € 1.000 |
TAGOJ | ||
---|---|---|
mallongigo | vorto | komentoj |
lu | lundo | |
ma | mardo | |
me | merkredo | |
ĵa | ĵaŭdo | |
ve | vendredo | |
sa | sabato | |
di | dimanĉo |
MONATOJ | |||
---|---|---|---|
numero (=MM) | mallongigo (=MMM) | vorto | komentoj |
01 | jan | januaro | |
02 | feb | februaro | |
03 | mar | marto | |
04 | apr | aprilo | |
05 | maj | majo | |
06 | jun | junio | |
07 | jul | julio | (sed julo => kristnasko) |
08 | aŭg | aŭgusto | |
09 | sep | septembro | |
10 | okt | oktobro | |
11 | nov | novembro | |
12 | dec | decembro |
^ Lingvaj kodoj |
Normo | Kodo |
---|---|
ISO-639-1 | eo |
ISO-639-2 | epo |
Ethnologue | esp |
WAP telefonoj | dekume, 26 |
Apple | dekume, 94 |
^ Programoj |
Ret-kroziloj por Unikodo.
Sistemklavaroj por la norma E-klavaro.
Teksprilaboriloj por Esperanto (kun la norma E-klavaro).
^ Aliaj interesaj ligoj |
En Esperanto:
En aliaj lingvoj: