Kio estas Teksta Dosiero?

La plej simpla kaj universala formo de elektronika dokumento estas 'simpla teksto' (angle: plain textsimple text). Oni ofte diras 'teksta', sen plia adjektivo. Kompreneble, ĉiuj dokumentoj enhavas tekston, laŭ ĝenerala signifo de la vorto, sed kiel komputila termino, 'teksta' dosiero signifas dosieron kiu enhavas nur kodojn por videblaj signoj (literoj, ciferoj), plus kelkajn regkodojn por indiki finon de linio, novan paĝon, tabon, ktp. Teksta dosiero ne inkluzivas kodojn por indiki la stilon de literoj; tio estas, tiparo, grandeco, graseco, kliniteco, koloro, ktp. Dosiero kiu enhavas tiajn informojn estas kunstila dosiero.

Tekstaj dosieroj kutime havas sufikson 'txt' apud la nomo, ekzemple 'letero.txt' aŭ 'poemo.txt', sed tio ne nepras.

Pli Detale

En la sesdekaj jaroj, Usona nacia instituto pri normoj (ANSI), kreis la Aski-kodaron (ASCII - American Standard Code for Information Interchange) . La originala Askio difinis 96 kodojn por preseblaj signoj (abc, 123, #$%, ktp.) kaj 32 regkodojn (nova linio, nova paĝo, ktp.)

Ĉiuj Usonaj fabrikantoj de komputiloj akceptis la normon, escepte de IBM, kiu tiam havis propran normon. Pro la dominanta pozicio de Usono en la internacia komputila merkato, Askio fariĝis internacia normo.

Ĉar la originala Askio ne difinis kodojn por supersignitaj literoj, internacia norma instituto (ISO) pliampleksigis ĝin por inkluzivi la supersignitajn literojn de aliaj latinalfabetaj lingvoj. Askio ankaŭ fariĝis bazo de nelatinaj signo-normoj, dekomence aŭ per posta inkluzivo.

Askio nun estas la bazo de preskaŭ ĉiuj internaciaj signonormoj. Ĉi tiuj normoj difinas kodojn por reprezenti preseblajn signojn, kaj la simplajn regkodojn de Askio. Dosiero kiu estas kodigita per Askibaza normo, estas simpla teksta dosiero. Tiel, japana aŭ rusa dokumento estas 'teksta' se ĝi uzas nur Askiajn regkodojn.

Ĉar la Askibazaj signonormoj ne havas rimedojn por indiki stilon, softvar-kompanioj devis inventi kodojn kaj dosier-formatojn por difini tiajn informojn. Ĉiu softvar-kompanio difinis propran formaton por kunstilaj dokumentoj. Tial, la 'vortprocesilo' Word uzas formaton kiu estas tute malsama al tiu de WordPerfect. Tamen, la formato rtf (Rich Text Format) celas esti universala normo por kunstilaj dokumentoj.

Se oni konvertas dokumenton de formato Word (doc) aŭ rtf al teksta dosiero, oni kompreneble perdas ĉiujn informojn pri stilo.

HTML

Por interretaj dokumentoj, oni kutime uzas la formaton HTML (HiperTeksta MarkLingvo). La dokumento kiun vi nun legas estas HTML-dokumento, kaj kiel vi povas vidi, HTML kapablas difini stilon kaj formaton de teksto.

En priskriboj pri retpoŝto kaj interreto, oni kutime distingas inter HTML kaj simpla teksto. Tamen, en iuj lokoj, oni skribas ke HTML-dokumento ESTAS simpla teksta dokumento. Ekzemple, ĉi tie.

Por kompreni ĉi tiun kontraŭdiron, sciu ke la informoj pri tiparoj kaj tekstostiloj en HTML-dokumento estas indikitaj per legeblaj anglaj vortoj (aŭ mallongigoj). Ekzemple, en HTML, oni indikas tiparon ĉi tiel:

<font size="5" face="Lucida Sans Unicode">

En dokumento de Word aŭ aliaj redaktiloj, tiaj informoj estas indikitaj per nelegeblaj kodoj. HTML-dokumento estas redaktebla per simpla teksto-redaktilo, kaj pro tio oni povas diri ke HTML-dokumento estas ordinara teksta dosiero.

Referencoj
Senaranĝaj Tekstoj Signaroj kaj Kodoj (Pokrovskij)
Signaraj Normoj (Klivo) A Brief History of Character Codes (angla)


Al Indekso