Formáty textov a konverzia medzi nimi.

TXT. Najjednoduchší formát, zároveň aj najstarší. Niekde ho možno nájdete aj ako ASC alebo DOC. Kedysi s diakritikou v kódovaní Kamenických alebo Latin II /hlavne T602/, teraz v Unicode /Windows 1250/. Nezachováva formátovanie, bez problémov na všetkých platformách. Jednoduchý konvertor diakritiky vie prevádzať všetky kódovania i celé adresáre. Softwarové lepidlo Kanagom 1.2 vie zase lepiť rozsekané riadky /vznikajú hlavne pri exporte z pdf pri použití Acrobatu 5 a nižšom, alebo niekedy v starých editoroch, prípadne pri zlých návykoch z písacieho stroja/. Kanagom nepoužívajte na poéziu, ale inak je to to najlepšie, čo existuje.

HTM, HTML, SHTML. Najpoužívanejší formát na Internete. Najjednoduchšie sa číta v Microsoft Exploreri, je priamo integrovaný do systému Windows. Alternatívne prehliadače Opera, Mozilla... Čiastočne zachováva formátovanie, ale na zložitejšie úpravy to nie je. Niekedy problematický prevod do iných formátov kvôli tabuľkám, používanými kvôli zachovaniu rozloženia stránky. Obrázky sú nalinkované k dokumentu. Jednoduchý free editor typu Wysiwig je napríklad FrontPad. Má problém so súbormi nad 100kB.

602. Kedysi veľmi používaný formát, hlavne kvôli editoru T602 od firmy Software602. Dnes už síce málo používaný, ale stretnete sa s ním hlavne pri starších počítačoch bežiacich pod MS-DOS. T602viewer vie dokument uložiť ako rtf.

RTF. Univerzálny formát, zachováva formátovanie, obrázky môžu byť v texte alebo nalinkované. Žiaľ, linkované obrázky často strácajú väzbu, je lepšie dať obrázky do dokumentu. Problém je v tom, že ich vie uložiť iba ako nekomprimovanú bitmapu, takže dokument s obrázkami býva neúmerne veľký. Načíta ho každý kancelársky editor. Ďalším problémom je to, že aj rtf sú rôzne verzie, rôzne kompatibilné s formátom doc...

DOC. Formát presadzovaný Microsoftom. Zachováva formátovanie v slušnej forme, obrázky interne ukladá ako png a jpg. Momentálne asi najrozšírenejší, každý dnešný kancelársky balík sa snaží o čo najväčšiu kompatibilitu s ním. Problém je v tom, že Microsoft neuvoľnil /a asi ani neuvoľní/ špecifikáciu, takže kompatibilita nie je úplná.

XML. Nastupujúci formát na základe HTML. Formátovanie je robené na základe štýlov, dokument je prehľadávateľný pomocou robotov. Celý dokument aj s obrázkami býva zapuzdrený do jedného súboru, najčastejšie pomocou Zip-u. Používa ho napríklad OpenOffice, teraz vo verzii 1.1.1, po česky tu, a po slovensky zase tu. Microsoft Office 2003 by ho mal používať tiež, ale zatiaľ neviem povedať, ako to tam funguje.

PDB, PRC.Dokumenty pre PalmPilot. Jednoduchý čítač a zároveň editor je program DocReader. Vie uložiť dokument vo formáte txt. Čítač formátu iSilo vie tiež uložiť dokument ako txt.

PDF. Veľmi rozšírený formát hlavne pre technické dokumentácie. V dokumente sú obsiahnuté aj obrázky - môžu byť bitmapové i vektorové. Je možné si stiahnuť voľnú verziu Acrobat Readera zo stránky www.adobe.com, vo veľkosti cca 5,6Mb. Vie iba čítať. Výhodou je, že dokument je na všetkých platformách rovnaký, nevýhodou je, že je konečný, dá sa upravovať iba vo veľmi obmedzenej miere. Existujú nástroje, ktoré to vedia, ale sú pomerne drahé. Dokumenty s diakritikou vie rozumne previesť iba plný Acrobat, odporúčam iba do jednoduchého html /bez kaskádových štýlov/.
Alternatívny program na čítanie PDF súborov s názvom Foxit PDF Reader je malý, zaberá cca 900 kB, rýchly, zvláda textové, obrazkové i multimediálne PDF súbory a nechýba ani podpora najnovšieho PDF štandartu 1.7. Umožňuje cez schránku /po jednej strane/ aj exportovať textovú informáciu.
Výsledný dokument je ale potrebné vždy poriadne skontrolovať a upraviť, konverzia stále nie je ideálna. Niektoré dokumenty sa žiaľ nedajú previesť ani Acrobatom /nemožnosť použiť obtekanie či príliš veľa zabudovaných štýlov/. PDF totiž môže obsahovať ochrany znemožnujúce priamy export textu vo forme kódovania diakritiky. Opticky to síce na obrazovke vyzerá správne, ale vyexportovaný text je prakticky nečitateľný. Tu pomôže niekedy export do obrázkov pomocou plnej verzie Acrobatu, alebo vyšej verzie Photoshopu. Dokument sa dá previesť aj pomocou OCR programu /najlepšie zrejme cez FineReader/ a potom ho poctivo skontrolovať, pretože aj Finereader si pridáva vlastné chyby.

LIT. Formát, ktorý presadzuje Microsoft. Prezerací program Microsoft Reader 2.1.1 sa dá sa stiahnuť na adrese www.microsoft.com/reader. Zaberá cca 4MB.
Niet ho čím editovať. Dá sa iba vygenerovať z doc tak, že sa vytvorí html stránka a tá sa potom skonvertuje do LIT. Jednoduchý konvertor do html je napríklad ConvertLit 1.2.

CBR. Obálkový formát pre obrázky typu JPEG, PNG a GIF, zapakované do archívu typu ZIP, RAR, ACE alebo TAR a premenované na .CBR. Pôvodne vyvinuté na prezeranie komiksov, ale je vhodný na prezeranie sérií obrázkov. Dá sa otvoriť pomocou programu CDisplay Comic Reader z adresy www.geocities.com/davidayton/CDisplay.

DJVU. Špeciálny formát pre obrázky s možnosťou veľmi vysokej kompresie. Dá sa otvoriť napríklad pomocou programu WinDjView z adresy windjview.sourceforge.net/