Treść książki

Przejdź do opcji czytnikaPrzejdź do nawigacjiPrzejdź do informacjiPrzejdź do stopki
Wsystemachinformacyjnychtrzebawogólnymprzypadkudopuszczać
dokumentywielojęzyczne.Dlategounifikacjapozwalającareprezentować
tekstyzapisanewróżnychjęzykachjestdlaużytkownikówsystemówin-
formacyjnychważna.Mimotychograniczeńjęzykiwywodzącesięzkultu-
ryłacińskiejmożnareprezentowaćzapomocąstosunkowoniewielkiego
zbioruznaków.
ASCII
Wybór
technologii
pozyskania
dokumentów
Najbardziejrozpowszechnionymobecniesystememkodowaniatekstów
jestAmericanStandardCodeforInformationInterchange-ASCII
wktórymprzyjętoośmiobitowesłowokodowe
70
,.Założono,że256zna-
kówwystarczydlareprezentacjiwszystkichdopuszczonychznaków
71
.
Tradycjakorzystaniazmaszyndopisaniakażejednakumieszczaćpo-
szczególneznakinaokreślonychprzyciskachklawiatury.Dlaumożliwienia
przypisaniutemusamemuklawiszowiinnegoznakuwróżnychjęzykach
wprowadzonopojęciestronkodowych(codepages)jakoalternatywnych
zestawów256znakówużywanychdlaposzczególnychjęzyków.Rozwią-
zanietomajednakwady:zbytmałaliczbakodówdlareprezentacjipożąda-
nejliczbyznakóworazwynikającaztegoniekompatybilnośćkodowania
(tensamkodreprezentujeodmiennyznakdlakażdejzestronkodowych).
Większeproblemystwarzająjęzyki,wywodzącesięzinnychkulturniż
łacińska.Naprzykładjapońskapisowniawhiragana,katakanaorazkanji
potrzebujeod2do7tys.znaków.Możliwościkodowaniazwykorzysta-
niem256stanówniewystarczające.
UNICODE
72
jestprzykłademstandaryzacjiumożliwiającymkodowanie
znakówwwielujęzykach.Matoprzyczynićsiędojednoznacznejwymiany
informacjitekstowejwskaliglobalnej.
Wybórtechnologiipozyskaniadokumentówdosystemuniejestcharakte-
rystycznydlakonkretnejklasysystemówinformacyjnych(porównajna
stronie270).Wciąguostatnichkilkunastulatzmieniłosiępodstawowe
pytanie,naktórenależałoznaleźćodpowiedźwprocesiepozyskaniadoku-
mentówdosystemu.Kiedyśtroszczyliśmysięopozyskaniedokumentów
zmediównieelektronicznych.Powszechniestosowanądrogąwunikaniu
błędówwdokumentachelektronicznychbyłostosowanieproceduroptycz-
negorozpoznaniatekstów(OCR-opticalcharacterrecognition).Powinny
70
PN-EN1556:1998-3.5.
71
PN-EN1556:1998-3.36.
72
http://www.unicode.org/versions/Unicode5.0.0/
56