Početna Karakteristike Hifenacija

Hifenacija - opis problema

Hi­fe­na­ci­ja, to jest po­de­la re­či na kra­ju re­da, odu­vek je za­da­va­la po­te­ško­će pro­fe­si­o­nal­nim štam­pa­ri­ma ko­ji su te­ži­li ne sa­mo lep­šem iz­gle­du štam­pa­ne stra­ni­ce već i nje­noj ve­ćoj či­tlji­vo­sti.

Otac mo­der­nog štam­par­stva, Jo­han Gu­ten­berg, ko­ri­stio je hi­fe­na­ci­ju ka­da je štam­pao svo­je re­mek-de­lo, Bi­bli­ju na la­tin­skom.

Po­de­la re­či po pra­vi­li­ma i pre­po­ru­ka­ma va­že­ćeg Pra­vo­pi­sa li­či na tri­vi­ja­lan pro­gra­mer­ski za­hvat, po­go­to­vo ako uzme­mo u ob­zir da Pra­vo­pis da­je i ta­be­lu su­gla­snič­kih gru­pa ko­je tre­ba, ne tre­ba ili je bo­lje raz­dvo­ji­ti od­no­sno ne raz­dvo­ji­ti. Me­đu­tim, taj na­iz­gled jed­no­sta­van za­da­tak pret­va­ra se u pra­vu noć­nu mo­ru onog mo­men­ta ka­da za­i­sta za­su­če­te ru­ka­ve i la­ti­te se pro­gra­mi­ra­nja.

Gutenberg

Obra­ti­te pa­žnju na to ka­ko je po­rav­nat sle­de­ći vi­še­stu­bač­ni tekst, ko­ji ujed­no ob­ja­šnja­va osno­ve pre­lo­ma tek­sta.

    • Font: neproporcionalan - imitira font pisaće mašine              
    • Ivice: neporavnata desna ivica
    • Čitljivost: otežana, ružan tekst
    Tipografija se ne bavi samo izgledom pojedinačnih slova. Daleko značajnije je kako su slova poslagana zajedno, jer to direktno utiče na čitljivost teksta. Na pisaćoj mašini svako slovo je iste širine, te je ukupan broj slova koja mogu stati u jedan red
    unapred utvrđen. Pred samim krajem reda, zvonce je označavalo trenutak kada treba doneti odluku šta ostaviti a šta preneti u sledeći red. Iako jednostavan, ovaj postupak tipografski gledano daje katastrofalan rezultat. Nedostaci su brojni: ne
    postoji mogućnost vertikalnog podešavanja veličine slova, širina svih slova je nepromenljivo ista, tekst nikada ne može biti obostrano poravnat. Sve ovo vodi ka najvećem grehu u svetu dobrog dizajna: tekst izgleda ružno i težak je za čitanje.
      • Font: proporcionalan                                            
      • Ivice: neporavnata desna ivica
      • Čitljivost: nešto bolja, zbog prirodnijeg uzajamnog položaja slova
      Očigledno rešenje je korišćenje proporcionalnih fontova, u kojim svaki znak ima svoju širinu. Ovakvi fontovi pružaju dizajnerima široke mogućnosti da izaberu izgled i veličinu slova, i višestruko dobiju na atraktivnosti i čitljivosti teksta.
      Međutim, oni stvaraju novi problem. Broj znakova koji se mogu smestiti u jedan red više nije fiksan, već zavisi od toga koji znaci su upotrebljeni. Kako pri tom izbeći neuredan izgled iskrzane desne strane teksta (uporedite desne strane odlomaka u ovom i
      prethodnom redu s redovima ispod)? Kvalitetan dizajn traži jasno definisane blokove teksta. Kako dobiti "obostrano poravnat" tekst, kad svaka linija može biti proizvoljne širine u zavisnosti od upotrebljenih znakova?
      Ljudsko oko pre svega zapaža oblik reči, i ne primećuje toliko razmake između reči. Povećavanjem ili smanjivanjem razmaka između reči, moguće je
      skupiti ili raširiti red, a da se ne naruši čitljivost. Ako razmaci između reči postanu suviše veliki i stvore ružne praznine u tekstu, takođe postoji mogućnost da se malo
      povećaju i razmaci između samih slova. Međutim, s obzirom da to menja način na koji vidimo reči, ova mogućnost je mač sa dve oštrice.
        • Font: proporcionalan                                         
        • Ivice: poravnata desna ivica
        • Čitljivost:
        Proces kompozicije teksta je veoma kompleksan. Najprostije rečeno, osnovni algoritam se sastoji iz sledećih koraka: računar najpre sabira širinu
        znakova svakog reda, plus i minus jedna reč. Zatim donosi odluku kako da poravna taj red tako što podešava razmak između reči pre nego razmak između
        samih slova. Takođe sabijanje ima prednost nad širenjem. Po donesenoj odluci prelazi na sledeći red.              
        Ceo sistem komplikuju najmanje dve dodatne stvari. Prvo, metrika fontova tretira znake kao obične pravougaonike. U stvari, slova se međusobno veoma razlikuju, pa i idealan razmak između pojedinih
        slova nije uvek isti već zavisi od toga koje slovo dolazi iza. Rešenje ovog problema sastoji se u podešavanju razmaka između slova tako da se preklapaju, to jest manje ili više zadiru u prostor prethodnog slova.
        Profesionalni fontovi sadrže veliki broj parova znakova sa precizno kontrolisanim razmacima zavisno od njihovog redosleda.
          • Font: proporcionalan                                             
          • Ivice: poravnata desna ivica
          • Čitljivost: bez rupa u tekstu, ujednačena "boja" teksta,
          Dru­gi fak­tor ko­ji se mo­ra uze­ti u ob­zir da­le­ko je so­fi­sti­ci­ra­ni­ji i stva­ra mnogo vi­še gla­vo­bo­lja. Po­ne­kad je prak­tič­no ne­mo­gu­će osta­ti u okvi­ri­ma mi­ni­mal­no to jest mak­si­mal­no doz­vo­lje­nog ra­zma­ka iz-
          ­me­đu slo­va i re­či, po­go­to­vo ka­da se ra­di sa us­kim stup­cem. Pret­po­sta­vi­mo da se na kra­ju re­da na­la­zi ne­ka du­ža reč. Sku­plja­nje bi do­ve­lo do pre­te­ra­nog zgu­šnja­va­nja i slo­va bi se preklapala.
          Pre­ba­ci­va­nje u sle­de­ći red osta­vi­lo bi ru­žne ru­pe po tek­stu. Oba pri­stu­pa na­ru­ša­va­ju ti­po­graf­sku "bo­ju" tek­sta, i či­ne ga te­škim a pr­vi čak i ne­mo­gu­ćim za či­ta­nje.
          Rezultat obuhvatne lingvističke analize suglasničkih grupa karakterističnih za srpski jezik jeste hifenacioni modul ugrađen u Spell, sposoban da precizno odredi kako treba podeliti neku reč.

          Hifenacija kao rešenje

          Oči­gled­no, tre­ba pod­eli­ti­ r­eč­. Ali ka­ko?

          Kako podeliti reč
                         na kraju reda,
                              a da nije ručno!

          Ne­ka soft­ver­ska re­še­nja po­ku­ša­va­ju na­do­me­sti­ti ne­mo­guć­nost al­go­rit­ma da po­kri­je sve ne­pra­vil­no­sti sa­ku­plja­njem bi­bli­o­te­ke izu­ze­ta­ka. Me­đu­tim, ta­kav pri­stup ni­ka­da ni­je do­volj­no po­uz­dan, jer di­rekt­no za­vi­si od ažur­no­sti i ve­li­či­ne bi­bli­o­te­ke izu­ze­ta­ka. Kad tre­ba po­de­li­ti r­eč­ ko­ja ni­je me­đu izu­ze­ci­ma do­bi­ja se ro­go­bat­na po­de­la.

          Pr­vo kva­li­tet­no re­še­nje za hi­fe­na­ci­ju po­nu­dio je fi­lo­log Mi­lo­rad Si­mić, u svom pro­gram­skom pa­ke­tu RAS. Po­la­ze­ći od te pri­lič­no kva­li­tet­ne osno­ve i do­da­ju­ći da­lja ino­va­tiv­na re­še­nja do­bi­jen je izu­zet­no pre­ci­zan i brz hi­fe­na­ci­o­ni mo­dul, ugra­đen u pro­gram Spell.

          Hi­fe­na­ci­ja u Spell-u uopšte ne­ma bi­bli­o­te­ku izu­ze­ta­ka. Na­ro­čit po­mak u kvalitetu ose­tan je na po­lju de­lje­nja slo­že­ni­ca, po­lu­slo­že­ni­ca i re­či kod ko­jih se pre­fiks ose­ća kao od­vo­je­ni, ne­sra­sli deo.

          jedno-obrazan a ne jednoo-brazan

          ne-opterećen a ne neo-pterećen

          super-aktivan a ne supe-ra-ktivan