Sep21st

szóelválasztás weben

by  connor

Az ingatlanguru kapcsán kezdtem el gondolkodni azon, hogy hogyan lehetne automatikusan (kiszolgáló vagy kliens oldalon) szóelválasztást végezni. Erre azért van szükség mert ha sorkizárt szöveget akarunk megjeleníteni a weben akkor sajnos nem ússzuk meg a szóelválasztást. Viszont azt nem lehet kiszámolni hogy hova kell tenni az elválasztó jelet, a böngésző hol törné a szót. Erre megoldás a ­ tilde.
Ha az összes lehetséges elválasztási helyre ­ karaktert teszünk és ezt megjelenítjük a böngészőben sorkizárt módban, a böngésző automatikusan elválasztja a szöveget ha a szótaghatár ér a bekezdés szélére. Régóta létezik a libhnj és a Tipográl oldalról letölthető elválasztásiminta-gyűjtemény, de php alól ezeket nem lehet használni, nincs libhnj kiterjesztés php-hoz (pythonhoz találtam egyedül). A fentiek tükrében nincs más feladat mint írni egy kiterjesztést ami a libhnj bindingje. Írtam c-ben és php-ban egy kezdetleges próba programot ami egy adott szöveget feldolgoz és szavanként elvégzi az elválasztást. Így néz ki a kimenet:
http://workshop.connor.hu/tmp/hyphen_example.html
A php program miatt még nem tökéletes, de nem is az volt a cél, mint inkább a lib használatának megismerése ahhoz, hogy kiterjesztést tudjak írni php-hoz.

 

5 Responses to szóelválasztás weben

  1. 9 years ago by cadmagician

    merre lehet elindulni ezzel? ilyen nekem is kell.


  2. 9 years ago by connor

    Hát vagy elkezdesz c-ben írni valami segédeszközt ami használja a libet vagy megvárod még elkészül a kiterjesztés (pecl) a php-hoz (ami szintúgy c-ben készül), vagy megírod magadnak a kiterjesztést.


  3. 9 years ago by cadmagician

    hát ilyen php classt nem lehet hozzá írni? megadod filet, meg a szöveget, és beparsolja. de ez a kiterjesztés lehet jobb, de lehet nem. free lesz? 🙂


  4. 9 years ago by connor

    Meg lehet írni (sőtt van is: http://yellowgreen.de/hyphenation-in-web/ ) php-ban is, de az soha nem lesz olyan gyors mind C-ben írva.


  5. 9 years ago by Nagy Bence

    Egyik ismerősöm, Bärnkopf Bence írt még régebben PHP-ben egy kis alkalmazást, amelyik kezeli a TeX-es elválasztási mintákat:

    http://pastie.org/302969


 

Leave a Reply

Your email address will not be published. Required fields are marked *