Az ingatlanguru kapcsán kezdtem el gondolkodni azon, hogy hogyan lehetne automatikusan (kiszolgáló vagy kliens oldalon) szóelválasztást végezni. Erre azért van szükség mert ha sorkizárt szöveget akarunk megjeleníteni a weben akkor sajnos nem ússzuk meg a szóelválasztást. Viszont azt nem lehet kiszámolni hogy hova kell tenni az elválasztó jelet, a böngésző hol törné a szót. Erre megoldás a ­ tilde.
Ha az összes lehetséges elválasztási helyre ­ karaktert teszünk és ezt megjelenítjük a böngészőben sorkizárt módban, a böngésző automatikusan elválasztja a szöveget ha a szótaghatár ér a bekezdés szélére. Régóta létezik a libhnj és a Tipográl oldalról letölthető elválasztásiminta-gyűjtemény, de php alól ezeket nem lehet használni, nincs libhnj kiterjesztés php-hoz (pythonhoz találtam egyedül). A fentiek tükrében nincs más feladat mint írni egy kiterjesztést ami a libhnj bindingje. Írtam c-ben és php-ban egy kezdetleges próba programot ami egy adott szöveget feldolgoz és szavanként elvégzi az elválasztást. Így néz ki a kimenet:
http://workshop.connor.hu/tmp/hyphen_example.html
A php program miatt még nem tökéletes, de nem is az volt a cél, mint inkább a lib használatának megismerése ahhoz, hogy kiterjesztést tudjak írni php-hoz.
merre lehet elindulni ezzel? ilyen nekem is kell.
Hát vagy elkezdesz c-ben írni valami segédeszközt ami használja a libet vagy megvárod még elkészül a kiterjesztés (pecl) a php-hoz (ami szintúgy c-ben készül), vagy megírod magadnak a kiterjesztést.
hát ilyen php classt nem lehet hozzá írni? megadod filet, meg a szöveget, és beparsolja. de ez a kiterjesztés lehet jobb, de lehet nem. free lesz? 🙂
Meg lehet írni (sőtt van is: http://yellowgreen.de/hyphenation-in-web/ ) php-ban is, de az soha nem lesz olyan gyors mind C-ben írva.
Egyik ismerősöm, Bärnkopf Bence írt még régebben PHP-ben egy kis alkalmazást, amelyik kezeli a TeX-es elválasztási mintákat:
http://pastie.org/302969