Back to site
Since 2004, our University project has become the Internet's most widespread web hosting directory. Here we like to talk a lot about web servers, web development, networking and security services. It is, after all, our expertise. To make things better we've launched this science section with the free access to educational resources and important scientific material translated to different languages.

Manipulisanje tekstovima u Jidišu (Yiddish) pod Unix operativnim sistemom

Izbori

Za pisanje Jidiša u Unix-u, imate ove izbore:

  1. Pišite u YIVO transliteraciji i konvertujte, ako želite, u neku drugu formu korišćenjem shraybmashinke-a .
  2. Pišite direktno u Unicode-u, skladišteći vaš fajl u UTF-8 formatu.

Ova napomena se koncentriše na načine na koje da uradite ono što dolazi kasnije.Zaista želite da koristite Unicode na duži rok,jer vam dopušta da kombinujete višestruke jezike u jednom dokumentu,i definiše format prezentacije,a naročito dvosmerni raspored (bidirectional layout).

Pitanja

Fontovi

U Unix-u, koristićete X-Windows sistem. Preporučujem vam da nabavite Markus Kuhn's fonts (fontovi Markus-a Kuhn-a) ukoliko ih već nemate u vašoj X-Windows distribuciji. Prisutni su u X11R6.4. Font -misc-fixed-medium-r-normal--20-200-75-75-c-100-iso10646-1 ima moje modifikacije da ga učine kompletnim i čitljivim za Jidiš. Za TrueType fontove,preporučujem FreeSans.

xkb

Umesto da koristite X-windows keymaps (mape tastera), možete koristiti X keyboard (tastatura) ekstenziju, poznatu kao xkb. Ova mogućnost vam dopušta da utvrdite nekoliko rasporeda tastature (keyboard layouts) i da se prebacujete između njih. Ova mogućnost je nezavisna od svih X-windows aplikacija. Ne daje vam prevode višestrukih tastera. Ovde su uputstva za Ubuntu Linux.

  1. Uverite se da nemate XKB_DISABLE podešen u varijabli vašeg okruženja.
  2. Kao root (koren), na /usr/share/X11/xkb/symbols/us okačite sadržaje ovog fajla .
  3. U /usr/share/X11/xkb/rules, stavite sledeći red na kraju us-a: sekcija (oko reda 269) podejdnako od base.lst i evdev.lst:
  4.  yiddish         us: Yiddish 
  5. U /usr/share/X11/xkb/rules, stavite sledeći red unutar "us" , u listi varijanti posle ruske fonetičke varijante,podjednako u base.xml i evdev.xm::
  6.        <variant>
              <configItem>
                <name>yiddish</name>
                <description>Yiddish</description>
                <languageList><iso639Id>yid</iso639Id></languageList>
              </configItem>
            </variant>
    
  7. Pokrenite setxkbmap us
  8. Koristeći gnome-keyboard-properties, pod "Layouts" tab-om,
      1. Dodajte layout (raspored): By language → Yiddish → USA Yiddish (po jeziku-Jidiš-američki jidiš)
      2. Podesite Layout Options (opcije rasporeda) tako da znate tastere za promenu layout-a. Možda ćete želeti da koristite tastaturu LED da prikažete alternativni layout.
  9. Pokrenite setxkbmap -option grp:switch,grp:alts_toggle
  10. Sada možete koristiti (1) šta god ste podesili u prethodnom koraku za prebacivanje layout-a, (2) taster shift za prebacivanje nivoa i (3) desni-alt taster za prebacivanje grupa (nekolicina tastera imaju drugu grupu simbola). Tastatura izgleda kao ovaj pdf fajl . Ako treba da ukucate prethodno ne-sastavljena slova,odvajajući alef od njegovog pasekh, na primer,koristite samoglasnike pozicionirane na Q tasteru ili simbole grupe dva na drugim različitim tasterima.

xterm

Verzije xterm-a od 2000. razumeju UTF-8. Možete nabaviti xterm i sami ga kompilirati ako vam treba; trebalo bi da utvrdite ./configure --enable-wide-chars. Limitations/bugs:Xterm nema nikakvu BIDI podršku. On sastavlja karaktere prostim preštampavanjem,osim ako može da nađe prethodno sastavljeni karakter. Stavlja prethodno sastavljene karaktere u cut buffer, ne u posle-sastavljene, kao što bi trebalo. Podržavajući fajl: Možda ćete želeti da dodate ovu informaciju vašem ~/.Xdefaults fajlu radi podrške (1) finom Unicode fontu (u "medium" font veličini, i (2) kodiranju tastature za Jidiš (enable/disable(osposobi/onesposobi) sa Mode_switch tasterom).

Yudit

Gaspar Sinai-ev Yudit editor vam dopušta da editujete UTF-8 tekst. Ovde je screenshot (snimak ekrana) . Izgradio sam mapiranje tastature za to što je deo distribucije. Ovo mapiranje ima front-end procesor za višestruke tastere,tako da možete da kucate “sh” ako želite shin. Jidiš mapiranje takođe umeće shtumer alef posle razmaka pre određenih samoglasnika. Yudit takođe funkcioniše sa mojim XIM-om. Yudit ima sopstvenu truetype-font display mašinu, tako da ne morate da imate jednu u svom X11. Yudit ima internacionalizaciju, tako da možete imati sve poruke editora prezentovane u Jidišu. Yudit radi pravo BIDI prikazivanje. Trebaće vam da podesite vaš ~/.yudit/yudit.properties fajl da biste dobili redove nešto poput ovoga:

Možda ćete želeti Cyberbit font. On izostavlja nekolicinu karaktera, koje možete dobiti dodavanjem CyberBitMods-a putanjama fonta. Možda ćete takođe želeti caslr font , iako nije baš toliko lep za Jidiš. Yudit ima mogućnost generisanja PostScript output-a. Postoji verzija Yudit-a koja radi na Win32 platformama koju možete naći ovde . Kratka uputstva za instalaciju Win32: (1) Pokrenite izvršivu koju download-ujete za instalaciju programa (njeno ime se poklapa sa njenim obrascem): yudit*.exe (2) instalirajte bitmap fontove pokretanjem programa koji se poklapa sa ovim obrascem: bitmap_fonts*.exe (3) Korišćenjem bilo kog tekst editora, modifikujte Program Files\Yudit\Config\yudit.properties kako sledi:

yudit.datapath=C:\Program Files\Yudit\data
yudit.fontpath=C:\WINNT\FONTS [for Win2000]
yudit.fontpath=C:\WINDOES\FONTS [for Win98]

Vim

Bram Moolenaar-ov Vim editor je freeware verzija sve popularnijeg vi editora; radi sasvim dobro podjednako na Unix-u i Win32. Počevši od verzije 6.0,ima prilično dobru podršku za Unicode i Jidiš (Yiddish). Koristite ga uporedo sa xterm-om (kao gore) ili u gvim modu (premošćavajući xterm) da dobijete poptuno iskorišćenje. Ovde je screenshot (snimak ekrana) gvim interface-a. Za xterm vam ne trebaju stvari oko mapiranja specijalnih karaktera ; koristite Vim keymap umesto toga. Postavite ove komande u ~/.vimrc:

Želećete da znate o sledećim komandama:

Ako planirate da mešate jezike, predlažem vam da koristite višestruke prozore, jedan sa uključenim rtl-om, a drugi bez. Limitations/bugs (ograničenja/bug-ovi): Vim nema nikakvu BIDI podršku i malo je verovatno da će dobiti ikakvu. Podržavajući fajl:Nabavite ovaj fajl i unesite ga u vaš home direktorijum. On uključuje proveru pravopisa za romanizovani i Unicode iddish i makroe tastature (keyboard macros) (puni front-end procesor) za Unicode Yiddish.Traži najmanje verziju 6.0. Pročitajte README fajl (ima uputstva za Unix i Win32).

AbiWord

AbiWord je potpuno funkcionalni (full-featured) (eventualno) procesor reči (word processor), ne samo tekst editor.Koristi XML kao svoj preferencijalni fajl format, ali može da uvozi i izvozi formatirane fajlove i tekst fajlove u Unicode-u. Najskorije verzije AbiWord procesora reči rukuju BIDI-em. Takođe mogu da izvedu oblikovanje hebrejskih slova,što znači da su konačna slova automatski generisana,ali rezultirajući fajl sadrži medijalna,a ne konačna slova; ostavite ovu funkciju isključenu. AbiWord ima verzije za Unix, MacOS, i Win32; svi imaju sličan izgled i osećaj. Ovde je screenshot .

Veliki deo ovoga što sledi je zastareo; AbiWord je brzo pokretna meta. Varljivo je podešavati fontove za AbiWord za Unix/X-Windows.

  1. U njegovom direktorijumu fontova (tipično /usr/share/AbiSuite/fonts, treba da izgradite pod-direktorijum utf-8.
  2. Stavite kopiju ili link u razumne true-type fontove,kao što je arial.ttf.
  3. Pokrenite ttmkfdir u tom direktorijumu (pronađite ttmkfdir ovde ). Ovaj program ekstrahuje imena fontova iz vaših ttf fajlova i gradi fonts.scale.
  4. U rezultirajućem fajlu fonts.scale, napravite po jedan novi red za svaki font (verovatno je da će ih već biti nekoliko sa blago različitim imenima kodiranja). Na ovom novom fajlu,podesite kodiranje,što je -iso sufiks, da kažemo iso10646-1. Ovaj sufiks kaže "Ja sam Unicode font".
  5. Pokrenite mkfontdir u tom direktorijumu. Ovaj program gradi fonts.dir, što je X-Windows-u potrebno da bi razumeo sadržaj.
  6. U AbiWord-ovom bin direktorijumu, tipično /usr/share/AbiSuite/bin, pokrenite ttfadmin.sh /usr/share/AbiSuite/fonts/utf-8 ISO-10646-1. Ovaj program utvrđuje pomoćne fajlove *.u2g i *.t42 za svaki font. AbiWord-u su potrebni ovi pomoćni fajlovi da razume fontove.
  7. Vaš X-Windows server mora da razume oba tipa fontova koje obično koristi AbiWord ,a takođe i True Type fontove, jer samo je Arial True Type font, koliko ja znam, naširoko dostupan i podržava Yiddish. Treba vam najmanje verzija 4.1.0 od X-Windows-a. U njenom fajlu konfiguracije (tipično /etc/XF86Config), treba da imate
  8.   Load  "type1"
      Load  "xtt"
    
  9. u "Module" sekciji. Ako treba da dodate te redove, treba da restartujete X-Windows da biste za rezultat dobili da promene imaju efekta.
  10. Svaki put kada pokrenete AbiWord, trebalo bi prvo da podesite LANG varijablu okruženja na yi.utf-8. .utf-8 deo ukazuje na to koji font da podesite za upotrebu. Prvi deo kaže, “Preferiram Yiddish sasvim".
  11. Kada čitate UTF-8 teskt fajl, pročitajte ga kao tip kodiranog teksta, a zatim selektujte UTF8 kodiranje u rezultirajući dijalog.
  12. Ne znam dobar način za mapiranje tastature.Ja koristim xmodmap i prebacuje višestruke udarce tastera da biste dobili samoglasnike na alef-u ili redove iznad begova ili bilo koji drugi višestruki -utf8 karakter. Mogu vam dati relevantne xmodmap fajlove i mali tk program koji vam dopušta da se smenjujete među njima.
  13. Kada izađete iz AbiWord-a, treba da “od-podesite” LANG varijablu i takođe uklonite ekstra direktorijume iz vaše putanje fonta koju AbiWord ponekad ostavlja uokolo:xset fp- /usr/share/AbiSuite/fonts/ i xset fp- /usr/share/AbiSuite/fonts/utf-8/.

Radim na proveri pravopisa (spelling checker) za AbiWord/Yiddish. Imam fajlove za proveru pravopisa; pitajte me za detalje. Trenutno postoje sledeći problemi:

  1. Navođenje AbiWord-a da razume spellcheck (provera pravopisa) fajlove za jezike kao Yiddish koji nisu na njegovoj aktuelnoj listi. Ja ih prosto zovem finskim fajlovima i podešavam svoj jezik na Finski.
  2. Interaktivni meni,kada se pronađe pogrešan pravopis,koristi ne-utf8 font, tako da je sve što vidite trtljanje.

mule

Mule 2.3 je ekstenzija za Gnu emacs 19.28 editor. Ne podržava unicode, ali podržava razne jezički specifične stranice koda. Koristi sopstveni naročiti “junet” format fajla za višejezične fajlove. Savetujem vam da je izbegavate.

emacs

Postoji eksperimentalna (10/2003) verzija emacs-a koja obrađuje UTF8 i naovodno obrađuje BIDI prilično dobro; to je na http://www.m17n.org/emacs-bidi/ . Emacs je potpuno funkcionalan (full-featured) editor, ali je potrebno mnogo truda da se nauči. Update (ažuriranje) (7/2008): dok BiDi podršak još uvek nije dostupna za Emacs (osim za taj eksperimentalni i pokretanje emacs -nw -a (bez grafika) u za BiDi-sposobnom terminal emulator-u),možete koristiti poor-mans-bidi.el , koji pokreće alate komandne linije fribidi ili bidiv kao pod-proces za transformaciju logičkog input-a u vizuelni output u buffer-u ogledalu. Postoji takođe input metoda za Yiddish na Emacs-u koja rukuje input-om nalik YIVO-u, između ostalih, napisana od strane Niels-a Giesen-a. Od avgusta 2010., razvojna grana Emacs-a podržava dvosmerni display i zastareli poor-mans-bidi.

KDE

KDE 3 je "okruženje", uključujući window manager (“upravljač prozorom”) i mnoge aplikacije. Njegova aplikacija za obradu reči se zove KOffice. KOffice podržava BIDI i različita kodiranja,uključujući Unicode.

Rezime

Proizvod BIDI mapiranja tastature nivo editora
xterm ništa pojedinačni taster bez editing-a
Vim manuelno za buffer; utiče samo na display višestruki taster; dobra YIVO transkripcija puni editing (koristite moj priključak za proveru pravopisa za romanizovani ili Unicode Yiddish); običan tekst samo; monospace display samo
Yudit automatski; utiče samo na display višestruki taster; dobra YIVO transkripcija prihvatljivi editing; običan tekst samo; dopušta True Type i ne-monospace fontove; generiše PostScript.
KOffice ? ? puna "obrada reči"; umeće kodove formata; može da iznese (output) običan tekst ili XML ili neke druge forme.
AbiWord automatski; utiče samo na display ne puna "obrada reči"; umeće kodove formata; može da iznese (output) običan tekst ili XML ili neke druge forme.




Published (Last edited): 27-03-2013 , source: http://www.cs.engr.uky.edu/~raphael/yiddish/unix.html