Back to site
Since 2004, our University project has become the Internet's most widespread web hosting directory. Here we like to talk a lot about web servers, web development, networking and security services. It is, after all, our expertise. To make things better we've launched this science section with the free access to educational resources and important scientific material translated to different languages.

Arabica XML i HTML paket alatki za obradu

Arabica je XML i HTML paket alatki za obradu, koji pruža SAX, DOM, XPath, i XSLT implementacije,pisane u Standard C++.

  • SAX je event-based XML API za obradu. Arabica je cela SAX2 implementacija, uključujući i opcionalni interfejs i pomoć. Pruža uniformisane SAX2 omotače za Expat parser, Xerces, Libxml2 i, na Windowsu, za Microsoft XML parser .
  • DOM je platforma - i jezičko neutralan inerfejs koji modelira XML dokument kao drvo ili čvor, definisanim W3C . Arabica implementira DOM Level 2 Core na vrhu SAX lejera.
  • XPath je jezik za obraćanje delovima XML dokumenta. Arabica implementira XPath 1.0 preko njegove DOM implementacije.
  • XSLT je jezik za transformisanje XML dokumenata u druge XML dokumente. Arabica gradi XSLT preko njegovih XPath motora.
  • Kao dodatak XML parseru, Arabica uključuje Taggle, HTML parser izveden iz TagSoup-a .

Arabica je napisan u Standard C++ i trebao bi da bude prenosiv za većine platformi. Parametrisan je na string tipu. Van kutije, može pružiti UTF-8 šifrovani std::string ili UTF-16 šifrovani std::wstrings, ali se lako mogu prilagoditi za arbitarni tip stringova.

Arabica je dostupna za download pod BSD licencom .

Najnovije vesti

[RSS 0.91]
Wednesday 28 November, 2012
#Arabica izdanje- 2012 Novembar

Otkako je stavljan Arabica source na GitHub izgleda da je došlo do velike uzburkanosti. Možda je to naravno slučajnost, ali sam primio nekoliko mailova u prošlih par nedelja. Jedan od tih mailova mi je ukazao na nešto što sam stalno odlagao - parametriranje XSLT motora na string tipu. Ostatak biblioteke sam uspeo da bude koliko-toliko string tipa, dozvoljavajući vamplug in std::string, std::wstring, ili koju god drugu klasu stringa preferirate. (Tokim testiranja sam koristio tip stringa bez funkcija javnog člana.) XSLT motor je bio poslednji koji se držao, ali ne više i tako je bohe.

Ako koristite XSLT motor ono što znači sada je da vi tamo gde ste pisali

       Arabica::XSLT::StylesheetCompiler compiler = ...
       std::auto_ptr<Arabica::XSLT::Stylesheet> stylesheet = ...

sada morate da pišete

       Arabica::XSLT::StylesheetCompiler<std::string> compiler = ...
       std::auto_ptr<Arabica::XSLT::Stylesheet<std::string> > stylesheet = ...

Ako niste koristili XSLT motor jer ostatak vaše aplikacije koristi std::wstring, sada vas ništa ne zadržava.Samo napred!

Source tar.bz2
http://sourceforge.net/projects/arabica/files/arabica/November-12/arabica-2012-November.tar.bz2/download

Source tar.gz
http://sourceforge.net/projects/arabica/files/arabica/November-12/arabica-2012-November.tar.gz/download

Source zip
http://sourceforge.net/projects/arabica/files/arabica/November-12/arabica-2012-November.zip/download

_________________________________________________________________________________________________________

Promene i bug popravke

DOM

      • Proširite entitete referenca
      • getLineNumber/getColumnNumber vratite u size_t
      • rukujte [dtd] sa pseudo-entitetom ispravno
      • raznorazne, uglavnom opskurne,DOM usglašene popravke

XSLT

      • XSLT je sada, kao ostatak Arabica, parametriziran na string tip

Gradja i instalacija

      • Fajlovi sa rešenjem i projekatom za Visual Studio 2012 su dostupni
      • Donirani CMake ugradjeni fajlovi su uključeni

 

[Dodajte komentar]
Petak 07 Septembar, 2012
#Arabica na GitHub
Preselio sam Arabica source kod na GitHub.
[Dodajte komentar ]
Četvrtak 30 Decembar, 2010
#DOM Testovi usaglašenosti

Ovih nekoliko dana, radio sam na Arabica's DOM usaglašenosti. Do sada je bila bazirana u potpunosti na mom čitanju iliti ne na bitnim W3C preporukama. Uvek sam bio prilično uveren da sam u pravu, ali nedavno me je malo indirektnog guglovanja podsetilo na W3C DOM Conformance Test Suites i pomislio sam "što da ne".

W3C testovi su definisani XML i potom transformisani u kod korsteći XSLT. Dolazi sa stylesheet-ovima za generisanje Java JUnit testova i Javascript JSUnit testova.Smišljanje kako generisati CppUnit kod Arabica-stila traje nekoliko minuta, a dobijanje koda za sastavljanje i pokretanje traje možda malo duže od toga. Sramotno, neki od postojećih DOM kodova se nisu sastavili i niko to nije ni primetio.Preispitivanje doctipa za entitete nije tako često pretpostavljam.

Kada se to završi, na moje olakšanje, skoro svih 500 čudnih testova na prvom nivou Core paketa prodju iz prve. Većina ovih koji se ne oslanjaju na učitavanje spoljašnjeg DTD, i oni koji ostaju su prvenstveno oko ponašanja entiteta referenci i dečijih čvorova za atribute. Dobro je da se sve sredilo.

Hvala onima koji su sastavili ove testove. Mora da je bilo jako zamorno, ali svi testovi koje sam ja pogledao u svakom detalju su dobri i razumni.

Prećićemo na drugi nivo Core-a tokom ovog kursa, ali žudim za tim da se još malo bakćemo sa Arabica XSLT motorima.

 

[Dodaj komentar]
Nedelja 24 Oktobar, 2010
#Arabica izdanje - 2010 Novembar

Iz nikakvog posebnog razloga sem što ljudi volje oficijalna izdanja i nije bilo nijednog dug 2010-Novembar kada je još uvek oktobar.Nema velikih promena u novom izdanju, samo nežne akumulacije većeg rada na Arabica XSLT procesoru sa bug popravkama.

Source tar.bz2
http://sourceforge.net/projects/arabica/files/arabica/November-10/arabica-2010-November.tar.bz2/download

Source tar.gz
http://sourceforge.net/projects/arabica/files/arabica/November-10/arabica-2010-November.tar.gz/download

Source zip
http://sourceforge.net/projects/arabica/files/arabica/November-10/arabica-2010-November.zip/download

_________________________________________________________________________________________________________

Promene i bug popravke

SAX

      • MSXML izuzeci su prijavljeni, i više ne kvare skladište
      • nadogradjeno za najnovija izdanja za vežbanje

DOM

      • Ispravljene set/get/removeNamedItemNS funkcije
      • splitText popravljen
      • popravljen setAttributeNodeNS
      • dupli delete kada uklanjate i ponovo dodajete atribute popravljeno
      • operator<< proširen za šire streamove
      • operator<< ispravno generiše atomatski prefikse razmaka imena za atribute

XPath

      • Optimizacija u proceni izraza
      • varijable sada,opcionalno, mogu biti rešene za vreme sastavljanja

XSLT

      • xsl:ključ i ključ() implementirani
      • cdata-section-elements podržani
      • literalni result element (tj. ugradjeni stylesheetovi) implementirani
      • optiminizirana manja brzina
      • xsl:sort/@lang još uvek nije podržan, ali sada izdaje pre upozorenje nego izuzetak
      • function-available implementirana
      • element-available stub implementiran
      • xsl:sort atributi tačno implementirani kao atributne
      • dozvoljni i ignorisani atributi u stranim imenima
      • verifikovana kvalifikovana imena korišćena u stylesheetu (npr. kao šablonska imena) imaju prefikse koji povezuju
      • uzmite prednost nad nalogom kada rešavate šablonske nazive
      • odbija u xsl: podudaranje ključa i koristi izraze

Gradja i instalacija

      • Rešenja i projektni fajlovi za Visual Studio 7 (2003) i 8 (2005) više nisu dostupni. Skript za njihovo generisanje iz VS9 fajlova je dostupan. Rezultati nisu zagarantovani, ali sve je radilo dobro u prethodnim upotrebama.

Ostale sitnice

      • Gradi bez upozorenja
      • xgrep primer aplikacije sada izbacuje takodje i example application now also outputs non-nodeset rezultate.

_________________________________________________________________________________________________________

 

Nikada nisam ni pisao beleške o izdanjima pre marta 2009. Zarad naše dobrobiti,oni su

XSLT

      • generate-id implementiran
      • primećeni kružni ulazi i sadržaji
      • pobegli tabovi, povraćaj transporta i linije feeda kada izbacuje atributne vrednosti

Ostale sitnice

      • Poboljšan URI parsing

 

[Dodaj komentar]
Četvrtak 05 Novembar, 2009
#Arabica skladište izvornog koda

Kroz svoju potpunu glupost uspeo sam da pokvarim skladište Arabica podverzije Srećom koristim Bazaar kao svog omiljenog front-end klijenta, tako da sam imao klona celog skladišta u radnom direktorijumu. Arabica izvorni kod je sada tačno skladištan u Bazaar skladištu.

Skadište može bit pretraženo i možete da uzmete svoju radnu kopiju preko HTTP-a koristeći

     bzr branch http://jezuk.dnsalias.net/arabica-bzr/trunk

Write-access koji koristi bzr+ssh je dostupan na zahtev..

 

[Dodaj komentar]
Starije vesti …

Kontaktirajte Vaša pitanja, zahtevi, komentari, update i nalepnice su dobrodošle.Možete me kontaktirati na jez@jezuk.co.uk .



Creative Commons License
This work is licensed under a Creative Commons Attribution-ShareAlike 3.0 Unported License.



Published (Last edited): 20-02-2013 , source: http://jezuk.co.uk/cgi-bin/view/sax