I spent the last week rewriting Twintsam's tokenizer from scratch, exactly following the current draft's algorithm. Performance could probably be improved a lot, but I'll first concentrate on the tree building stage.
For the record, Twintsam is written in C# for .NET 2.0, and it is available at http://twintsam.googlecode.com
The next steps will be to implement serializers.Odhad termínu dokončení projektu není zatím dostupný.
HTML5 parsery se nám množí, po Pythonu, Javě a PHP přichází i .NET.
Žádné komentáře:
Okomentovat
Poznámka: Komentáře mohou přidávat pouze členové tohoto blogu.