čtvrtek 27. prosince 2007

Funkce getElementsByClassName má již několik implementací

Nedávno byla oznámena implementace funkce getElementsByClassName ve WebKitu. Po její implementaci v Opeře (dle Wikipedie již v připravované verzi 9.5) a implementaci v chystaném Firefoxu 3 máme opět trojku prohlížečů S.O.F. (neboli Safe Our Fear) kompletní.

Funkce getElementsByClassName je součástí specifikace HTML5, konkrétně části rozšiřující stávající DOM2 HTML. Své popularity se dočkala zejména s rozšířením tzv. přístupu unobtrusive JavaScript, který se snaží o lepší oddělení obsahu HTML stránky od popisu jejího chování pomocí JavaScriptu, a který výběr značek podle nastavené třídy hojně používá.

Funkce getElementsByClassName zpopularizovala, když se stala součástí trendových JavaScriptových knihoven, prostřednictvím kterých ji weboví vývojáři již delší dobu používají. Není divu, že někteří po jejím začlenění do DOM už nějaký čas volali.

Jelikož nativní implementace getElementsByClassName je rychlejší než jak její stávající JavaScriptová implementace, tak její implementace pomocí XPath, bude jistě v nových verzích trendových JavaScriptových knihoven využita.

Je to další ukázka, kdy nevadí, že v některých prohlížečích není novinka HTML5 dosud implementována. (Ostatně právě s tímto přístupem začala být HTML5 specifikace vytvářena.) Weboví vývojáři používající některou knihovnu (např. prototype) budou tvořit aplikace fungující všude. Ale v prohlížečích, které mají nativní podporu getElementsByClassName, bude aplikace běhat o něco rychleji.

pondělí 24. prosince 2007

Seznámení s HTML5 na Intervalu

Interval.cz nám na štědrý den nadělil dárek v podobě překladu Seznámení s HTML 5 původně vydaném na A List Apart.

Text od Lachlana Hunta (člen HTML WG i WHATWG) do češtiny přeložil Vilém Málek.

HTML WG nám svůj dárek nadělí sice až v lednu v podobě prvního draftu HTML5. Každopádně já se už teď moc těším.

Pěkné Vánoce všem.

úterý 11. prosince 2007

Kam zmizelo OGG?

Po Internetu se rozšiřují zprávy o tlaku ze stran komerčních společností, kterým se podařilo ze specifikace HTML5 vyřadit doporučení OGG kodeku.

Nestihl jsem si ještě přečíst všechny diskuse týkající se této změny, ale zprávy zmiňující se o nátlaku mi připadají poněkud zaujaté a vyjádřil jsem to i na Rootovi.

Celý shon je pro tuto (jistě důležitou, ale ne definitivní) změnu:
- <p>User agents should support Ogg Theora video and Ogg Vorbis audio,
- as well as the Ogg container format. <a
- href="#refsOggTheora">[THEORA]</a> <a
- href="#refsOggVorbis">[VORBIS]</a> <a href="#refsOgg">[OGG]</a></p>
- <!-- (it's not a MUST because some vendors may have legal reasons
- why they can't or won't support it, and there's no point making them
- non-conforming when they have no choice in the matter) -->
+ <p class="big-issue">It would be helpful for interoperability if all
+ browsers could support the same codecs. However, there are no known
+ codecs that satisfy all the current players: we need a codec that is
+ known to not require per-unit or per-distributor licensing, that is
+ compatible with the open source development model, that is of
+ sufficient quality as to be usable, and that is not an additional
+ submarine patent risk for large companies. This is an ongoing issue
+ and this section will be updated once more information is
+ available.</p>

Tedy místo stávajícího doporučení OGG:
User agents should support Ogg Theora video and Ogg Vorbis audio, as well as the Ogg container format
se zde objevila zmínka o potřebě nalezení společného videa pro web bez jeho bližší specifikace. Není divu, že to fanouškové OGG formátu těžce nesou.

Je zajímavé, že kritikové tuto změnu označují za nebezpečí rozmachu DRM a uzavřených formátů, aniž by si ověřili, že editor Ian Hickson, který tuto změnu provedl, je ve skutečnosti dlouholetý fanoušek free software.

Požadavek vznesl zástupce Nokie s tím, že by se doporučení OGG nemělo dostat do prvního draftu, k jehož vydání se HTML WG snad již někdy konečně odhodlá.

Nic nebrání tomu, aby se po zralé úvaze doporučení OGG do HTML5 opět dostalo, a může se tomu tak i stát, ale určitě to bude po pečlivém výběru z dostupných možností. Nepochybuji, že u vybrané možnosti bude brána v úvahu i její implementace v prohlížečích spadajících do free software a nejen proto, že je do něj fanda editor specifikace.

Níže pár odkazů pro ty, kdo si to chtějí pročíst detailněji:
Delete "should support Ogg" clause before publishing FPWD?
Removal of Ogg is *preposterous* (celé vlákno)

Canvas prošel hlasováním

O značce canvas, která je již dnes implementována v některých prohlížečích, jsem již opakovaně psal. Nedávno v HTML WG proběhlo hlasování, které mělo určit, zda canvas bude nebo nebude obsažen v HTML5.

Zde jsou výsledky:
pro 40
proti 10
k většině 7
zdrželi se 3

Dan Connolly výsledky rozebírá a potvrzuje, že alespoň prozatím canvas v HTML5 zůstává:
Despite lack of consensus, unless and until new information arises that merits reconsidering the issue, we are resolved to close ISSUE-15 immediate-mode-graphics by accepting a requirement for an immediate mode graphics API and canvas element.
Nicméně argumenty proti mohou být ještě v budoucnu vzneseny. Mezi nimi se opakovaně objevuje názor, že by canvas měl být řešen mimo HTML WG a tedy mimo specifikaci HTML5.

Z pohledu webových vývojářů je ve výsledku jedno, kdo a kde canvas specifikuje, důležitá je konzistentní podpora v prohlížečích.

Já sám jsem z této diskuse trochu zmatený. Ian Hickson již dříve poznamenal, že canvas patří mezi nejzralejší části specifikace a začíná být běžně používaný (a to dokonce většími hráči, je používán např. v Yahoo! Pipes). Diskuse, zda takový prvek vůbec do specifikace zahrnout či nikoliv mi připadá jako postavená na hlavu.

úterý 4. prosince 2007

O HTML5 na A List Apart

Na A List Apart vyšel článek A Preview of HTML 5, jehož autorem je Lachlan Hunt (aktivní člen WHATWG i HTML WG nedávno nastoupivší u Opera Software).

Lachlan připomíná okolnosti vzniku HTML5 a shrnuje základní body připravované specifikace. V případě, že byste raději přehledný text v češtině, přečtěte si články Davida Majdy na Lupě.

neděle 2. prosince 2007

3D canvas pro Firefox

Po Opeře, která vydala verzi s 3D canvasem přišel nedávno s třetí dimenzí i prohlížeč Firefox. Zatím v podobě rozšíření pro Firefox 3.x.

Autor implementace Vladimir Vukićević o ní říká:
There are two contexts provided by the extension. "moz-gles11" follows the OpenGL ES 1.1 spec very closely, providing an almost identical API and feature set, and "moz-glweb20" follows OpenGL ES 2.0 closely. Both are implemented directly on top of desktop OpenGL, so you must have support for at least OpenGL 1.5 on the desktop for the "moz-gles11" context and OpenGL 2.0 for the "moz-glweb20" context.
Na rozdíl od Opery, která zvolila návrh vlastního jednoduchého API se 3D rozhraní Firefoxu drží standardu OpenGL. To jej více přibližuje stávajícím tvůrcům OpenGL aplikací, ale činí jej cizí webovým vývojářům (přiznejte se, kdo z vás umí OpenGL?).

Vlado se domnívá, že se objeví nadstavbové knihovny, které OpenGL rozhraní v sobě skryjí a nabídnou webovým vývojářům jednoduché ovládání.

Jaký přístup byste preferovali vy?

(via: Vlad1.com)

úterý 27. listopadu 2007

Základní principy HTML

Pracovní skupina pro HTML včera vydala svůj první dokument. Jedná se o HTML Design Principles (first draft) neboli základní principy, jimiž se bude řídit vývoj hlavního jazyka webu v připravované specifikaci HTML5.

Principy jsou seřazeny do čtyřech skupin. Pokusil jsem se je přeložit do češtiny:

Kompatibilita
Užitečnost
Interoperabilita
Přístup pro všechny

Ze seznamu by mělo být jasné, kam HTML5 ideově míří. Ke každému bodu nabízí originální dokument podrobnější vysvětlení.

Pokud dokument pečlivě přečtete, jistě si všimnete i malého náznaku byrokracie W3C. Například onen detailní rozbor hlasování v úvodu, kolik hlasů bylo pro a kolik proti.

Osobně bych místo těchto principů nejraději viděl rovnou specifikaci tak, jak to dělá WHATWG, která vydala první draft HTML5. O efektivitě pracovních skupin W3C svědčí jimi vydané dokumenty a připomínám, že tento dokument je jediným, který od svého březnového založení HTML WG vyplodila. Doufám, že příští rok bude pro HTML WG plodnější.

pondělí 26. listopadu 2007

HTML5 specifikace v PDF verzi

Ode dneška přibyla ke specifikaci HTML5 její PDF varianta ve formátu A4 i Letter.

A já dodávám KONEČNĚ!

U W3C specifikací to nebývá častým zvykem, ale možnost čtení a vyhledávání v lokálně staženém PDF mi chyběla. (Zde, ač nerad, musím připustit, že u takto rozsáhlého dokumentu je otevření a práce s PDF znatelně rychlejší než s HTML verzí.)

HTML5 v A4 formátu má nyní 495 stránek (viz též jarní debata o jejím rozsahu) a necelých 3 a půl mega.

Nezapomeňte, že specifikace HTML5 se stále vyvíjí, a stažené PDF bude pomalu zastarávat, proto si ho občas zaktualizujte.

neděle 25. listopadu 2007

Canvas v Opeře dostal třetí dimenzi

Opera Software vydala experimentální build svého prohlížeče obsahující canvas s 3D rozhraním. Že Opera Software na 3D canvasu pracuje bylo známé již od jara, kdy Håkon Wium Lie předvedl na svém notebooku první ukázku, ale vše bylo až doteď schováno pod pokličkou.

Pokud si tento build Opery stáhnete, můžete se kochat 3D vykreslováním samotného prohlížeče bez pomocí pluginů, např. na stránce s rotující kostkou.

Zde musím zdůraznit, že HTML5 specifikuje značku <canvas> coby malířské plátno obsahující pouze 2D vykreslování a definuje způsob jeho rozšíření o další vykreslovací módy (a právě toho využívá Opera svým "opera-3d" módem), cituji:
This specification only defines one context, with the name "2d". If getContext() is called with that exact string for this contextId argument, then the UA must return a reference to an object implementing CanvasRenderingContext2D. Other specifications may define their own contexts, which would return different objects.

Vendors may also define experimental contexts using the syntax vendorname-context, for example, moz-3d.
O 3D grafiku v prohlížeči je ovšem velký zájem a tak se již dnes objevují pokusy o použití canvasu pro 3D, které používají dostupné 2D rozhraní canvasu a o onen "3D vzhled" se postarají výpočty v JavaScriptu.

Je až neuvěřitelné, jakých kvalit lze touto cestou dosáhnout i při zachování jaktakž použitelné rychlosti (často je to ovšem již na hranici). Pokud jste ještě nehráli Dooma v prohlížeči, tak se na malou ukázku Dooma pomocí 2D canvasu podívejte.

Canvas s 3D rozhraním dokáže totéž mnohem rychleji. Výpočty grafiky v něm nemá na starosti JavaScript, ale kód prohlížeče (zkompilovaný a mnohem rychlejší), navíc lze využít možností hardwarového zrychlení grafických karet.

Podle Anne Van Kesterena se přístup Opery k 3D canvasu trochu liší od přístupu Mozilla Foundation, která se implementací 3D canvasu rovněž zabývá. V tuto chvíli to nevadí, zatímco 2D canvas se nám pomalu stává realitou (podporuje ho trojka prohlížečů S. O. F. a pro IE existuje jeho emulace), 3D canvas ještě nějakou dobu zůstane spíše akademickou diskusí a na jeho jednotnou specifikaci bude dost času.

Více o canvasu:

Podpora HTML5 videa a audia v Safari

Poslední noční build WebKitu (jádra Safari) pro Mac OS X již podporuje značky <video> a <audio> z HTML5. Podle vývojářů:
The current implementation supports all formats that QuickTime supports, including installed 3rd party codecs.
To odpovídá již dřívějšímu oznámení, že Apple zatím nebude nativně podporovat Ogg Theora (formát, který HTML5 specifikace doporučuje).

Pokud máte Mac OS X, pak si video v Safari můžete vyzkoušet přímo na blogpostu HTML5 Media Support.

Začátkem léta jsem se ptal který prohlížeč první implementuje video? V pomyslném závodu se Safari zařazením podpory videa do nočních verzí ujímá vedení.

A jak jsou na tom ostatní prohlížeče?

Opera čas od času vydá experimentální verzi s videem, v pravidelných weekly buildech se podpora zatím neobjevila.

U Firefoxu se patch s podporou videa stále dolaďuje a je před commitnutím. Podporu si lze vyzkoušet v neoficiálním buildu.

Na Internet Explorer se vztahuje informační embargo a co se v jeho připravované osmičkové verzi objeví se můžeme jen dohadovat.

sobota 24. listopadu 2007

Mikroformáty už i v Safari

Pokud patříte mezi uživatele prohlížeče Safari, můžete vyzkoušet rozšíření, které Safari obohatí o podporu Mikroformátů.

Zatím jsou podporovány dva oblíbené mikroformáty hCard a hCalendar.

Rozšíření běží pouze na Mac OS X 10.5 Leopard. Na mém macbůčku je verze 10.4 Tiger, proto jsem rozšíření nemohl vyzkoušet.

Pokud patříte mezi ty šťastné uživatele, budu rád, když se mi se svými dojmy z podpory mikroformátů v Safari svěříte v komentářích.

neděle 4. listopadu 2007

HTML WG spouští tracker

Začátkem týdne HTML WG nasadila tracker W3C. Tracker (systém pro sledování požadavků) má za úkol dodat řád chaotickým diskusím v mailing listu.

Podle Danna Connollyho se systém zatím vyzkouší. Několik lidí se nabídlo přepisovat zajímavé myšlenky z mailing listu do trackeru.

Jsem velmi zvědav na výsledek, protože při současném počtu 487 členů připomíná práce HTML WG spíše veřejné diskusní fórum než pracovní skupinu, jejímž cílem je vytvořit specifikaci.

Tracker najdete na adrese http://www.w3.org/html/wg/tracker/issues/ a je zatím ve velmi raném stádiu po spuštění.

Více se o trackeru dočtete v příspevku The Tracker, Tracked na QA blogu W3C.

Mne mezi vlastnosti trackeru W3C zaujala orientace i na mobilní zařízení a připravený IRC bot (tohle ještě Bugzilla nemá).

sobota 27. října 2007

První draft HTML5 ještě letos

Již několikrát jsem polemizoval, kdy se dočkáme první veřejné verze specifikace HTML5. Všechny stávající diskuse se vedly okolo rozepsané specifikace, která se mění den ode dne. Veřejný draft je jakási zafixovaná průběžná verze, ke které se lze vyjadřovat a dlouhodobě vracet. Prakticky všechny specifikace W3C jsou vyvíjeny cestou průběžných draftů.

Mít první veřejnou verzi je už podle mne skoro na čase. Myslí si to i někteří členové HTML WG a WHATWG, ale každý se k tomu staví po svém.

Situace se vyvinula

Ve HTML WG se jako reakce na e-mail Anne van Kesterena uspořádala anketa, co se tedy bude dělat a čeká se, jak anketa dopadne, což možná vyvolá další diskusi, která bude....

WHATWG má situaci trochu jednodušší. Vida, že se v HTML WG jen tak rychle něco nestane, Ian Hickson včera zaslal do WHATWG mailing listu Call for Comments:
I figured that I should "publish" an archived copy anyway, so today I put out a frozen "call for comments" draft:

http://www.whatwg.org/...2007-10-26/multipage/

If anyone was hoping for a semi-stable version to start reviewing the draft, I would say that this is it. We're pretty much feature-complete at this point, which is to say I don't think we'll be adding any major features to HTML5 going forward (though of course minor features like additions to certain APIs are likely to still occur).
Na IRC Ian naznačil, že tento draft se vydá jen za WHATWG, na W3C se nebude čekat, protože by to trvalo týdny.

Důležitá je informace, která nyní zazněla poprvé: Nezdá se, že by se do HTML5 přidávaly ještě nějaké další zásadní funkce.

To je důležité znamení pro výrobce prohlížečů i případné recenzenty. Jsem zvědav, zda podobnou informaci někdy uslyšíme i od HTML WG (letos určitě ne, tipoval bych nejdříve koncem příštího roku).

Představu o tom, co konkrétně se ještě bude měnit lze získat pomocí vytvořeného Issue trackeru (sledovače problémů), jak Ian dále píše:
There is a public issues list:

http://www.whatwg.org/issues/

...which has about 3700 issues in it. The next order of business is simply to go through all of those issues. I've been tracking the issue count since early October, and at the moment the count is reducing at a rate of about 7 a day, which works out to being about a year and a bit of solid work, which puts us on track to reach Last Call in 2009, as I predicted in the aforementioned e-mail.

První draft HTML5

V případě, že jste dosud HTML5 detailně nestudovali, protože by se vám specifikace změnila pod rukama, než byste ji dočetli, můžete dnes sáhnout po prvním veřejném draftu HTML5:

http://www.whatwg.org/specs.../2007-10-26/multipage/.

Úvod do problematiky

A pokud byste před jejím studiem, chtěli rychlý úvod do problematiky, mohu v češtině doporučit v tomto pořadí (jeden z odkazovaných článků je můj, čemuž se nedokážu vyhnout, o dalším textu o SQL5 v češtině nevím):

David Majda: WHATWG - budoucnost webu?
David Majda: Webové aplikace podle WHATWG
Martin Hassman: SQL si razí cestu do HTML5

A lze navázat článkem v angličtině:

Elliotte Rusty Harold: New elements in HTML5

neděle 21. října 2007

SQL database jako první ve WebKitu?

Začátkem léta se objevily první zmínky o SQL5 neboli SQL v HTML5. Tradiční cookies jako prostředek ukládání informací v prohlížeči pro současné webové aplikace již nestačí a hledá se mocnější nástroj. A jelikož je dnes zvykem ukládat data do relačních databází, proč nemít takovou databázi přímo v prohlížeči.

Během léta nám specifikace SQL5 (client-side database storage) trochu dozrála a tak s podzimem můžeme sklízet ovoce. Tento týden se objevil první prohlížeč, který začal s její implementací (dosud ji šlo používat pouze pomocí rozšíření Google Gears).

Programátoři WebKitu pracují na implementaci lokálního databázového úložiště a nezapomněli ani na podpůrné nástroje (absence takových nástrojů byla nepříjemnou stránkou Google Gears). Pomocí Web Inspectoru prohlížeče Safari bude možné procházet uložená data v jednotlivých tabulkách a volat na nich libovolné SQL dotazy, což je užitečné jak pro ladění aplikací, tak i pro pokročilé uživatele, kteří se chtějí podívat, co to vlastně mají v prohlížeči uloženo.

Vývojáři zatím neřešili otázku bezpečnosti. Takový Google Gears se při pokusu o přístup k lokální databázi uživatele zeptal na souhlas a pokud uživatel potvrdil "již se více neptat" mohla stránka k lokální databázi přistupovat kdykoliv. Současná implementace ve WebKitu se neptá a přístup rovnou povolí (resp. přístup pouze k datům uloženým z dané domény). To se může před oficiálním vydáním ještě změnit.

Zmíněnou funkci si můžete vyzkoušet v nočních buildech WebKitu (v těch z 21. října, pokud ale používáte Windows, ještě si počkejte, poslední build z 19. října SQL5 neobsahuje). Pokud je mi známo, tak se v této chvíli jedná o první prohlížeč, ve kterém je SQL5 implementováno.

Zdroj: WebKit Does HTML5 Client-side Database Storage

P.S.: Mimo téma příspěvku - pokud jste si už dali tu práci a zkoušíte noční build WebKitu, nezapomeňte si v něm zobrazit ukázky z článku CSS @ Ten: The Next Big Thing, protože WebKit již obsahuje podporu stažitelných fontů (což ne všichni ocení).

pátek 12. října 2007

Google mapy s mikroformáty a další

Nedávno jsem se zmínil o mikroformátech, v tomto postu přidám několik zajímavých odkazů.

Pro ty, kterým není jasné, jak by mohl sémantický web s mikroformáty fungovat, tu máme jedno video ukazující používání mikroformátů na Google mapách ve Firefoxu s rozšířením Operator.



Mikroformáty se již dostávají i do vědních oborů, jak je vidět z webu bioformats.org, který představuje mikroformáty pro použití v oblasti biologie a molekulární genetiky.

Pokud chcete mikroformáty z jejich HTML podoby zkonvertovat do XML nebo JSON, vyzkoušejte Optimus.

Chcete vytvořit na vašem webu denní plán za pomoci mikroformátů? Použijte Conference Schedule Creator, ve kterém zadáte jednotlivé události a získáte vygenerovaný HTML kód pro vložení do vašich stránek.

Nelze upřít, že se mikroformáty pomalu stávají buzzwordem, podobně jako se jím stal AJAX nebo Web2.0. Na webu Australian IT tak kupříkladu v pravém sloupci můžete najít mikroformáty hned vedle Microsoftu:
Sign up for a daily update of the biggest stories in IT. From Microsoft to Microformats, you'll be on top of all the latest in IT news five days a week.
A protože mikroformáty jsou o sémantickém webu, je dobré si ukázat, jak i takový sémantický web ve skutečnosti vypadá 8-)

Jak na našeptávač s HTML5

Je to pár let, co se objevil Google Suggest, nedlouho poté ho následovaly české portály se svými Našeptávači a Rádci. Princip je jednoduchý, ale ne každý chce našeptávač vytvářet na zelené louce (ten od Seznamu se blíží k 300 řádkům a dokonce padlo obvinění, že české portály od sebe kód opsaly).

Pojďme se podívat, nakolik se nám zmíněných 300 řádků kódu zkrátí v případě, že prohlížeč bude podporovat HTML5. Anne van Kesteren tvorbu našeptávače podrobně popisuje v návodu An HTML5-style "Google Suggest".

My si zobrazíme rovnou výsledek. Klientskou část našeptávače v HTML5 lze napsat na 4 řádky (a to se kód zalamuje, jinak by to byly dva):
<input list="suggest" name="q"
oninput="list.data = '?w=' + encodeURIComponent(value)">
<datalist id="suggest"></datalist>
Kód si můžete vyzkoušet ve všech prohlížečích, které již implementovali WebForms2, tj. zatím jen v Opeře.

Příklad využívá nové značky <datalist> a její schopnosti snadno dynamicky měnit obsah. Není třeba kódovat žádný AJAX, to vše má na starosti prohlížeč. Kodér pouze při změně hodnoty v textovém boxu nastaví vlastnosti datalistu na novou URL a datalist si data získá sám.

Značka <datalist> nebude v HTML5 zdaleka tou nejmocnější. Další možnosti skrývá např. značka <datagrid>, která umožňuje vytvářet vnořené rozbalovací seznamy, ve kterých se bude obsah jednotlivých větví automaticky načítat ze serveru jen v případě, kdy jsou skutečně potřeba.

Pokud se chcete o základních kamenech nových webových formulářů, tzv. Web Forms2, které činí jeden ze základních stavebních kamenů HTML5, přečtěte si WHATWG - budoucnost webu? od Davida Majdy. Zmíněný našeptávač je jen malou ukázkou toho, jak se život webových vývojářů s příchodem HTML5 změní.

úterý 9. října 2007

Možná přijde i HTTP5

Není to tak dávo, co Anne van Kesteren začal pracovat na XML5. Nedávno Anne experimentoval s interoperabilitou HTTP:
I’ve been wondering about HTTP interoperability for some time now. What if a response has two Content-Type or Location headers? What if newlines are done using 0x0A instead of 0x0D followed by 0x0A?
a možná z toho jednou třeba vznikne i HTTP5:
From what I heard so far RFC 2616bis is not going to address these issues (error handling, thorough interoperability testing, et cetera). gsnedders is working on testing HTTP parsing interoperability and plans to write an HTTP parsing specification which would at least address some of the issues, but in the end we either need the HTTP WG to get their act together or find a lot of free time for HTTP5.

pátek 5. října 2007

Podpora videa již ve Firefoxu 3?

Přiznávám, že jsem již trochu pochyboval, zda se podpora videa dostane do blížícího se vydání Firefoxu 3. Dnešní reakce v Bugzille ukazuje, že šance tu ještě je. Jonas Sicking píše:
Honesly, if this is in a state where we're ready to land it on trunk then I think we should attempt to get it in to FF3. This would be a huge help to keep the internet open by promoting open standards for video at a very crucial state for video on the web. Ideally we would have had this in a release a year ago, but waiting another year or two I think would make it much harder for free codecs to get market share.

Yes, I know we're well past feature freeze, but I think this one is worth making an exception for. It speaks directly toward MoFos goal of promoting freedom and innovation on the internet.
Autor patche Chris Double nedávno zveřejnil nový testovací build Firefoxu s připravovanou podporou videa, který umožňuje např. kombinaci značky <video> s SVG. Vložené video tak lze v prohlížeči snadno posouvat, zvětšovat nebo natáčet. Pokud si nechcete výsledek vyzkoušet sami, podívejte se na ukázkové video.

Když jsem to viděl poprvé, vzpomněl jsem si na dvě přednášky. Přednášku Tomáše Metličky o budoucnosti Flashe a Adobe Air a přednášku Štěpána Bechyňovského o Silverlightu. Oba při prezentaci svých produktů totiž spustili nějakou grafikou nabitou ukázku a vítězně poznamenali něco ve smyslu: Tohle webový prohlížeč bez našeho pluginu nikdy umět nebude.

Když se dívám na ukázku (která mimochodem vznikla jako napodobení jednoho Silverlight dema), říkám si, jak dlouho to NIKDY ještě bude platit.

neděle 23. září 2007

Výrobci prohlížečů chtějí offline aplikace

Zdá se, že na začlenění podpory offline webových aplikací do HTML5, a tedy i do webových prohlížečů, má každý jiný názor.

Ian Hickson v pátek napsal:
Note: Some people in public-html at w3.org suggested that this would be an area that we should not be working on. However, two separate browser vendors as well as a browser extension developer group have independently contacted me requesting support for this _in person_, as well as by e-mail and over IRC, and in two of those three cases have actively been writing experimental and shipping code to add support for such a feature. This is amongst the highest level of demand I've ever seen for a feature in this spec (the last feature with this level of demand was probably <canvas>). I think it is imperative that we work to obtain a consensus on a single specification for this to enable interoperability on this quite important feature, otherwise we'll see quick fragmentation in this space. I believe HTML is the right place to define this due to the tight integration of any solution here with the loading and browsing context aspects of the current HTML5 spec, as should be obvious from the proposal below.
Výrobci prohlížečů webové offline aplikace skutečně chtějí - vzhledem k objevujícím se alternativním platformám není divu. Zajímalo by mne, výrobci kterého druhého prohlížeče po Firefoxu projevují zmiňovaný aktivní zájem. Citovaní "browser extension developer group" budou nejspíš lidé z týmu Google Gears.

Aktuální návrh specifikace naleznete na konci Hixieho e-mailu, debata je v plném proudu a stále dochází i ke dramatickým změnám.

středa 19. září 2007

80 procent případů použití

Někdy se ptáme, proč do HTML nepřidat ještě tuhle vlastnost, nebo tuhle a pak ještě tamtu, vždyť jsou zaručené případy, kdy se to hodí. Nedávno bylo v souvislosti s přidáváním nových vlastností do HTML5 zmíněno pravidlo 80%, neboli Paretův princip. Pokud je Paretův princip pro vás stejně jako pro mně novinkou, čtěte dál.

Ian Hickson píše:
While every USER has to be catered for, the same is not true for every possible use case from the content producer side. For example, at the moment it is not in the scope of HTML to handle writing photo editing applications like Photoshop or movie editing applications like Final Cut Pro. While it may be possible to write such applications in HTML today if you are rather masochistic, it is not something that HTML makes easy, and it is not likely that we will make it easy in HTML5.
We want to keep the language as simple as possible while still catering to the majority of content producers (and while catering to all users).

Note that the "80" value is arbitrary. It is just meant to symbolise the fact that we don't want to cater to all use cases, we only want to cater to the most common ones.

úterý 11. září 2007

Návrh pro offline webové aplikace přišel na řadu

Již delší dobu se čekalo, kdy se v HTML5 objeví specifikace offline webových aplikací. Že se objeví bylo jisté, netušilo se kdy a zda bude vypadat spíše jako u Firefoxu nebo jako u Google Gears (v obou projektech s implementací offline webových aplikací již nějaký čas experimentují).

Koncem srpna Ian Hickson začal diskusi:
It seems like we are talking about the following kinds of scenarios:

1. User goes to a page, then, without closing the page, goes offline and uses it, then goes back online and continues to use it. The page and its subresources are always at their most up-to-date. Interactions with the page while offline are synced to
the server when going online.

2. User goes to a page, then closes the browser. User restarts the browser while offline, and goes to the page. User restarts the browser again while online, and goes to the page. The page and its subresources are always at their most up-to-date. Interactions with the page while offline are synced to the server when going online.

3. Same as 1 or 2, except that the user is not online for long enough to fully download the updated resources. The application doesn't stop working, it is still usable the second time the user is offline.

My proposal is that we add a new attribute to the <html> element, which flags that the page is a Web app that wants to be pinned for offline execution and that when you next fetch the file or one of its subresources while online, it should try to update all the subresources atomically.

<html application>
Nejedná se o kopii ani jedné ze stávající implementací, více se blíží Google Gears.

Hixie specifikaci zatím psát nezačal, nad podobou specifikace se stále diskutuje, pokud vás zajímá, přočtěte si vlákno Offline Web Apps v mailing listu WHATWG.

HTML pro všechny

Nedávno se objevila nová doména HTML4ALL spojující několik osob částečně kritizujících dění v HTML WG. Vedle wiki obsahuje mailing list s veřejným archivem.

O některých neshodách jsem psal např. v příspěvcích Jak vyřešit problémy webu? a Molly na návštěvě u WHATWG.

Za cca 3 týdny existence HTML4ALL se nestalo nic obzvlášť zajímavého. Skupina přemýšlí, jaké si dá logo a hledá smysl své existence.

Nejsem si zcela jist, kam přesně tuto skupinu zařadit (což je opravdu těžké, když ještě sami nemají úplně jasno, proč existují 8-), skupina si neklade za cíl tvorbu nové specifikace (tedy konkurenci HTML5), spíš mi vyznívá jako jakási kontrolní skupina, která chce sbírat feedback proti některým nedostatkům (alespoň jak nedostatky vidí její členové) připravované specifikace HTML5, které pak hromadně vznese.

V zásadě nic špatného. Pokud by to mělo za následek snížení počtu půtek a nekonečných diskusí v mailing listu HTML WG, které někdy začínaly být osobní (ty by se mohly částečně přesunout do HTML4ALL a zůstaly by hlavně debaty řešící specifikaci), hlasuji pro.

Myslím si, že HTML4ALL v žádném případě není tím, kdo by byl schopen vyřešit problémy dnešního webu, přečtěte si jejich mission statement, ale zastupuje důležitou podmnožinu názorů, která by měla být brána v úvahu (viz nedávný příspěvek).

Pokud však HTML4ALL jako skupina uspěje, najde smysl své existence, získá dlouhodobé členy a vyprodukuje nějaké výsledky, cítím z dlouhodobého hlediska opět další zeslabení vlivu W3C nad vývojem webu.

Kdykoliv se důležité debaty a rozhodování přesunou z půdy W3C jinam, W3C trochu ztratí. A to se poslední dobou opakuje stále častěji, viz WHATWG, Microformats.org a další. To vše jsou zajímavé aktivity, které vznikly proto, že pod křídly W3C nenašly pro sebe vhodné místo.

Křižník W3C pomalu začíná nabírat vodu. Ještě se nepotápí, pluje klidně po hladině, na první pohled není vidět žádný problém, ale nezdá se, že by posádka díry stihla zaslepit dřív, než se spodní paluba naplní vodou až přespříliš. To může nastat až za řadu let, ale čím dál víc se jeví jako neodvratitelné.

Tento příspěvek berte prosím s velkou rezervou. HTML4ALL je právě rodící se miminko a je těžké odhadnout jeho budoucnost.

středa 5. září 2007

K sémantickému webu cestou mikroformátů

Nedávno jsem citoval rozhovor s TBL: Budoucnost webu očima jeho tvůrce, který se točil okolo sémantického webu (TBL jej označuje za Web3.0) a zmiňoval jsem mikroformáty, které současné (X)HTML evoluční cestou k sémantickému webu posunují.

Dnes mi na Lupě vyšel článek S mikroformáty přijde Web 3.0, vysvětlující, k čemu mikroformáty jsou, a jaký by mohl být jejich přínos pro další vývoj webu.

Od sepsání článku uplynulo jen pár dní a už jsem narazil na další zajímavé informace týkající se mikroformátů. Pokud bude zájem, zkusím o nich ještě něco dalšího napsat. Jen zatím nevím, zda by to mělo být na HTML456 (ale moc se to sem nehodí, tenhle blog je hlavně o nových verzích HTML a mikroformáty jsou na verzi HTML nezávislé) nebo si nashromáždit víc materiálu na další článek na Lupu.

pondělí 27. srpna 2007

Twintsam - HTML5 v C#

V pátek přišlo do mailing listu WHATWG oznámení nového projektu Twintsam (The Web Is Not Tag Soup Any More), jehož cílem je HTML5 parser pro .NET. Thomas Broyer píše:
I spent the last week rewriting Twintsam's tokenizer from scratch, exactly following the current draft's algorithm. Performance could probably be improved a lot, but I'll first concentrate on the tree building stage.

For the record, Twintsam is written in C# for .NET 2.0, and it is available at http://twintsam.googlecode.com
The next steps will be to implement serializers.
Odhad termínu dokončení projektu není zatím dostupný.

HTML5 parsery se nám množí, po Pythonu, Javě a PHP přichází i .NET.

středa 22. srpna 2007

Přinese nový Flash H.264 video do prohlížečů?

Příští verze Flashe bude přehrávat H.264 video. Ve video kodecích se moc nevyznám, nevím, v čem je který lepší nebo horší, ale zajímá mě, jak se to dotkne podpory videa v prohlížečích, která s HTML5 přijde.

Prohlížeče podporující HTML5 budou umět přehrávat video nativně bez potřeby pluginů. Podobně jako dnes vložíme obrázek do webové stránky pomocí značky <img> a netrápíme se s přemýšlením, pomocí jakého pluginu ho má prohlížeč zobrazit, bude možné vložit video do stránky pomocí značky <video>. V ideálním případě na videopluginy za pár let úplně zapomeneme.

Který kodek je ten pravý?

Má to jeden háček. Video kodeků je dnes jako much. U obrázků vyhrála podpora gifů, jépegů a péengéček a je úplně jedno, zda váš prohlížeč podporuje i formáty další, tyhle tři se prostě ujaly a bereme je za standard.

Podobný konsenzus (ať již mezi prohlížeči nebo prosazený "shora") musí vzniknout i v oblasti nativně podporovaných formátů videa. Pokud nevznikne, bude i nadále lepší se spolehnout na osvědčené pluginy.

HTML5 specifikace žádný nenařizuje, ale doporučuje (ono prosazení "shora") formát Ogg Theora. S tím souhlasí vývojáři Opery a Mozilla Firefoxu. Naopak Safari se vydalo podporou jiných formátů, např. H.264. Vývojáři Internet Exploreru se nevyjádřili, předpokládám, že H.264 jim bude o něco bližší než open source Ogg kodek.

V tuhle chvíli není ani tak důležité, kdo je nebo není v souladu se specifikací (ta je stejně rozepsaná a může se změnit), jako zda vznikne shoda minimálně v jednom video formátu, který půjde přehrát na všech prohlížečích.

Podporu H.264 ve Flashi chápu jako silný bod pro H.264. Pokud by H.264 video šlo v některých prohlížečích přehrávat nativně a v ostatních prohlížečích se k přehrávání použil Flash, bude výsledek uspokojivý, tedy 1 video formát pro všechny prohlížeče.

Zajímalo by mne, jak na to zareaguje Mozilla s Operou. Open source implementace H.264 je v někerých zemích problematická (alespoň podle Wikipedie, v problematice legality video kodeků se neoritentuji), což by mohl být pro Mozillu problém.

R.I.P. FLV

Tisková zpráva od Adobe sice vyznívá v duchu "hurá, máme tady H.264", já ale volám "hurá, konečně se zbavíme FLV." (BTW Co myslíte, dokdy FLV zmizí? Během dvou let? Tří? Nebo pěti?)

Každý to ovšem vidí jinak, někomu na vydané zprávě naopak vadí, že Flash nebude podporovat zmíněný Ogg Theora.

sobota 18. srpna 2007

HTML5 bude obsahovat podporu ruby

Do HTML5 brzy přibude podpora ruby. Pozor, nejedná se o programovací jazyk Ruby, ale o tzv. ruby anotace, které mají pomoci zej. národům východní Asie používajícím znaková písma a též historikům zabývajícím se staršími a netradičními písmy.
Ian Hickson, the editor of the HTML 5 specification, said on the WHAT WG mailing list just recently: “I have in fact already begun looking at exactly what the parsing and semantic requirements for will have to be. It should be added to the spec in the coming weeks.” Currently the only browser that natively supports ruby is Internet Explorer, at least somewhat. This should be great news for Microsoft. For once they will actually have a lead compared to Gecko based browsers, Opera, Konqueror or Safari in supporting a part of the HTML 5 spec.

Zdroj: The WHATWG Blog

čtvrtek 16. srpna 2007

Jak je to s termínem dokončení HTML5?

V často kladených otázkách WHATWG najdeme jednu velmi důležitou a sice: Kdy bude HTML5 dokončeno? Odpověď dlouho zněla: Za 15 let. Takový termín vyvolal řadu diskusí. Inovaci webu přeci potřebujeme dnes a ne za patnáct let, co to tedy znamená?

Před pár týdny byla odpověď upravena, hádejte na co?
It is estimated that HTML5 will reach a W3C recommendation in the year 2022 or later. This will be approximately 18-20 years of development, since beginning in mid-2004.
Údaj se z 15 let ještě prodloužil. Opravdu trvá připravit jednu specifikaci tak dlouho?

Pokusím se vysvětlit, co přesně tento údaj znamená a proč by zmíněný rok 2022 nemusel být takovou krizí jak se zdá a ostatně i proč v HTML5 traileru datuji příchod HTML5 do roku 2010.

Dokončení specifikace totiž vnímají její autoři odlišně než tvůrci webů. Ukažme si to na dvou příkladech.

Kaskádové styly úrovně 2

Po několika letech práce byla v roce 1998 vydána specifikace CSS2. Prohlížeče CSS2 implementovaly, vycházely o něm knížky a webdesignéři ho používali. CSS2 se dnes používá téměř všude. Je však CSS úrovně 2 hotové nebo není? Odpověď zní NENÍ.

V CSS2 byly objeveny některé problémy a chyby, které pracovní skupina pro CSS řeší. Běžný webdesignér si jich nemusí všimnout, dotknou se spíš implementátorů, ale musí být opraveny ještě před vydáním CSS3, které na CSS2 staví. Asi před měsícem byla revize CSS2.1 prohlášena za Candidate Recommendation a lze očekávat, že v příštím roce se její vývoj dokončí a stane se z ní finální Proposed Recommendation.

Teprve touto revizí (mohli bychom možná říci jakýmsi "servisním balíčkem") bude po 10 letech od vydání původní specifikace práce na CSS2 ukončena. Webdesignérům je to celkem šumafuk, ti CSS2 používali už dávno.

HTML verze 4

Situace je komplikovanější u HTML4. Specifikace HTML4 vyšla v roce 1998, koncem roku 1999 pak vyšla další verze HTML4.01, která řešila některé problémy HTML4. Tím byl vývoj HTML4 uzavřen (následovaly pak XHTML verze).

Zajímavé je sledovat reakce osob, které se na tvorbě HTML4 podíleli a jsou jim známé "zákulisní" informace. Ti totiž často specifikaci HTML4 kritizují jako nedokonalou a plnou řady chyb a problémů. Z pohledu některých z nich byl vývoj HTML4 zaříznut dřív, než byly problémy vyřešeny a HTML4 tak i po deseti letech zůstává (a zřejmě navěky zůstane) "nedokončena", žádné HTML4.02, které by jí dokončilo, již nevyjde. A já opět dodávám: webdesignérům je to celkem šumafuk, ti HTML4 používali už dávno.

HTML5

Podobně je to i s vydáním HTML5. Oním zmiňovaným rokem dokončení 2022 není rok vydání, ale opravdu až rok úplného dokončení specifikace. Tedy nejenom její sepsání, ale i implementace v prohlížečích, při kterém se objeví některé její nedostatky, jejich následné řešení úpravou specifikace, úprava implementací v prohlížečích dle upravené specifikace... Celé kolečko může proběhnout i vícekrát. Rok 2022 je odhadem, kdy to celé skončí.

Webdesignéry ale spíše zajímá ten první termín. Den, kdy budou moci začít HTML5 bez obav používat.

Podle plánu HTML WG
First Working Draft . . . 2007 Jun
Last Call Working Draft . . . 2008 Q2
Candidate Recommendation . . . 2008 Q3
Proposed Recommendation . . . 2010 Q2
Recommendation . . . 2010 Q3
jím má být konec roku 2010 (tento údaj jsem také použil v traileru), podle doporučení Iana Hicksona (které nakonec nebylo vzato v potaz) měl být plán následný:
First Working Draft . . . . 2007
Last Call Working Draft . . 2009
Candidate Recommendation . 2012
Proposed Recommendation . . 2022
Jako rok vydání Ian udává 2012 a následně nechává 10 let na řešení problémů. Tím jsme se dostali až k onomu zmiňovanému datu 2022. Webdesignérů by se opět nejvíc dotkl termín označený tučně.

Uvidíme, zda termín slibovaný na rok 2010 pracovní skupina pro HTML stihne nebo zda dojde spíš na Iana. V tuhle chvíli HTML WG už oproti plánu nabrala zpoždění (ten první draft, který plánovali na červen 2007, nestihli a uvidíme, zda letos ještě stihnou), ale to pořád ještě jde dohnat.

středa 15. srpna 2007

Molly na návštěvě u WHATWG

V nedávných dvou příspěvcích (Odlišná pravidla pro HTML z WYSIWYG editorů? a Jak vyřešit problémy webu?) jsem zmiňoval Molly E. Holzschlagovou a relativně ostrou diskusi, kterou nedávno vyvolala.

Molly je členkou pracovní skupiny pro CSS (na fotografii ta dáma napravo) a napsala tolik knih o webu, že bychom těžko hledali někoho, kdo jich napsal víc. Když se taková dáma rozhodne někoho kritizovat, jistě to vzbudí pozornost.

O víkendu totiž Molly napsala příspěvek Dear W3C, Dear WaSP, obracející se na dvě organizace W3C a The Web Standards Project s relativně nejasnou kritikou. Molly něco trápí, ale neřekla přesně co. (Nepřipomíná vám to vaši přítelkyni?)

Nejzajímavější na celém příspěvku byla diskuse, kterou rozpoutal. Ta se netočila ani tak okolo W3C a WaSPu, jako o WHATWG a připravovaném HTML5. Diskusi bych označil ještě na hranici slušnosti, nicméně poněkud ostrou.

Molly později dodala, že byla tímto obratem překvapena a v pondělí napsala příspěvek Dear WHAT WG and HTML 5 WG, ve kterém se pokusila konkrétně vyjádřit problémy adresované vývoji HTML5 (nejedná se o připomínky k detailům specifikace jako spíše o komunikační problémy mezi lidmi - a ty tu bohužel jsou, jak jsem naznačil na konci nedávného příspěvku).

Krátce nato Molly přišla na IRC kanál #whatwg, kde vedla s Ianem Hicksonem a lidmi točícími se okolo WHATWG zajímavou debatu. Myslím, že Molly všechny přesvědčila, že své příspěvky nemyslela nijak špatně. Snažila se ukázat na některé problémy, proč lidé, kteří by měli spolupracovat, netáhnou za jeden provaz a také, že tvůrci specifikací někdy zapomínají na skutečný svět, ve kterém weby tvoří obyčejní lidé.

Pro zajímavost několik Mollyiných citací ze zmíněné diskuse:
That's a problem then that W3C policy needs to repair.

We forget how we see this versus how the rest of the world sees it.

Most of the people working on specs seem to not realize that the majority of people working in the front lines of web design and dev are not trained, do not understand do not get exposed to the ideas and just do "what works".

In fact, one of the most common questions in XHTML classes? "if elements are supposed to be lower case, why is DOCTYPE upper case?"

I don't want to add to the frustration, I didn't realize what I was stepping in honestly. so now I'd like to help reduce the frustration. I thought he made some excellent points about the various factions but that's still no excuse for what Tantek himself points out as extremely negative behavior not from anyone, including myself. I get frustrated too but the accessibility guys, for one that stuff has to stop. I mean, you'll never get Joe Clark to stop. But that's Joe. However, there have to be some human connections made here between those factions.
Pokud jste četli příspěvek Jak vyřešit problémy webu?, nejspíš je vám jasné, do které ze skupin v příspěvku zmíněných Molly zařadit.

Update: pěkné shnutí celé debaty napsal Abhijit Nadgouda v Turbulence In The Web Standards Community.

pondělí 13. srpna 2007

Jak vyřešit problémy webu?

Na xhtml.com vyšla zajímavá anketa Fixing The Web. Vlad Alexander položil několika osobnostem z různých oblastí webových technologií otázku:
"Která část webu, podle vás, potřebuje vylepšit nebo opravit, aby se dnešní web mohl dále vyvíjet?"
Pokusil jsem se odpovědi shrnout, pro celé znění si přečtěte původní článek. Protože ne všechna jména jsou všem známá, uvedu do závorky i obor, zaměstnání nebo pracovní skupinu, ve které daná osoba působí.

Chris Wilson (IE, HTML WG) - interoperabilita a podpora standardů; zároveň zachování zpětné kompatibility

Daniel Glazman (HTML WG, CSS WG, dříve Netscape) - lepší formuláře, ale HTML musí zůstat jednoduché k naučení se, vyhnout se XHTML2, zlepšit CSS

Joe Clark (propagátor standardů) - školení vývojářů

Doug Geoffray (tvůrce hlasové čtečky) - školení vývojářů jak dělat weby přístupné

Robert Scano (WCAG) - školení vývojářů, přístupnost, stavět web na XML

Jeffrey Veen (Google) - začlenit geo-souřadnice do HTTP

Dave Raggett (mobilní internet, tvůrce HTML+ a htmltidy) - web na mobilních zařízeních

Mike Andrews (bezpečnostní expert) - bezpečnost

James Pearce (.mobi domény) - nic dramatického, stejně přijde mobilní web

Nova Spivack (tvorba sémantických webů) - více sémantiky, RDF a OWL metadata

Mark BirBeck (XForms WG, XHTML2 WG) - smést rozdíly mezi prohlížeči, sblížení vývoje webových a desktopových aplikací, ztenčení specifikací - opak toho, co dělá HTML5

Mají pravdu?

Je zajímavé, kolik nestejných odpovědí se sešlo a jak lidé z různých oblastí vidí problémy jinde. Srovnejte si vedle sebe názory výrobců prohlížečů a tvůrců specifikací, kteří vyzdvihují řešení problémů prohlížečů a potřebu nových specifikací, s propagátory standardů, kteří se soustředí na volání: Učit se, učit se, učit se! Že bezpečnostní expert by nejradši lepší bezpečnost a lidé dodávající mobilní řešení pro změnu lepší web na mobilech, již tak nepřekvapí.

Až na pár výjimek musím každé z těchto odpovědí dát za pravdu (a to částečně i zmíněné kritice HTML5, byť tam je to způsobeno zejména snahou dohnat zpožděný vývoj webu za posledních roky).

Ale pokud bych byl přísný, tak musím zároveň říct, že ani jeden z dotázaných není schopen vyřešit problémy současného webu. Ještě upřesním: není schopen sám vyřešit problémy současného webu. Právě proto, že má každý pohled relativně omezený, dokážou to jedině společně.

A ještě jednou Molly

Tím se vracím k Mollyinu článku, který jsem zmínil na konci předchozího příspěvku, a který vychází mj. z toho, že několik expertů na přístupnost již rozhořčeně HTML WG opustilo.

V HTML5 specifikaci v tuto chvíli převládá přístup pomyslně zastoupený ve výše zmíněné anketě Chrisem Wilsonem a Danielem Glazmanem. Lidmi, kteří mají jisté zkušenosti s tvorbou prohlížečů i tvorbou specifikací. Na druhou stranou lidmi, kteří pravděpodobně mají malé zkušenosti s přístupností, tvorbou webů a evangelizací standardů mezi webdesignéry.

Pozn.: Aby někdo špatně nepochopil, že někoho obviňuji z neznalosti tvorby webů, je to tak, že když trávíte většinu času tvorbou prohlížečů a vymýšlení HTML nebo CSS specifikací, nezabýváte se obvykle pravidelnou tvorbou webdesignů a vidíte vše z jiného úhlu - nemáte v kapse praktické triky jak obejít problém toho či onoho prohlížeče nebo co přesně který prohlížeč (ne)podporuje a hlavně co webdesignéry na té a té vlastnosti nejvíc trápí - prostě vidíte vše v teoretičtější rovině (viz též můj nedávný článek na Lupě Quo vadis, CSS?, kde jsem psal, že CSS WG kupodivu trpí, nebo přinejmenším ještě nedávno trpěla, vážným nedostatkem webdesignerů).

A proto je důležité, aby při přípravě (tedy v HTML WG) byly přítomny zástupci všech skupin, tedy i zástupci z řad webdesignérů, propagátorů standardů a přístupnosti, a to i když si mezi sebou vždy neporozumí.

Možná je to právě tím, že HTML WG netvořila HTML5 od první čárky, ale adoptovala tři roky vyvíjenou třísetstránkovou specifikaci, ve které převládá jeden vyhraněný pohled. Možná proto, že se nedokázaly všechny odlišné pohledy průběžně sjednotit, ale všichni do toho hupli a jsou v tom až po uši, se někteří experti na přístupný web sebrali a z HTML WG odešli.

Což je škoda, protože to jsou právě oni, kdo by měl tenhle problém vyřešit (tvůrce prohlížečů přístupnosti tak dobře nikdy rozumět nebude i kdyby se rozkrájel). Osobně doufám, že se situace časem vyrovná a někteří zhrzenci se buď vrátí nebo budou připomínkovat HTML5 externě. V tuhle chvíli je jasné, čí pohled v HTML5 převažuje. Nemusí to být nutně špatné, ale vyrovnaný stav by byl určitě lepší.

Odlišná pravidla pro HTML z WYSIWYG editorů?

Nejednu debatu vyvolal fakt, že HTML5 specifikace na některých místech obsahuje odlišná pravidla pro ručně psané HTML a pro HTML výstupy WYSIWYG editorů.

Takovým příkladem je značka <font>, která není v HTML5 povolena (předpokládám, že čtenářům není třeba vysvětlovat detailně proč), ovšem s jednou výjimkou. Tou výjimkou je výstup WYSIWYG editoru.

Ve specifikaci stojí:
The font element doesn't represent anything. It must not be used except by WYSIWYG editors, which may use it to achieve presentational affects. Even WYSIWYG editors, however, should make every effort to use appropriate semantic markup and avoid the use of media-specific presentational markup.
Asi každý se nad tím pozastaví a přemýšlí, zda tato výjimka je či není vhodná. Ian Hickson se tomu na jaře vyjádřil ve svém rozhovoru:
Hlavní důvod, proč by WYSIWYG editory měly dostat výjimku, je, že dnešní uživatelská rozhraní neznají dobré řešení sémantických editorů pro obyčejné uživatele. Mohli bychom to po editorech požadovat, ale protože nikdo neví, jak to udělat, byl by to hloupý požadavek. Opět musíme udělat kompromis mezi dokonalostí, potřebami a omezeními reálného světa.
Vysvětlení zřejmě všechny neuspokojilo a debaty pokračují. Minulý týden se problematiku pokusil vysvětlit člen HTML WG s přezdívkou Smylers, který mimo jiné píše:
* We want that an author of a valid HTML5 document isn't permitted to use certain 'presentational' things, instead putting semantic mark-up in the HTML and using CSS to achieve the desired presentation.

* Some HTML is generated not by users directly, but by applications, such as word processors with a 'save as HTML' option. Some of those applications permit users to specify presentational output without giving a reason for doing so (for example, a user may consistently highlight all defining instances of terms in blue, or use a different typeface for headings, but there's no way the application is aware of this).

So when generating the HTML the application cannot follow the rules for authors writing HTML by hand; if the user has only told the application to make something blue, all the app can do is generate HTML which specifies its blueness.

So _some_ HTML-generating software can't meet all the author requirements.

* That software isn't going to go away. Whatever this group decides, such apps will still be used.
Pokud vás problematika zajímá více, přečtěte si celé vlákno počínající Mihaiovým mailem (v tuto chvíli čítá necelých 30 příspěvků).

Nejedná se o jediný bod HTML5 specifikace, který vyvolává řadu diskusí. Např. Molly E. Holzschlag (stejná dáma, která nedávno volala po zastavení inovací webu) vyvolala o víkendu lehce ostrou debatu právě na téma událostí okolo současného vývoje.

Na to reagoval Tantek Çelik:
Standards organizations, and w3c is no exception, often designed things "a priori", depending on the opinion of "experts" to just "pick the right thing" a priori, based on their expertise.

The approach that microformats (and apparently WHATWG) is taking with scientifically challenging features and demanding justification through research/evidence is quite new and quite threatening to those that are used to simply getting their way because they say so as in, how dare anyone question their expertise?
Myslím, že Tantek na to trochu kápnul. Web má za sebou už velkou historii, ze které se může poučit a přestává se vyvíjet způsobem "já bych to navrhl takhle, někdo se mnou nesouhlasí?", ale spíše "musíme to navrhnout tak, aby se vyřešil problém X, jinak to bude špatně". A to někdy může vést i k porušení dosavadních tabu.

neděle 12. srpna 2007

HTML5 trailer - objevte svého hrdinu

Myslím, že nejsem sám, kdo s napětím čeká na vydání specifikace HTML5.

A aby se nám příjemně čekalo, připravil jsem - podobně jako bývá avizováno blížící se uvedení filmů - krátký HTML5 trailer. Najdete v něm i připomenutí více jak patnáctileté historie HTML.

Tak tedy pro všechny, kdo se už netrpělivě těší, až nám web přestane přešlapovat na místě a poskočí opět trochu kupředu:





S přípravou mi pomáhalo pár lidí, kterým bych rád poděkoval. Jejich jména najdete u původního spotu na mém anglickém blogu Methisto.

středa 8. srpna 2007

Vyzkoušejte si podporu videa ve Firefoxu

Chris Double připravil buildy Firefoxu s podporou elementu <video>.

Chrisova implementace <videa> zatím čeká v bugzille a do kódu Firefoxu se dosud nedostala. Pokus jste nedočkaví a chcete si ji vyzkoušet, připomínkovat nebo dokonce hledat chyby, můžete použít Chrisem připravené buildy Firefoxu 3alfa zkompilované s tímto patchem. Na zmíněné stránce najdete i pár příkladů, na kterých můžete začít své testování.

Ještě pro jistotu zdůrazňuji, že se jedná o neoficiální buildy. O tom, který prohlížeč bude oficiálně implementovat <video> jako první, není stále rozhodnuto.

Optimalizace HTML5 parserů

Ian Hickson publikoval na Google Code blogu zprávu o své studii zaměřené na rychlostní optimalizaci HTML5 parserů.

Práce u Googlu dává Ianovi prostředky, které neměl, když ještě pracoval pro Operu a Ian toho plně využívá. Kde všude byste si mohli dovolit prohnat svým programem deset miliard HTML dokumentů, že?

Získaná data by měla pomoci rychlostně optimalizovat nejen HTML5 parsery, ale prakticky všechny existující HTML parsery.

pondělí 6. srpna 2007

Jednotná terminologie je duležitá - slovník pro HTML WG

Sander Tekelenburg do konference HTML WG napsal:
OK, as I had hoped, W3C has a glossary: <http://www.w3.org/2003/glossary/>.
Not very useful though. I looked up
"accessibility" -> 2 relevant different results (1 from ATAG 1.0)
"universality" -> zero results
...

But all are uses of the terminology, or at best a definition within one specific spec. No W3C-wide definitions. Depressing.
Sander si stěžuje, že W3C nemá jednotný slovník základních termínů, které se při tvorbě specifikací dennodenně používají. Což může vést (a také vede) k řadě nedorozumění při diskusích týkajících se specifikací. Proto Sander navrhuje založit patřičný terminologický slovník pro HTML WG, a rovnou jeho první verzi založil:
I've taken the liberty to start a glossary <http://esw.w3.org/topic/HTML/Glossary> and put short versions in it of the definitions I had put in the AccessibilityConsensus document <http://esw.w3.org/topic/HTML/AccessibilityConsensus>. Not that I'm entirely happy with all of them. There's room for improvement.

It seems to me there will be a need to make these more official, because consumers of the HTML5 spec will also be confronted with these terms. So I guess they'll at some point need to go directy in the HTML5 spec.
O potřebě společného slovníku psal nedávno i Gregory J. Rosmaita.

Lachlan Hunt - Developing with HTML5

Už dlouho jsme tu neměli žádnou prezentaci a dnes to napravím.

Minulý týden měl Lachlan Hunt přednášku Developing with HTML5 (powerpoint, 1.5MB). Mimochodem Lachlan pochází z Austrálie, ale v červnu dostal nabídku pracovat na Opeře, a tak se přestěhoval do Norska. Jsem zvědav, jak se vyrovnává se změnou podnebí.

V Lachlanově prezentaci jsou na necelých 50 slidech představeny základní principy (X)HTML5, výhody používání HTML5 nebo naopak XHTML5, nové značky HTML5 a příklady jejich použití, vztah k Mikroformátům atd. Vhodné pro všechny, kdo nemají v tom, co (X)HTML5 přinese, zcela jasno.

Nejedná se o první Lachlanovu prezentaci o HTML5, další dvě naleznete na jeho webu a na Youtube najdete jeho tříminutové video z Webjam 3.

HTML WG - revidujeme jako diví

Ještě v červnu jsem si stěžoval, že pracovní skupina pro HTML od svého březnového založení prakticky nic neudělala a pořád jen diskutuje a diskutuje.

Jsem rád, že dnes můžu tvrdit opak. Ačkoliv je okurková sezóna, tak HTML WG začala s revizí, jednotlivé sekce specifikace HTML5 se rozdělily mezi dobrovolníky a během července a srpna se postupně kupí výsledky jejich práce (Ian Hickson se minulý týden vrátil z téměř měsíční dovolené, tak mu nezávidím ten počet e-mailů, který bude zpracovávat).

Jestli to takhle půjde dál, na podzim by HTML WG mohla být už řádně fungující skupina. I počet jejích členů se již několik týdnů neodchýlil od čísla 486 (z toho 416 jsou pozvaní experti a 70 zástupci členských organizací). Zdá se, že se situace stabilizovala.

Kdy se Web Forms 2 stanou součástí HTML5?

Ačkoliv se adopce týkala obou specifikací WHATWG, tedy HTML5 a Web Forms2, zatím se stále jedná o oddělené dokumenty.

Gregory J. Rosmaita se ptá:
when -- if ever -- is the WF2 document to be incorporated into the HTML5 draft, much less moved to W3C web space? are we to pick apart the WF2 draft in the same wise we are carefully reviewing HTML5, or is there still the possibility of a collaboration between WF2 and XForms integration? if so, the WF2 draft should be submitted to the W3C as a working group draft...
Narážka na XForms se týká výsledků hlasování o adopci, kde právě nekompatibilita Web Forms2 s XForms byla předmětem jedné námitky. Je pravda, že od té doby se otázkou webových formulářů nikdo nezajímal. V tuto chvíli se řeší základní otázky HTML5 a je otázkou kdy na formuláře dojde.

Ian Hickson odpovídá:
The "HTML5" language includes both the drafts that were called Web Forms 2 and Web Apps 1 at the time this group decided to adopt them. I haven't gotten around to merging the two into one document; but it's one of the many things that needs to happen over the next few years.
Já mám někdy pocit, že Ian měří čas v letech a desetiletích místo ve dnech a měsících, ale je pravda, že se dosud jeho odhady ukázaly jako reálné.

středa 25. července 2007

Budeme mít CSS5?

Ian Hickson ve svém červnovém příspevku The CSS working group is irrelevant kritizuje současný stav CSS a naznačuje možnosti vzniku CSS5 pod záštitou WHATWG.
The CSS specs show their age; they come from a time where specifications were much vaguer than those of the modern day. Someone really needs to do to CSS what the WHATWG has been doing to HTML, defining everything in detail, explicitly, with strict and clear normative conformance criteria, taking implementations into account, defining things like quirks mode. (The WHATWG community refers to such a hypothetical project as "CSS 5", as a reference to the way the current WHATWG specs define HTML5, XHTML5, and DOM5 HTML.)
One way to address this would be for the WHATWG to start a "subproject" to address CSS, while we wait for the W3C CSS group to learn from the W3C HTML group and become open. The biggest problem would be finding editors who would be willing and capable of doing the incredible work of rewriting CSS from scratch.
Situace okolo CSS dnes není zcela růžová. Pokusil jsem se jí popsat ve svém dnešním článku Quo vadis, CSS? na Lupě.

pátek 20. července 2007

Jak se píše historie HTML

O spojení sil W3C a WHATWG jsem psal na Lupě v Ze zákulisí příprav HTML - W3C a WHATWG spojují síly včetně mé spekulace, že celá spolupráce obou skupin mohla být předem naplánována.

Před několika týdny Ian Hickson zveřejnil několik svých e-mailů, které jsem před tím neznal, a ve kterých jsem si potvrdil, že některé mé domněnky nebyly daleko od pravdy (kterého komentátora by to nepotěšilo, že?).

Dnes bez komentáře Hixieho maily pro všechny, které zajímá, jak se píše historie (doporučuji přečíst celé odkazované maily, resp. celá vlákna, najdete tam řadu zajímavostí).

Re: any comments on HTML charters
If the group is intended to collaborate with the WHATWG, then I think the WHATWG community would be very happy. However, would the HTML WG members be ok with that? Collaboration would consist of having only one specification, shared between the two groups, published on both sites, with feedback sent to both groups treated equally. This allows the spec to gain patent policy protection, allows W3C members to take part without losing face, puts HTML5 back onto the W3C REC track, and yet keeps the existing community happy about their involvement.
If the group is intended to compete with the WHATWG, developing specifications that are mutually exclusive with the WHATWG ones, then I fear that the W3C group will not succeed. The WHATWG community is very adaptable; members of the community have been keeping track of things in XHTML2, for example, and suggesting them for inclusion in the HTML5 work -- in several cases, most notably the
element and headers -- the WHATWG spec version of the feature ends up fully specified long before the XHTML2 working group's, even though the other group came up with the idea first.
The charter should require more openness. I think that working group membership should be open to anyone -- not just W3C members. Anyone wishing to join the group would have to accept the W3C patent policy, of course; however, the current mechanism, whereby someone can pay $900 to get a bigger say in the future of the Web, would clearly not be acceptable to the members of the WHATWG community, many of which are students, self-employed, or working for organisations that are not W3C members and have no real reason to join.
Here is an outline of how I would expect a new HTML specification to proceed along the W3C Recommendation track:

First Working Draft . . . . 2007
Last Call Working Draft . . 2009
Candidate Recommendation . 2012
Proposed Recommendation . . 2022
Re: Charters for review
Regarding technical matters, there shouldn't be a difference between being a working group member as a W3C Member Company, a W3C Invited Expert, or participating as a non-W3C Member. This should be made explicit in the charter; currently the charter implies that non-members are not full members of the working group.
Re: any comments on HTML charters
The group will communicate its suggestions to the WHATWG community either through posting to the WHATWG mailing list, or by having WHATWG community members being part of the HTML working group.
Another proposed HTML charter
The Working Group is expected to work in collaboration with the WHATWG to produce identical specifications, preferably by having the same editor. This collaboration may cease if the two communities do not agree on technical matters. If this happens, the Working Group's charter should be re-examined by the W3C.
Another proposed HTML charter (revision 1)
(Changes since the last post: Add video, add WebAPI reference, change criteria for success, removed need for charter to be reexamined if WHATWG and HTMLWG go their separate ways.)

úterý 17. července 2007

Cesta webových standardů

Olivier Théreaux na blog W3C napsal příspěvek Cesta webových standardů - Web Standards Do (poslední slůvko je z japonštiny podobně jako v bushido).
Mě zaujal hned první odstavec obracející se k počátkům webu:
Jedna z věcí, díky které se web stal od svých počátků tolik populární, byla snadná práce s ním: HTML bylo jednoduché. Kdokoliv mohl vytvořit webovou stránku. To je stále do jisté míry pravda a díky řadě editorů nebo služeb jako jsou Wiki, Blogy a CMS, kdokoliv může vytvořit webovou stránku. Ale webové technologie jsou dnes bohatší: CSS, skriptování, DOM, SVG, widgety... A z rostoucí bohatosti a složitosti se zrodila nová skupina lidi: weboví profesionálové.
Olivier tímto odstavcem tak trochu přilil vodu na můj mlýn, protože právě o počátcích webu a o velkém významu onoho HTML bylo jednoduché píšu v mé dnešní glose na Lupě s názvem Máte tam chybu, Time...

pondělí 16. července 2007

Sjednocení detekce a aktivace quirks módu

Dnes jsem si všiml další zajímavé vlastnosti HTML5, snahu o alespoň částečné sjednocení quirks módu.

Jedná se o sjednocení detekce quirks módu, takže vlastnost document.compatMode, která je již nyní podporována řadou prohlížečů, bude součástí specifikace.

A dále o částečné sjednocení aktivace quirks módu. Zde je situace trochu těžší, prohlížeče ji mají z historických důvodů implementovánu odlišně a webdesigneři toho hojně využívali.

Jelikož je ale používání zastaralého quirks módu spíše na ústupu a situací "potřebuji prohlížeč A ve standard, prohlížeč B taky ve standard a prohlížeč C ve quirku" pomalu ubývá ve prospěch "standard mód ve všech prohlížečích", není důvod proč situaci nesjednotit a tím jen dále podpořit motivaci pro používání standard módu.

Sjednocování aktivace quirks módu mezi prohlížeči ostatně již probíhá, např. do WebKitu (Safari) byl Davem Hyattem vložen kód pro aktivaci quirk módu z kódu Mozilly. Následně se z WebKitu tento kód dostal i do KHTML (Konqueroru). Nezjistil jsem verze prohlížečů, ve kterých ke změně došlo, ale úprava proběhla asi v roce 2004. Poslední verze těchto tří prohlížečů se již chovají (až na některé výjimky, na které by webdesignér běžně neměl narazit) stejně. Zbývají tedy odlišnosti u Opery a Internet Exploreru, oba se zatím v tomto směru nevyjádřili.

Zpráva z telekonference: začínáme s revizí

Minulý týden proběhla další telekonference pracovní skupiny pro HTML (záznam z jednání). Zdá se, že se HTML WG konečně posune v revizi adoptovaného HTML5.

Možná se dokonce podaří vyhnout diskusím všech 483 členů o každé maličkosti. Musím říct, že mě tyto diskuse občas připadají nekonečné (už jste se někdy na něčem dohadovali v počtu 500 lidí?). Jednotlivé sekce specifikace dostali přiděleni dobrovolníci, kteří mají s danou oblastí zkušenosti. Dan Connolly říká:
goal is to have each section read by at least 2 WG members by the end of July or August... I don't expect we'll fix the issues that get raised before publishing, but we'll have some knowledge of what we're publishing
Jsem zvědav, zda se to podaří splnit, někdy na podzim bychom se mohli dočkat vydané první pracovní verze specifikace.

Dan si dále stěžuje, jak je obtížné v tak velikém počtu diskutujících sledovat celou diskusi, obzvláště když se diskutuje na několik témat zároveň (jeho roli mu nezávidím, celý mailing list jsem přestal číst již před měsíci a vybírám si jen zajímavá témata - jen za první polovinu července přišlo 770 mailů):
asked for advice from the AtomPub chairs; their situation is similar to ours in that it's a large email-based collaboration. But there are differences too.
... Mostly, I encourage a few topics and tolerate everything else. Sometimes saying "stop talking about X" results in more discussion of X rather than less.
Pořád čekám, že někdo přijde s geniálním nápadem, jak spolupráci tak velkého počtu lidí (navíc většina z nich spolupracuje dobrovolně ve svém volném čase) zkoordinovat.

čtvrtek 12. července 2007

HTML5 časem i v PHP

HTML5 parser bude i pro PHP. Objevily se dva projekty, které se o implementaci snaží. V tuhle chvíli jsou na úplném začátku a nemá cenu je ještě zkoušet, pomalu rostou na adresách:

http://php-html5lib.dashslot.net/svn/trunk/
http://geoffers.no-ip.com/svn/php-html-5-direct/src/trunk/

Uvidíme, zda se autoři spolu dohodnou a vytvoří jeden projekt, nebo budou pokračovat každý sám.

Zdroj: #whatwg

Budoucnost webu očima jeho tvůrce

Magazín ITworld.com přinesl rozhovor The future of the Web as seen by its creator, ve kterém zpovídá tvůrce webu Tim Berners-Leea. Rozhovor se točí okolo sémantického webu, ve kterém TBL vidí budoucnost.
So, for example, if you are looking at a Web page, you find a talk that you want to take, an event that you want to go to. The event has a place and has a time and it has some people associated with it. But you have to read the Web page and separately open your calendar to put the information on it.... So the Semantic Web is about data integration.
V současnosti jsou realizaci sémantického webu nejblíže asi Mikroformáty, které se snaží o jeho integraci do HTML. Pokud jste o Mikroformátech neslyšeli, přečtěte si čtyřdílný seriál Microformats Alexa Faaborga, který mimo jiné představuje Operátor, což je experimentální rozšíření Firefoxu o podporu Mikroformátů nebo se podívejte na Alexeovu prezentaci z web2.0Expo (50MB, PDF).

Rozhovor se dále točí okolo Web 2.0, Web 3.0 (z rozhovoru si můžete všimnout, že TBL má v obou termínech jasno).
IDG: So what's the difference between a Web of documents and a Web of data?

Berners-Lee: There are many differences between documents and data. Take, for example, your bank data. There's two ways you could look at it. If you just look at a plain Web page, then it looks like a sheet of paper. All you could really do is read it. Now if you look at it on a Web 3.0 site, you could maybe use a Java search to change the order of the data, and you could reach much better access to data.
TBL je jednoznačně pro zachování neutrality Internetu.
We've seen cable companies trying to prevent using the Internet for Internet phones. I am concerned about this, and am working, with many other committed people, to keep it from happening. I think it's very important to keep an open Internet for whoever you are. This is called Net neutrality. It's very important to preserve Net neutrality for the future.
V rozhovoru najdete odkaz na první dokument, který popisoval, jak má vypadat budoucí web (tehdy byl web ještě myšlen pouze pro interní potřeby CERNu).

Všimněte si nadhledu TBL. Nehovoří vůbec o současných problémech (X)HTML nebo o připravovaném (X)HTML5. To vše je jen drobným detailem na dlouhé cestě ve vývoji webu.

středa 11. července 2007

Proč potřebujeme HTML5?

Karl Dubost napsal Why HTML 5 Specification Matters?, příběh jednoho nefunkčního webu v prohlížeči Safari, ve kterém vysvětluje, proč web zoufale potřebuje specifikaci HTML5. Píše:
The browser implementer had clear instructions for this type, was able to implement it, and then to create an interoperable recovery system for this type of mistake. The Web users finally were able to access the Web site without troubles and in the same way than with other browsers. HTML 5 Specification matters because it creates more interoperability when recovering from errors.
Více jsem se o zmíněném problému rozepsal na jiném blogu v Proč HTML5 potřebujeme jak prase drbání?.

Dvě části HTML5

HTML5 lze pomyslně rozdělit na dvě velké části. Tou první jsou novinky (ty tentokrát ocení více weboví vývojáři něž webdesignéři) a tou druhou je jednoduše řečeno oprava stávajícího webu (viz předchozí příklad se Safari).

Vzpomenu příspěvek Fixing the web! od Anne van Kesterena, který se k problematice vyjadřuje:
Apparently it is not very clear what HTML5 is about. HTML5 is not just about introducing new features. 90% of HTML5 is about fixing existing standards.
S těmi 90% to Anne trochu přehání, já bych to odhadoval spíše 50 na 50.
Indeed, HTML5 is mostly about fixing existing standards so they can be implemented interoperably by user agents. These standards include HTML4, XHTML1 and DOM Level 2 HTML as well as defacto standards such as innerHTML.
Pravdou je, že někteří kritici tvrdí, že by k tomu mělo dojít postupně. Napřed "opravit web" a až po té přicházet s novinkami (viz Adamův příspěvek Zastavit inovaci Webu?). Problém je, že web má už v téhle chvíli zpoždění, které by se mu nemuselo v budoucnu vyplatit.
The reason we are introducing new features as well is because we need to innovate the open web to keep it on a level where it can compete with proprietary technology. Focusing on both new features as well as trying to increase the level of interoperability is in my opinion perfectly feasible and also the right way to move forward.
Potřebujeme obojí, jak novinky, tak vyřešení stávajících problémů webu. Zbývá jen doufat, že na ten velký krajíc bude W3C a WHATWG stačit.

HTML5 i v Javě

Henri Sivonen před několika minutami oznámil zahájení práce na HTML5 parseru v Javě.
There's now a limping development version of an HTML5 parser in Java that interested parties may try out:
svn co http://svn.versiondude.net/whattf/htmlparser/trunk/ htmlparser

Warning: This isn't at all ready for any kind of production use. The purpose of this email is just to let interested parties know the status of the project.
Goals:
Provide an HTML5 parser that works as a drop-in replacement for an XML parser in non-browser Java apps that expect XML APIs. Make the parser strict enough for conformance checking (including encoding errors, etc.).
License:
MIT/expat. Patches welcome under the same license.

Acknowledgments:
Thanks to the Mozilla Foundation for funding this project. Thanks to the html5lib team and Philip Taylor (of the lazyilluminati fame) for test cases and bug reports.
Po projektu html5lib, který je v Pythonu a v pokročilém stádiu vývoje, se jedná o druhý připravovaný HTML5 parser. Oproti klasickým HTML parserům, které jsou k dispozici prakticky pro každý programovací jazyk, HTML5 parsery implementují relativně obsáhlou část specifikace HTML5 (bod 8) která pojednává i o neobvyklých stavech včetně toho jak parsovat tag soup.