Klávesové zkratky na tomto webu - rozšířené Na obsah stránky

reportáže psané v HTML

Statistika používání HTML značek

Která značka je nejpoužívanější? Je více formulářů POST nebo GET? A jak vypadá běžná událost onclick?

Pracuji na projektu, kvůli kterému jsem si vytvořil statistiku používání HTML značek, jejich atributů a hodnot. Výsledky jsou celkem zajímavé, takže se s vámi o ně podělím. Topten nejpoužívanějších značek vypadá následovně:

Jak v tabulce číst? V prvním řádku vidíme, že 18% značek v průměrném dokumentu představuje kotva <a>. Celých 99% kotev má uveden atribut href, 22% atribut title atd. Druhá nejpoužívanější značka je <td>, na obrázku vidíme i přehled nejčastějších hodnot atributu class (zobrazí se v moderních browserech po najetí myšky na buňku tabulky).

Dlouho jsem přemýšlel, jak pro měření získat objektivní vzorek dat. Nakonec jsem analyzoval prvních deset odkazů, které vrací Jyxo pro každé slovo z Top 1000. Po promazání atypických souborů vznikl různorodý vzorek cca 10.000 stránek. Pro zajímavost jsem vytvořil druhou statistiku, která zahrnuje titulní stránky všech webů umístěných v galerii CSS Vault (bohužel vzorek je docela malý).

Tady jsou:

Co lze vyčíst

Zajímavé je zejména srovnání obou tabulek. Rozdíly v popularitě značek asi neprozradí nic překvapivého, ale velmi krásně demonstrují odlišnost zastaralého a moderního pojetí webdesignu. Co dále… všimněte si, že obvyklé šířky tabulek jsou kolem 98% (jestlipak víte proč?). Kódování windows-1250 je cca 4× častější, než iso-8859–2. Velká spousta webů chybně uvádí kód jazyka ‚cz‘ namísto správného ‚cs‘. Perličkou je, že tučné písmo rádi barvíme do tmavě modré či červené.

A tak bych mohl pokračovat. Najdete-li sami něco zajímavého, můžete se zmínit v komentářích.

Karma body: 35. Líbil se vám článek?

Komentáře » přidat

  1. avatar [1] Petr Krontorad: nový

    skvela prace davide!

    par rychlych postrehu:
    toplist je 4× oblibenejsi, tvurci „modernich“ webu radi dokazuji, ze prave oni jsou validni (odkazem na w3c) ;) ve formularich je skoro stejne tlacitek jako textovych poli, oboje je vsak zabarina proti skrytym polim (type=„hidden“), kterych je 2× vic nez predchozich dohromady. Pro paranoiky – kazda informace o nas, zadana a poslana na jakekoliv strance, je doprovazena 4× vice udaji, ktere bychom dobrovolne nikdy nezadali. co tam asi posilame? ;)) orwell hadr :)

    Posláno 21. 9. 2005 v 6.13 | Odpovědět
  2. [2] Jiří Bureš: nový

    Připomenul bych svůj starší miniseriál o výskytu tagů ve zdrojových kódech: poslední díl je na http://blog.converter.cz/index.php?….
    Vidím, že výsledky se za ty dva roky zásadně nezměnily. Ale těžko srovnávat nesrovnatelné.

    Posláno 21. 9. 2005 v 8.30 | Odpovědět
  3. [3] Ota: nový

    Jako laik jsem si na webech nejčastěji všimnul značky „Práce na silnici“ doprovázené textem Under Construction.

    Posláno 21. 9. 2005 v 9.01 | Odpovědět
  4. [4] rony: nový

    este by si mohol vyhodnotit, v kolkych percentach dokumentov sa ta-ktora znacka nachadza. napriklad by som ocakaval, ze html a body budu zarucene v kazdom z nich.

    Posláno 21. 9. 2005 v 9.07 | Odpovědět
    Na komentář reagoval [5] Adam Hošek
    Na komentář reagoval [23] David Grudl
  5. avatar [5] Adam Hošek: nový

    [4] rony: HTML a BODY nejspíš budou v 99,999 % případů, z výsledků vyplývá, že David měřil celkové počty výskytů :). Ano, souhlasím, byla by asi zajímavější statistika zaměřená na využitelnost elementů jednotlivými stránkami. Kolik stránek má H1? kolik na stránkách obvykle bývá H2? Kolik odkazů, kolik seznamů (různých typů), kolik tabulek? I když je mi jasné, že zpracování statistik není žádná legrace :). Tedy pokud si na to nenapíšu kvalitní rozřazovací a porovnávací program :).

    Posláno 21. 9. 2005 v 9.39 | Odpovědět
    Na komentář reagoval [14] David Grudl
  6. avatar [6] Jan Angelovič: nový

    Předně chválím moc zajímavý článek!

    K datům (CZ):
    asi nejvíce mě překvapil stále vysoký podíl FONT. 3,7% je oproti kdysi rovněž hojně používanému CENTER (0,34%) opravdu dost. A přitom zrovna podpora formátování písma pomocí CSS je v prohlížečích celkem dobrá.

    Nepoměr mezi TABLE (2,7%) a TBODY (0,13%) naopak nepřekvapí.

    Posláno 21. 9. 2005 v 10.15 | Odpovědět
    Na komentář reagoval [27] Jan Angelovič
  7. avatar [7] rADo: nový

    Bezvadný nápad a skvělá analýza, Davide. Dík! :-)

    Posláno 21. 9. 2005 v 10.22 | Odpovědět
  8. avatar [8] Jan Angelovič: nový

    Souhlasím, že satistika přepočtená na stránku by byla velice zajímavá.

    Paradoxně je pravděpodobnější výskyt nepovinné značky HTML než některých povinných.

    Posláno 21. 9. 2005 v 10.24 | Odpovědět
  9. avatar [9] Jan Bien: nový

    Vynikající a nápaditý článek, díky. David nikdy nezklame.

    Posláno 21. 9. 2005 v 10.41 | Odpovědět
  10. [10] Ivorius: nový

    Nějak jsem si toho nikde nevšiml, kolik má % div **id? **

    Posláno 21. 9. 2005 v 10.56 | Odpovědět
  11. [11] meca: nový

    Mňo mě třebas zaujalo, že class u <hr /> má v css vault skoro v pěti procentech „schovej“, kdežto u českých webů člověk nenajde český pojmenování…

    Nebo že class u <td> lidi pojmenovávají „Radek“ …

    Ne, je to naprosto úžastný! Dik.. Myslim, že se v tom budu hrabat zbytek roku ;)

    Posláno 21. 9. 2005 v 11.06 | Odpovědět
  12. [12] myf: nový

    : ) zrova nedávno jsem přemýšlel nad podobným průzkumem – analyzovat barevnost stránek (prostě hledat v CSS hexa, RGB nebo jména barvy, nejspíše pro background-color) a pokusit se vyabstrahovat „Jaký typ autorů jak barví? / Souvisí barva s osahem stránek?“ Napadlo mě to po té, co jsem za jeden den na českém netu viděl třetí stránku s „pixy-like“ #ff9900 oranžovým pozadím : )

    Posláno 21. 9. 2005 v 11.56 | Odpovědět
    Na komentář reagoval [14] David Grudl
  13. [13] lukas: nový

    Ohhh, to super. Wooowww… Paradni clanek.

    Posláno 21. 9. 2005 ve 12.40 | Odpovědět
  14. avatar [14] David Grudl: nový

    [5] Adam Hošek: tento přepočet jsem použil u atributů, u značek zase tak zajímavý nebyl. Informace, že téměř každá stránka obsahuje <p> a <br> je méně zajímavá, než jejich poměr. Ale přidám i tuto hodnotu do tabulky, třeba jako title buňky.

    [12] myf: a že bychom sestavili průměrnou webovou stránku? :-)

    Posláno 21. 9. 2005 ve 14.01 | Odpovědět
    Na komentář reagoval [15] rADo
  15. avatar [15] rADo: nový

    [14] David Grudl: ten podíl tagů <br> je opravu tragický ve srovnání s <p>. JE vidět, že lidé stále neumí používat margin na dělání mezer mezi odstavci, a používají místo toho 2× <br>. Osobně toto považuji za maximální možnou prasárnu.

    Posláno 21. 9. 2005 ve 14.16 | Odpovědět
    Na komentář reagoval [16] meca
  16. [16] meca: nový

    [15] rADo: IMHO lepší, než tam dávat 4× br ;)

    Posláno 21. 9. 2005 ve 14.32 | Odpovědět
  17. avatar [17] Mirda: nový

    Nestačím se divit, jakými kravinami se někteří z nás zaobírají.

    Zabýval jste se někdy statistikou na nějaké vyšší úrovni, nebo stavíte na znalostech střední školy, kde se vysvětlil průměr a procenta?

    Přesto by mě zajímalo, kvůli jakému projektu jste tuhle statistiku potřeboval. Určitě půjde o něco hodně zajímavého.

    Nakonec to je aspoň základ k nádherné diskusi, kde mě fascinují výroky jako „Nepoměr mezi TABLE (2,7%) a TBODY (0,13%) naopak nepřekvapí.“ Chechtám se ještě teď :))))

    Posláno 21. 9. 2005 ve 14.41 | Odpovědět
    Na komentář reagoval [19] David Grudl
    Na komentář reagoval [21] Jan Angelovič
    Na komentář reagoval [22] Alex
  18. [18] Lukáš Mačí: nový

    Bezva statistika. Díky!

    Posláno 21. 9. 2005 ve 14.57 | Odpovědět
  19. avatar [19] David Grudl: nový

    [17] Mirda: stavím na znalostech prvního stupně základní školy, právě tam jsme se průměr a procenta učili. Docela mě překvapuje, že vám tyto znalosti odpírali až do střední školy, my se v té době věnovali integrálům (to jsou takové skrůcánky, víte?) :-)

    Posláno 21. 9. 2005 v 15.07 | Odpovědět
    Na komentář reagoval [20] Lukáš Mačí
  20. [20] Lukáš Mačí: nový

    [19] David Grudl: Davide, na prvním stupni ZŠ se takové věci neučí. Vím to moc dobře, protože první stupeň ZŠ „máme doma“ :)

    Posláno 21. 9. 2005 v 15.12 | Odpovědět
    Na komentář reagoval [23] David Grudl
  21. avatar [21] Jan Angelovič: nový

    [17] Mirda:
    „Chechtám se ještě teď :))))“

    Rád jsem vás pobavil, jen nechápu čím.

    Posláno 21. 9. 2005 v 15.22 | Odpovědět
    Na komentář reagoval [27] Jan Angelovič
  22. [22] Alex: nový

    Všechno zajímavé už bylo řečeno, poměr DIVů a „TDů“ každému krásně řeknou jak moc autor pronikl do CSS.

    Smekám. Je to opravdu ohromná práce a nejzajímavější projekty ( [17] Mirda: ) vznikají z takových „hloupostí“. Výborný nápad a ještě lepší zpracování.

    Jen na mém pomalejším počítači Opera moc nestíhá zobrazování výsledků do tabulky… No stane se. :)

    Posláno 21. 9. 2005 v 15.23 | Odpovědět
  23. avatar [23] David Grudl: nový

    [20] Lukáš Mačí: že by druhý? Každopádně tímto zdravím paní učitelky Černohorskou a Krůtilovou. S tím, co mě naučily na základní škole, jsem si vystačil celou střední a kousek vysoké. A možná taky kvůli tomu jsem začal střední flákal a vysokou nedokončil.

    Updatnul jsem tabulky, viz [4] rony:

    Posláno 21. 9. 2005 v 15.30 | Odpovědět
    Na komentář reagoval [24] Sodalite
    Na komentář reagoval [25] rADo
  24. avatar [24] Sodalite: nový

    [23] David Grudl: A kolikrát Tě Krůtilová vykrákala za vlasy? Mě určitě mockrát. Nicméně mě taky něco naučila. :)

    Posláno 21. 9. 2005 v 16.01 | Odpovědět
    Na komentář reagoval [26] David Grudl
  25. avatar [25] rADo: nový

    [23] David Grudl: fajn, teď to dostalo ještě větší smysl. Ale moc tomu nerozumím. Tag <a> obsahuje jenom 93% stránek. Co ten zbytek? Otevírané odkazy přes onClick na tagu img?

    Vše je možné, ono <h1> na pouhých 32% a <h2> na 23% něco říká, tedy to, že se používá jen <table> a <font>tagy.

    Je to dobře. V takovéto situaci se moc dobře dělá „SEO“, což není nic jiného, než slušně napsaný web.

    Posláno 21. 9. 2005 v 16.02 | Odpovědět
    Na komentář reagoval [26] David Grudl
  26. avatar [26] David Grudl: nový

    [24] Sodalite: dnes už by to měla obtížnější :-D

    [25] rADo: spousta stránek neobsahuje odkazy především kvůli používáním frame (iframe), fullscreen flash nebo redirektů přes meta tag či javascript.

    Posláno 21. 9. 2005 v 16.54 | Odpovědět
  27. avatar [27] Jan Angelovič: nový

    [21] Jan Angelovič:, [6] Jan Angelovič:
    Aha, tak jsem se kouknul do DTD HTML 4.01 a sypu si popel na hlavu. :-(

    TBODY je nepovinný prvek. Už mi to ISO leze na mozek.

    Posláno 21. 9. 2005 v 17.50 | Odpovědět
  28. avatar [28] Jódlující bernardýn: nový

    Skvěle, Davide!

    Zaráží mě ale 64% užívání class u DIVů a jen 20% id… Spíš bych si to představoval naopak…

    Posláno 21. 9. 2005 v 19.54 | Odpovědět
    Na komentář reagoval [31] David Grudl
  29. [29] Leo: nový

    „TBODY je nepovinný prvek. Už mi to ISO leze na mozek.“

    Tak to ja ziju v pocitu, ze je povinny (HTML Strict), ale ma volitelny pocatecni a koncovou znacku. Coz vypada jako nesmysl, ale pokud tbody vynechate a pak si projdete takovy HTML pres DOM/JavaScript, zjistite, ze prakticky vsechny prohlizece si uzel typu element TBODY vytvori :-) Leo

    Posláno 21. 9. 2005 ve 20.45 | Odpovědět
    Na komentář reagoval [32] Jan Angelovič
  30. avatar [30] Dero: nový

    Vynikající článek, díky za něj!

    Budu se vracet a odkazovat – skvělá práce.

    Posláno 21. 9. 2005 ve 22.08 | Odpovědět
  31. avatar [31] David Grudl: nový

    [28] Jódlující bernardýn: no obvykle class definuješ proto, aby jsi ji použil vícekrát, zatímco id právě jednou, ne?

    Posláno 22. 9. 2005 v 0.16 | Odpovědět
  32. avatar [32] Jan Angelovič: nový

    [29] Leo:
    Máte samozřejmě pravdu, vyjádřil jsem se nepřesně:

    Prvek TBODY je povinný, ale jeho vyznačení je nepovinné.

    Posláno 22. 9. 2005 v 8.27 | Odpovědět
  33. [33] myf: nový

    http://code.google.com/…s/index.html
    něco úplně stejného v rámci google code? teda ve srovnání s tebou, dgx, mi to připadá jako celkem žabařina. Buď to nedovedou tak pěkně prezentovat, nebo to jsou prostě žabaři s trochu širším záběrem (?) a užitím SVG (zbytečným?) . To jen aby tu byl crosslink.
    (via google blogscoped )

    Posláno 26. 1. 2006 ve 13.00 | Odpovědět
  34. [34] Bubák: nový

    Od vydání článku uběhla dlouhá doba, ale dneska jsem ze zvědavosti hledal, jak často se používá tag BASE s atributem „href“, ale tahle kombinace v tabulce chybí.
    Je to proto, že se používá zřídka, nebo se zapomělo?

    Posláno 23. 1. 2008 v 9.36 | Odpovědět

Tento článek byl uzavřen. Už není možné k němu přidávat komentáře ani hlasovat

Výtah na začátek článku na první komentář

Názory čtenářů v diskusích nejsou názory provozovatele webu, a ten za jejich obsah neodpovídá.

La Trine © 2004, 2008 David Grudl – o webu
provozuje Pachollini.

Jakékoliv užití obsahu, včetně převzetí článků nebo jejich částí, je bez předchozího písemného svolení autora zakázáno.

Ukázky zdrojových kódů smíte používat s uvedením autora a URL tohoto webu bez dalších omezení.