Yuhůův weblog o webu

Stránka z archivu.

pondělí, 29. září 2003

permoník

O obtížnosti blogování

Kdysi jsem si myslel, že blogování bude lehčí, píše Patrik Zandl na Marigoldu. Zatímco anglicky píšící bloggeři to mají snadné, protože je na co odkazovat a komentovat to, v české kotlině skoro žádný odborný zdroj nestojí za pravidelné zmínky. Závěrem Marigold uvádí:

... místo abych odkazoval na jiné, musím si většinu zpráv někde opatřovat sám a to je přesně to, co jsem nechtěl. Dělat novinařinu a ještě si za ni nenechat platit :)

pátek, 26. září 2003

permoník

Blog o Javě

Dagi upozorňuje na nový Java blog. Já Javě sice moc nerozumím, ale počítám, že mé milé čtenáře by to zajímat mohlo. Dobře se to čte.

čtvrtek, 25. září 2003

permoník

Hezké bookmarklety

Hezkou sbírku bookmarkletů našel Pilda.

úterý, 23. září 2003

permoník

Hackem swyettem

Tak nám hacknuli Letem světem. Screenshot. Archivy nepřístupné. Nebo že by se Lukin hacknul sám?

Je to jinak: Letem světem končí.

pondělí, 22. září 2003

permoník

Nikdo neumí HTML

Poslední dobou se k nám do firmy hlásí na pozici kodéra už naprosté trosky. Není výjimkou, pokud se na práci s html šablonami hlásí lidé, kteří upekli vzorovou stránku ve Wordu a už to jako umějí. Takže milí čtenáři -- sháním lidi.

Když si ale mailuji s účastníky diskusí nebo se čtenáři tohoto blogu, nemám pocit, že by HTML stránkám, CSS a Javascriptu nikdo nerozuměl. Potkávám amatéry, kteří to se stránkami umějí, pouze nevědí, jak jsou ve skutečnosti dobří. Mám pocit, že se bojí přihlásit se o pořádnou práci ve špičkové firmě.

Pokud tedy nějaké stránky děláte, baví vás to a chtěli byste to dělat profesionálně, ozvěte se mi, prosím. Jde o práci na plný úvazek v Praze -- nic jiného nemá smysl (opravdu, ale opravdu nechceme nikoho na čátečný úvazek, ani na dálku). Neposílejte mi žádné CV, motivační dopis taky nepotřebuju. Do předmětu napište "zájem o práci", přihoďte odkaz na pár svých stránek. Pokud budou za něco stát, ozvu se s podrobnostmi (například s mailem, kam máte poslat ten životopis :-).

neděle, 21. září 2003

permoník

Datové velikosti blogů

Jirka Bureš si dal dvojnásobnou práci a proměřil české blogy z hlediska datové optimalizace. Použil na to nástroj WPA -- Web Page Analyzer. Seriál o českých weblozích na ConBlogu se tak rozrostl o velikost českých weblogů a o hodnocení českých weblogů podle WPA.

V obou případech vyhrály Pixyho blogy. Šel jsem se k vítězi poučit a byl jsem zaskočen -- stránka přímo stahuje čtyři počitadlové obrázky, další dva přes styl. Datový objem navíc nejméně 23 kB. Nic z toho analýza neukazuje. Nástroj WPA, který byl k analýze použit, evidentně nevidí styly s příponou .php a obrázky v php nebo s parametry. Ani u mého (tohoto) blogu si WPA nevšimlo skrytých počitadel načítaných javascriptem.

Chyby analytického nástroje jsou ale maličkost. ConBlogu patří velké poděkování za zajímavé přehledy.

pátek, 19. září 2003

permoník

Přehlédnutá statistika

Vyšlo to už koncem června, objevil jsem ten článek až teď. Tomáš Holčík: Jaký je uživatel českého internetu (živě.cz). Sice nic převratně nového, ale docela zajímavé.

čtvrtek, 18. září 2003

permoník

K čemu je JyxoRank

Pokusím se trochu zpopularizovat svůj nedávný příspěvek Pozorování JyxoRanku. Každá stránka webu, kterou Jyxo zná, má vypočítaný JyxoRank. Je to číslo, u nějž se předpokládá, že je tím vyšší, čím je stránka lepší. JyxoRank je na dvě věci:

Katalogy řadící podle JyxoRanku jsou Seznam.cz a Atlas.cz (Atlas si rank trochu přepočítává). Pokud je pravdivý obecný názor, že uživatel věnuje pozornost pouze prvním odkazům v sekci, měl by to být podstatný důvod, proč se snažit hlavním stránkám svých webů JyxoRank zvýšit (do katalogů se zadávají zpravidla hlavní stránky).

Jak přesně vyhledávač Jyxo používá JyxoRank při hledání (nebo při indexování), se pravděpodobně nikdy nedozvíme, pokud to ovšem Michal Illich nezveřejní. Konkrétní algoritmus použití ranků bývá nejstřeženější tajemství vyhledávačů a pravděpodobně je často měněn. Pokud je mi například známo, není nic známo o tom, jak Google vlastně používá svůj PageRank (ačkoli se dost přesně ví, jak ho počítá). Všechno, co se traduje, jsou jenom holé teorie. Ta nejrozšířenější tvrdí, že Google používá PageRank při řazení výsledků pouze tehdy, kdy na dotaz dostane více stránek skoro stejně odpovídajících dotazu. To se mi nezdá, ale víc nevím. O Jyxu jsem ovšem nenašel ani ty mýty.

Pokud chcete zvýšit JyxoRank hlavní stránce svého webu, nemáte jinou možnost než pohnout jiné webmastery, aby na ni odkazovali. U podstránek vašeho webu je to jiné. JyxoRank stejně jako Google PageRank pozoruje vnitřní strukturu webu, ale zachází s ní podstatně jinak. Zatímco Google PageRank se mezi všechny podstránky webu jakoby naředí, JyxoRank si lze u podstránek tak trochu nabrnkat. Každá podstránka odkazovaná z hlavní stránky dostává totiž třetinu JyxoRanku hlavní stránky. Třetina JyxoRanku se přeposílá bez ohledu na to, kolik odkazů stránka obsahuje (např. Google Page Rank přeposílaný rank dělí počtem odkazů). Stránky další úrovně odkazované pouze z podtránek (nikoli z hlavní stránky) mají už jen devítinu JyxoRanku hlavní stránky atd. V průměru tedy mělké weby s mnoha odkazy na hlavní stránce a málo úrovněmi podstránek budou mít vyšší průměrný JyxoRank.

Zároveň ovšem musím poznamenat, že není vůbec jisté, zda má JyxoRank u podstránek vůbec nějaký význam. Podstránky se do katalogů obvykle nepřidávají; zohledňuje-li je jyxovské hledání, není jisté. Přestavovat web kvůli JyxoRanku je předčasné.

permoník

Není to moc velké?

Znáte to, jak se programátoři posmívají "pitomým" obyčejným uživatelům počítačů? Občas se posmívám s nimi, ale velmi často je mi uživatelů spíše líto, nemají vlastně žádnou šanci naučit se s počítačem pracovat. Často se vyprávějí různé historky zaslechnuté z druhé ruky. Opravdovou váhu problému si člověk uvědomí až v reálné situaci.

Obecně se traduje, že čím je stránka menší, tím je lepší. Kolik je ale taková rozumná velikost? Cituji konkrétní dotaz:

Nechce se mi nahrat pozadi, backgroundovy zvuk a vubec se to cely nahrava straslive pomalu... Napadlo me, jestli to neni tim, ze je to moc velke, ale koukala jsem, ze slozka index_soubory nema ani dve mega a webpark povoluje celkem tri, tak v tom to asi neni.

Samozřejmě to tím bylo. Možná se budete usmívat, mně to xmíchu nepřijde. Sice jsem se dnes pobavil nad Pixiho spotem o půlminutovém načítání, tohle je ale něco jiného. Kde se má člověk dozvědět, že stránka nemá mít dvě mega? Zaujalo mě, jak autorku webu zmátl datový limit serveru na webparku.

permoník

Měření pixelů

Zajímavé softwarové pravítko pro měření pixelů odkazuje Pilda. Hodí se zejména tomu, kdo občas dostává grafické předlohy webů ve formě detailního obrázku.

pondělí, 15. září 2003

permoník

Poslání bloggerů

Pro koho mají psát bloggeři? ptá se Filip Rožánek na svém Bloku. Je to natolik zajímavé téma, že bych sem nejraději ocitoval celý příspěvek. Tak alespoň kousek:

... Kromě toho, že řada nováčků na bloguje.cz a blog.lide.cz slintá bez ladu a skladu zápisky, které nemají ani hlavu ani patu, ba mnohdy ani smysl, existují ještě bloggeři, kteří automaticky spoléhají, že jste obeznámeni s problematikou. ... (blok Filipa Rožánka, 13.09.03)

Jako příklad chybného předpokladu automatického obeznámení s problematikou je dáno moje Pozorování JyxoRanku. Filip od jisté chvíle přestal rozumět, o čem píšu, protože jsem použil moc neznámých slov (iterace, konvergence...) a za chvíli i matematiku.

Předpokládal jsem, že čtenáři mého blogu znají mechanismus výpočtu Google PageRanku. To byla chyba, většinou neznají. Předpokládal jsem, že rozumějí matematice. To byla chyba, protože se najdou tací, co nerozumějí. S odstupem dvou dnů (po několika komentářích) je mi to jasné. Možná bych to dnes napsal jinak.

Ve Filipově přípěvku jde ale o něco jiného. Jde o podstatu českých blogů. Mezi řádky čtu, že to mají být deníčky. Příběhy, kterým rozumí každý, něco jako zrovna blok Filipa Rožánka. Mimochodem velmi dobrý, rád se občas začtu. Takové deníčky jsou úspěšné, protože oslovují hodně lidí. Mají tak šanci (cituji) být "masově úspěšným projektem (dobré je to, co je pro hodně lidí)".

Jenomže co když někdo nechce mít masově úspěšný projekt? Podle mě je na webu důležitější mít úspěšně cílený projekt! Příklad: když jsem začal dělat web, vůbec jsem nechtěl psát pro všechny. Moje stránky byly přesně cílené. Cílené na holky kolem dvacítky, které by si přečetly moje stránky, zasmály se, napsaly mi a aspoň jedna by se chytla. Nepsal jsem to pro šestnáctileté gymnazisty, ani pro matky dvou dětí. Tisícovou návštěvnost bych vyměnil za jednu konkrétní holku. (Když už o tom píšu, musím zdůraznit, že se mi to zdaleka nepodařilo; web (statické www) asi není dobrá metoda lámání holek.)

Zkoušel jsem i deníčkovou metodu pro širokou veřejnost. První záznam deníčku mám z podzimu 1999, to jsem ještě netušil, že je to blog. Po čtyřech letech je mi ale jasné, že ze mě nebude populární bavič. A tak raději cílím psaní na uživatele, kteří se zabývají webem. Uznávám, že je to široké téma, takže ne každý musí rozumět matematice. To já se zase totálně ztrácím na blozích, které píšou o současné kultuře nebo televizi. Proto tady máme takzvané odborné blogy, které se zabývají i něčím jiným než cestováním v metru.

Až budu příště psát o JyxoRanku, zkusím to víc polopatě. Vy si, milí čtenáři, alespoň přečtěte diskusi na Bloku pod článkem. Vyznačuje se nebývalou slušností a drží se tématu.

Související: Nic nového pod sluncem, Jiří Bureš, ConBlog.

permoník

Graf prohlížečů na Google

Každého webdesignéra musí zajímat procentuální rozdělení prohlížečů. Další zajímavý graf zachycující vývoj rozšíření prohlížečů v posledních třiceti měsících jsem našel na googlovském přehledu hledaných slov - Zeitgeist.

Graf se údajně počítá ze všech dotazů směřujících na Google. Obrázek naštěstí potvrzuje všechny známé fakty o tom, že čtvrté verze prohlížečů Internet Explorer a Netscape Navigator se odebírají na smetiště dějin (nejen v české kotlině, jak ukazuje Toplist).

neděle, 14. září 2003

permoník

Jak skončit s rámy

Čas od času si s někým píšu o rámech, protože jsem velký nepříznivec rámů. Dneska jsem ale musel uznat, že udělat rámovaný web je pro začátečníka vlastně jednodušší než jiné alternativy. Cituji Jiřího Macicha:

Rámy udělá každý za pár sekund i v Poznámkovém bloku. Udělat hezky pozicované DIVy s iframem je také lehké, ale udělat je tak, aby běhaly i v běžných rozlišeních (640x480,800x600,1024x768) a v běžných prohlížečích (Necky, IE, Opera, Mozzila) - to je pro hodně lidí fakt fuška (já se mezi ně počítám). (Jiří Macich, mail z 12. 9.)

Což o to, jednoduché rámy asi jsou. Ale jsou jenom kvůli tomu dobré? Většinou zastávám myšlenku "co je jednoduché, to je dobré". Rámy budou asi výjimka. No ale proč to píšu:

Zajímavé články o tom, jak přebudovat rámové stránky na nerámované jsem dnes o půlnoci našel na Mraveništi. Doufám, že pomohou těm, kteří ještě váhají.

sobota, 13. září 2003

permoník

Pozorování JyxoRanku

Jak vzrůstá význam Jyxa na českém webu (hledá mj. na Atlasu), dal jsem si trochu práce se sledováním JyxoRanku. JyxoRank je k vidění na Jyxo Toolbaru, což je lišta, kterou si můžete nainstalovat do Exploreru. Je dlouho známé, že JyxoRank je číslo od 0 do 255 a Jyxo ho používá jako pomocnou proměnnou při řazení výsledků hledání. Méně už se ví, že podle Jyxo Ranku se řadí odkazy v sekcích na Seznamu a na Atlasu.

Jyxo Rank je většinou dáván do souvislostí s Google Page Rankem. Google Page Ranky existují vlastně dva: skutečný a odvozený, který je vidět na Google Toolbaru. O GPR zobrazovaném na toolbaru se traduje, že je logaritmicky odvozen od skutečného Page Ranku. Zatímco skutečný PageRank (jehož vzorec výpočtu je znám) dosahuje hodnot od nuly do jedné (většinou jsou to skoro nuly), zobrazovaný Page Rank se počítá od nuly do deseti.

O Jyxo Ranku se traduje, že zobrazovaný JR se od skutečného neliší. Má to určitou logiku. Číslo od nuly do 255 se totiž dá zapsat osmi bity, a tak se ušetří místo na disku. Zatím je to všechno jasné, nyní přijdou moje postřehy.

Zaprvé jsem si všimnul, že hodnoty JyxoRanku skáčou u některých webů jako hadr na holi. Například moje stránky Jak psát web měly na začátku minulého týdne JR 142. V půlce týdne klesl JR na 121 a v pátek ukazoval toolbar 168. Dá se to pozorovat u mnoha webů a komentoval to už ConBlog (Google cache). Martin Kopta vysvětloval plynulostí neustálého přepočtu. To je patrně správné vysvětlení, ale nic nemění na faktu, že JyxoRank je nestabilní a možná ani po mnoha iteracích nekonverguje. Z toho jsem usoudil, že vzorec Jyxa v sobě pravděpodobně neobsahuje dampening faktor, který z podstatné části zajišťuje konvergenci Google Page Ranku.

Druhé věci, které jsem si všimnul, je řazení sekcí katalogu Atlas.cz a odkazových sekcí Seznamu. Ačkoli je deklarováno, že jsou řazeny podle JyxoRanku, letmým proklikáváním sekcí se dá zjistit, že to řazení je jenom přibližné. Usuzuji z toho, že se sekce řadí podle dosti neaktuálního JyxoRanku.

Dále jsem studoval rozdělení JyxoRanku uvnitř jednotlivých domén. Téměř vždy má hlavní stránka JyxoRank z celého webu nejvyšší. Pro podstránku, která není odkazovaná z jiných domén, platí pravidlo: ze stránek, které na podstránku odkazují, se vybere ta s nejvyším JyxoRankem a vydělí se třemi (bez ohledu na to, kolik ze stránky vede odkazů). Kdyby tedy například hlavní stránka měla JR = 99, budou mít podstránky JR = 33. Z nich odkazované podstránky (ale neodkazované z hlavní stránky) budou mít JR = 11.

Po malém experimentu jsem zjistil, že algoritmus nevybírá nejvyšší JyxoRank jenom z domény, ale z celého serveru s unikátní IP adresou, přesně jak to programátor Jyxa Michal Illich naznačoval na Lupě. Když jsem totiž na hlavní stránku Jak psát web umístil testovací odkazy na stránky v jiné doméně, ale na témže serveru, třetiny se nesčítaly (nezvyšovaly), ale byla započítána pouze třetina JR nejlepší stránky ze serveru.

Trochu jiná je situace, pokud na podstránku vede odkaz i z nějaké cizí stránky (serveru). Pak se ty třetiny nějak "sčítají" . Nevím přesně jak. Každopádně výsledek je větší než třetina JR hlavní stránky a menší, než součet třetiny JR hlavní stránky a třetiny JR cizí stránky.

Tak a teď už budu psát spekulace :-) Je docela obtížné vymyslet vzoreček, který by zmíněné chování simuloval. Obzvláště pokud výsledné JR nesmí být větší než 255. To, že se JyxoRank na jednom webu vyskytuje skoro vždy v násobcích tří, téměř zaručuje, že vzorec je nějakým způsobem lineární nebo přinejhorším polynomální. Veškeré pokusy naroubovat na to logaritmy, exponenciálu, arcusTangens (je hezky omezený shora) nebo hyperbolický průběh selhaly právě proto, že z toho nikdy nevypadla trojka ani jiná konstanta. Nakonec jsem dospěl ke vzorci součtu čtverců. Pravděpodobně je chybný, ale berte ho jako moji teorii JyxoRanku:

JRstránky = SQRT( Suma( ( JRodkazujících stránek )^2 ) * kmax

Odkazující stránky jsou nafiltrovány tak, aby se z každého serveru počítala jenom jedna. Koeficient kmax je v několika cyklech konstantní. Momentálně se zrovna rovná přibližně jedné třetině (od toho ta trojka). Pravděpodobně je vypočítáván na základě hlavní stránky Seznamu:

kmax = 255 / ( SQRT( Suma( ( JRstránek odkazujících na Seznam )^2 ) )

Jinak řečeno je to koeficient, který lineárně všechno přepočítává tak, aby maximální stránka měla 255. Proč myslím, že je to počítáno podle Seznamu: protože Seznam.cz měl zatím vždy Jyxo Rank = 255, ačkoli to není nejodkazovanější česká stránka. Tou je buďto Toplist.cz, nebo CNW Counter, kterým Jyxo ukazuje také 255. Je málo pravděpodobné, aby měly tři stránky vypočítaný stejný rank. Toplistu a CNW Counteru pravděpodobně vychází JyxoRank vyšší než 255, ale je uměle srážen na 255.

Prosím neberte ten vzoreček moc vážně. Je to spíše výzva k přemýšlení. Obzvláště tápu v té odmocnině a druhé mocnině, prostě jsem od boku zkusil dvě inverzní funkce, u kterých mi to hezky vyšlo. Také se mi nelíbí, že by důležitý koeficient zrovna "náhodou" byl roven skoro přesně jedné třetině. Navíc je možné, že algoritmus se čas od času mění.

Reakce: článek Jyxo Rank a jiné ranky (Marek Horák, Sluníčko.net) uvádí, že hodně vařím z vody. Příspěvek Pro koho mají psát bloggeři na Bloku Filipa Rožánka mě přiměl napsat Poslání bloggerů a posléze i vysvětlení K čemu je Jyxorank (oboje na tomto blogu). Ono se řekne optimalizujte pro Jyxo (Internetový oříšek), příklad pozorování nestability.

čtvrtek, 11. září 2003

permoník

XSLT v příkladech

Jirka Kosek mě svými články a odkazy nikdy nezklamal. Ačkoli jsem s XSLT pracoval letos na jaře, nikdy jsem neměl pocit, že bych do XSLT nějak moc proniknul. Většinu návodů, co jsem o tom četl, jsem shledal zmatenými, neúplnými nebo příliž složitými.

XSLT v příkladech je text, který při prvním nakouknutí vypadá srozumitelně a čtivě. Už se moc těším. Doufám, že mě Jirka Kosek nezklame ani tentokrát.

pátek, 5. září 2003

permoník

Proč DOCTYPE

Nepoužívejte DOCTYPE, pokud nevíte, proč to děláte, píše Pixy na blogu. Konečně něco, co můžu podepsat. Pixy cituje komentář Michala Kubečka (mimochodem komentáře Michala Kubečka sleduji na Lupě a Intervalu už déle a připadají mi velmi qěci) :

... pokud stránka není validní vzhledem k určitému DTD, neměla by v ní deklarace typu dokumentu být ...

Na současném webu se vyskytují miriády stránek, které doctype neobsahují, aniž by to znamenalo nějakou podstatnou újmu k jejich použitelnosti. Oproti tomu se mi zdá, že dnešní módní vlna xpoužitelnocssti doctype omylem považuje za základní věc webdesignu.

Nepoužívejte DOCTYPE, dokud nevíte, proč to děláte. Dobrá rada. Já doctype používám, jenom když chci dokument nechat vykreslovat v Exploreru ve standardním css módu. Je to trochu nešťastný, ale praktický důvod.

Pod Pixyho článkem se nezapomeňte podívat do diskuse, je to o Feynmanovi.

permoník

Ostuda Seznamu?

Jirka Bureš na ConBlogu porovnal základní charakteristiky stránek vyhledávačů Jyxo, Google, Yahoo a Seznam. Pomocí nástroje Web Page Analyzer naměřil mimo jiné celkový počet objektů načítaných do stránky nebo celkovou velikost obrázků. Seznam ve srovnání prohrál. Podle mého názoru je to tím, že používá jiný obchodní model než Jyxo nebo Google.

Původní článek byl doplněn o srovnání českých katalogů, což už je poněkud vyrovnanější hra. V ní Seznam prohrává už jenom těsně.

čtvrtek, 4. září 2003

permoník

Podle google

Poodle Predictor je nástroj, který umí stránku prozkoumat z podobného hlediska, jako to dělají vyhledávací roboti, zejména Google. Klikal jsem si docela dlouho, je to zajímavé. Nástroj obsahuje diagnostický pohled, zbarvení zdrojového kódu podle smyslu, jak to chápe vyhledávač, a meta inforomace o stránce (nejen meta tagy). Doporučuji tím prohnat zejména stránky, které nebyly nikdy nijak moc optimalizované pro vyhledávače, Poodle na nich názorně ukáže hodně chyb. via CubSeo

úterý, 2. září 2003

permoník

Portrét České republiky

Na Intervalu vycházely v minulých týdnech on-line portréty různých zemí -- krátké pojednání o rozšíření internetu v té které evropské zemi plus pár dalších zajímavostí. Opravdu mě ale zaujal až portrét České republiky Jak nás vidí Evropa (Zdeněk Hrazdila, Interval.cz). V článku jsou totiž uvedeny věci, kterým rozumím a které mě zajímají.

Úplně nejlepší je koláčový graf u konce článku. Internet v grafu zabírá pouhé jedno procento v celkových výdajích, které dávají čeští inzerenti na reklamu. Připadá mi to jako směšně malé číslo a myslím si, že se můžeme těšit na pořádný nárůst.

Yuhůův weblog píše Yuhů. Napište mi prosím na dusan@pc-slany.cz