Strßnka z archivu.
ned∞le, 27. Φervenec 2003
Soust°e∩te se na zisk, psal Robert N∞mec na Lup∞. ╚lßnek je to v²born², pokud pominu to, ╛e zisk se m∞°φ jenom v pen∞zφch. Podstatnou souΦßstφ dne╣nφ kultury je ale hledßnφ smyslu sv∞ta. Jsou smyslem penφze? Jß i spousta m²ch kamarßd∙ d∞lßme strßnky pro radost. Pokud bereme web pouze jako prost°edek k vyd∞lßvßnφ pen∞z, ochuzujeme si sv∞t. To je filosofickß strßnka v∞ci.
K praktickΘ ziskovosti webu se asi n∞kdy vrßtφm v samostatnΘm Φlßnku. ProblΘm je to, ╛e pokud zrovna neprovozujete webov² obchod, nenφ snadnΘ zm∞°it vliv webu na b∞╛n² zisk firmy. S oblibou firemnφ strßnky p°irovnßvßm k ╣at∙m. ⌐aty stojφ p∞t tisφc. Kdy╛ si ty ╣aty vezmete na jednßnφ o kontraktu za sto tisφc, znamenß to snad, ╛e t∞ch p∞t tisφc vyd∞lalo dvacetinßsobek? V╣ichni tu╣φme, ╛e takhle jednoduchΘ to nenφ.
Mo╛nß jde spφ╣e o dlouhodobΘ budovßnφ dobrΘ pov∞sti. KomerΦnφ web m∙╛ete cφlit bu∩ tak, abyste dnes prodali jeden ╣amp≤n, anebo p°φ╣tφ rok ╣estnßct nßkla∩ßk∙ ╣amp≤n∙. Mßm pocit, ╛e komerΦnφ web je vhodn² spφ╣e na ty del╣φ trat∞. Zdß se mi snaz╣φ vybudovat p°es net sφ╗ kontakt∙, ne╛ p°es net prodat jeden ╣amp≤n.
pßtek, 25. Φervenec 2003
Malß nep°esnost v textu dokß╛e odpoutat Φtenß°ovu pozornost od ΦtenΘho textu. D∙sledek m∙╛e b²t pro poslßnφ strßnky devastujφcφ (zejm. u studijnφch text∙]. Vφme u╛, ╛e aby byl webov² text ·Φinn², musφ b²t struΦn² a srozumiteln², aby se Φtenß° mohl dob°e koncentrovat. Kdo ale ignoruje gramatickß a interpunkΦnφ pravidla, z∙stane takΘ nepochopen.
Zkuste si nynφ nap°φklad uv∞domit, jak na vßs nynφ zap∙sobily nesouhlasnΘ zßvorky v p°edchozφm odstavci. A co si pamatujete z nßsledujφcφho textu? Mo╛nß se pletu, ale m∙j odhad je ten, ╛e si jej budete muset p°eΦφst je╣t∞ jednou.
st°eda, 23. Φervenec 2003
Probφhß dal╣φ Google-dance a jß si jako v╛dy proklikßvßm t∞ch pßr klφΦov²ch slov, kterß m∞ zajφmajφ a pro kterß optimalizuji. Pixy je nynφ se sv²m WEB a CSS weblogem na prvnφm mφst∞ v Google p°i hledßnφ slova "css" v Φe╣tin∞. Gratuluju. Jsou na tom vid∞t t°i nejd∙le╛it∞j╣φ v∞ci pro optimalizaci na klφΦovΘ slovo:
Velmi Φasto si v Exploreru otevφrßm odkazy do novΘho okna. TakovΘ okno nemß historii, a tak kdy╛ se chci po Φase vrßtit na strßnku s odkazem (kterou jsem si mezitφm prost∞ zav°el), nemßm ╣anci.
Dneska jsem to vy°e╣il bookmarkletem. Vyu╛φvßm toho, ╛e dokument mß v∞t╣inou vlastnost referrer, v nφ╛ si pamatuje, z jakΘ strßnky p°i╣el. Po zvolenφ bookmarkletu se dostanu na p°edchozφ strßnku bez ohledu, zda jsem ve strarΘm nebo v novΘm okn∞. Bookmakrlet mß takov²to k≤d:
javascript:if(document.referrer) void(location.href=document.referrer)
M∙╛ete si ho zkopφrovat, jednodu╣╣φ je p°idat si nßsledujφcφ odkaz (t°eba prav²m tlaΦφtkem) do oblφben²ch. Zp∞t z novΘho okna!
·ter², 15. Φervenec 2003
Zatφmco t²den nebudu psßt, m∙╛ete si Φφst t∞ch ╣est p°φsp∞vk∙, kterΘ jsem napsal za poslednφ t°i dny. N∞co novΘho najdete taky v denφΦku. Dost zßbavy jist∞ bude i na Letem sv∞tem, tam to te∩ ╛ije. A kdybyste snad v╣echno p°eΦetli ne╛ se vrßtφm z Oh°e, zkuste vymyslet n∞jakΘ novΘ bookmarklety nebo si prostudujte d∙le╛itou v∞╣tbu o prohlφ╛eΦφch.
P°em²╣lel jsem taky, ╛e bych to ud∞lal jako Jirka Bure╣ na ConBlogu. Kdy╛ prchal na dovolenou, napsal p°φsp∞vky do zßsoby a naprogramoval to tak, ╛e se objevovaly postupn∞. Bylo by to hodn∞ efektnφ, kdyby ale stejnou funkΦnost ud∞lal i pro rss. Takhle jsem m∞l pocit, ╛e tam nic novΘho nenφ. Abych zabrßnil podobn²m zmatk∙m, napsal jsem sem dost Φlßnk∙ najednou, v╣ak si to p°eberete.
Kdy╛ se nedßvno p°ed∞lßval Blogportßl, mrzelo m∞, ╛e jsem p°i╣el o ulo╛enΘ nastavenφ oblφben²ch blog∙. Tak jsem zkusil blogy Φφst p°es My RSS na P∙ovi. Dß se to, funguje to. Akorßt tam neumφm nastavit v²pis men╣φho poΦtu p°φsp∞vk∙ z jednoho zdroje.
Pak jsem si na zkou╣ku stßhnul nov² program RSS Tracker. Funguje. Napsal ho Mirun a urΦit∞ bude rßd, po╣lete-li mu p°ipomφnky.
Nakonec je ale zvyk ╛eleznß ko╣ile. Nedalo mi to, trochu jsem si klikal na Blogportßlu, nastavil jsem si barviΦky a dneska u╛ zase Φtu z n∞j. A╛ bude mφt strßnka oblφben²ch blog∙ lep╣φ adresu ne╛ blogportal.hlava.net/index2.php a jmΘna blog∙ budou klikat na aktußlnφ blog, nebudu mφt d∙vod chodit jinam.
pond∞lφ, 14. Φervenec 2003
Kdy╛ Lukin psal o komprimaci strßnek na ·rovni http serveru, pou╛il metodu, o nφ╛ u╛ dlouho uva╛uji jako o velmi perspektivnφm zp∙sobu sb∞ru informacφ. Kdy╛ n∞co nevφm, tak m∙╛u zablogovat o tom, ╛e to nevφm, a po╛ßdat Φtenß°e o informace. Za p°edpokladu, ╛e mßm Φtenß°e v∞ci znalΘ, je velkß pravd∞podobnost, ╛e mi v komentß°φch nebo v mailech v∞c vyjasnφ. Tφmto zp∙sobem se dajφ efektivn∞ sbφrat informace.
Mßm dobrou zku╣enost s takov²mhle °e╣enφm neznalostφ, kdy╛ pφ╣u n∞jak² nßvod a n∞Φemu p°esn∞ nerozumφm. Sprßvn∞ bych se to m∞l nauΦit a vypsat. Efektivn∞j╣φ je ale prost∞ napsat, ╛e tomu a tomu nerozumφm, napi╣te mi. Pak mi t°eba za rok a p∙l p°ijde mail s vysv∞tlenφm a jß to doplnφm.
Ne╛ zaΦnete jßsat nad tφm, ╛e tady mßme novΘ perspektivnφ vyu╛itφ blog∙, p°eΦt∞te si, proΦ to zatφm nepou╛φvßm v blogu. Mßm toti╛ pocit, ╛e Φtenß°i p°ichßzejφ na m∙j blog kv∙li tomu, aby se n∞co dozv∞d∞li. Ne abych se dozv∞d∞l n∞co jß. M∙╛u se ale m²lit v p°edpokladu. Kdyby Φtenß°i chodili, aby ukßzali, co v∞dφ, dal by se takhle vybudovat poradnφ diskusnφ server. Ale to u╛ by nebyl weblog. Nebo byl?
Kdy╛ u╛ se Pixy zajφmav∞ rozepsal o tom, jak jsou CSS vlastnosti -moz-* rizikovΘ, zkuste se takΘ podφvat, na co mohou b²t dobrΘ. Nechci tvrdit, ╛e by to bylo n∞jak zvlß╣╗ u╛iteΦnΘ, ale asi je dobrΘ v∞d∞t, ╛e to existuje. Kdysi jsem si shromß╛dil pßr p°φklad∙ na CSS pro Mozillu. Zkuste v╣eho a dobrΘho se dr╛te.
Vlezte si na www.indos.cz linuxovou Mozillou (nebo windowsßck²m Explorerem a p°idejte do oblφben²ch). Uvidφte zajφmavou ikonku (screenshot).
P°es Letem sv∞tem jsem se dostal na blog koubovi.cz, kter² zpochyb≥uje pov∞st Marka Prokopa coby internetovΘho odbornφka. Zßkladnφmi argumenty jsou nevalidnφ osobnφ strßnky a malΘ + ╣patnΘ Markovo portfolio strßnek. Nakonec p°ichßzejφ provokativnφ otßzky:
Pane Prokope, na zßklad∞ Φeho publikujete na p°ednφch Φesk²ch technologick²ch webech? Kde berete odvahu uΦit ostatnφ webdesignery, jak majφ d∞lat weby? Nep°ipadß vßm dost zvlß╣tnφ vychßzet pouze z toho, co jste n∞kde vyΦetl? ... (Jirka Kouba, koubovi.cz)
Pod Φlßnkem je zajφmavß diskuse. Sv∙j p°φsp∞vek sem kopφruji:
Star² obsah by se m∞l aktualizovat a mazat. To Marek pφ╣e ve weblogu. Sßm to ned∞lß. To je jeho nejv∞t╣φ problΘm. V╣echno ostatnφ jsou prkotiny.
Pokud jsem si v╣imnul, den mß 24 hodin. Kdo z vßs d∞lal n∞kdy na v∞t╣φm webovΘm projektu, vφte, jak objem prßce na n∞m vzr∙stß. Dnes u╛ nenφ um∞nφ navrhnout web, kter² by se dal postavit, ale je um∞nφ ud∞lat web, kter² se s rozumn²mi nßklady dß udr╛ovat nebo ukonΦit. Osobnφ strßnky, firemnφ prezentace a r∙znΘ tutorißly majφ ze svΘ podstaty nßklady na ·dr╛bu velkou a ukonΦit se dob°e nedajφ.
Domnφvßm se, ╛e Marek Prokop kv∙li velkΘmu zaneprßzdn∞nφ s weblogem, SEO a r∙zn²mi konferencemi prost∞ nestφhß aktualizovat mΘn∞ podstatnΘ strßnky.
Ka╛d², kdo se sna╛φ n∞co vyuΦovat nebo o n∞Φem teoreticky psßt, nevyhnuteln∞ d°φve nebo pozd∞ji ztratφ kontakt s ka╛dodennφ realitou, o kterΘ pφ╣e. Znßm to z vlastnφ zku╣enosti -- kdy╛ jsem zaΦφnal po°ßdn∞ psßt jakpsatweb.cz, byl jsem ve skuteΦnosti ╣piΦka v oboru (akorßt jsem to nev∞d∞l). Od tΘ doby ale po veΦerech mφsto lad∞nφ design∙ pφ╣u tutorißly. Tφm pßdem mi zoufale ujφ╛dφ vlak. Kdybych si mφsto toho psanφ budoval portfolio referencφ, budu mφt sice dobrΘ weby, ale nikomu nepom∙╛u.
Marek Prokop si tφm pomßhßnφm, psanφm a publikovßnφm d∞lß docela dobrΘ profesionßlnφ jmΘno. «e nenφ podlo╛enΘ praxφ? No to mo╛nß ne, ale Φφ profesionßlnφ jmΘno je podlo╛enΘ praxφ? Takov²ch lidφ moc nenφ. Pixy? OK, to je b∙h. Kdo dßl?
A mimochodem, odvozuje se kvalita projekt∙ skuteΦn∞ od validity k≤du? M∙j nßzor znßte: NE.
ned∞le, 13. Φervenec 2003
Kdy╛ jsem nedßvno referoval o tom, jak jsem po p°esunutφ strßnek zmizel z Google, psal jsem blbosti. Pomlouval jsem p°esm∞rovßvacφ metodu http hlaviΦkou 301 jako ne·Φinnou. SkuteΦnost je jinß: funguje to.
Malß rekapitulace: strßnky "Jak psßt web" jsem v dubnu p°esunul ze starΘ domΘny na novou. Dva m∞sφce jsem Φekal, ne╛ se n∞co bude dφt. B∞hem druhΘho Google-dance (Esmeralda v Φervnu) jsem usoudil, ╛e mßm problΘm, proto╛e jsem na dva dny vypadnul z v²sledk∙. Tak jsem hned zablogoval poznßmku. Po dvou nebo t°ech dnech jsem se ale do v²sledk∙ vrßtil. Google od tΘ doby chßpe odkazy, kterΘ mφ°φ na starou (p°esm∞rovanou) domΘnu, jako ╛e mφ°φ na domΘnu novou. Pomocφ serverovΘho p°esm∞rovßnφ 301 moved permanently se tak poda°ilo to, co bych jinak neud∞lal -- zapoΦφtßnφ star²ch zp∞tn²ch odkaz∙.
JedinΘ, co se nepoda°ilo p°evΘst, je PageRank zobrazovan² v Google toolbaru (m∞l jsem ╣estku, mßm Φty°ku). Ale o to p°ece v∙bec nejde, proto╛e skuteΦn² PageRank se poΦφtß ze zp∞tn²ch odkaz∙. B∞hem pßr iteracφ budu myslφm zp∞t.
M∙j zmatek je dobrou ilustracφ jevu, kterΘmu se °φkß Google-dance. Nejenom, ╛e p°i tom trochu blbnou v²sledky hledßnφ -- blbnou i lidi.
pßtek, 11. Φervenec 2003
⌐patnφ webmaste°i nemajφ prßci. Dob°φ webmaste°i majφ prßce tolik, ╛e nev∞dφ, co d°φv. A ten nejlep╣φ? Tomu evidentn∞ funguje v╣echno samo, proto╛e jinak by nem∞l Φas na psanφ blog∙. Fakt nechßpu, jak Pixy stφhß krom∞ sv²ch blog∙ psßt EpileptickΘho k°eΦka. Mimochodem -- dobrΘ Φtenφ.
Φtvrtek, 10. Φervenec 2003
Lukin na Letem sv∞tem nadhodil tΘma komprese webov²ch strßnek na ·rovni http protokolu. Z komentß°∙, o kterΘ po╛ßdal, vypl²vß nßsledujφcφ: pro server Apache existuje modul mod_gzip, kter² umo╛≥uje odesφlat data zabalenß, pokud to klient akceptuje (AFAIK jich to akceptuje hodn∞). M∙╛e to zvy╣ovat zatφ╛enφ serveru. Instalovat mod_gzip se vyplatφ asi jenom tehdy, kdy platφm za p°enesenß data od serveru. Pokud toti╛ nebude komprimovat server, p°enos se komprimuje na ·rovni protokol∙, kter²mi se dorozumφvajφ modemy, tak╛e to modemov² Φtenß° dostßvß stejn∞ rychle.
VφcemΘn∞ to koresponduje s tφm, co mi °ekl asi p°ed rokem m∙j apachovsk² guru: "nevyplatφ se nßm to".
VΦera jsme s Danem opravovali n∞jakou reklamu s Φe╣tinou. Zobrazovala se ka╛dΘmu jinak, proto╛e chyb∞lo k≤dovßnφ. Z technick²ch d∙vod∙ ne╣lo pozm∞nit ani http hlaviΦku, ani zadat meta tag do hlaviΦky html strßnky. V tu chvφli jde pou╛φt jenom zßpis Φesk²ch znak∙ pomocφ UTF entit. Pomohl nßm UTF p°evodnφk Stanislava Pechy.
T°eba slovo ╛est∞ se pomocφ UTF entit zapφ╣e do html jako žestě a jsou pak vid∞t sprßvn∞ Φesky v jakΘmkoliv k≤dovßnφ. Je╣t∞ nevφm, jestli i na ka╛dΘm star╣φm prohlφ╛eΦi, to asi ne. To musφm je╣t∞ po°ßdn∞ otestovat. NedoporuΦuji takhle zapisovat ΦeskΘ texty, ale na reklamy, kdy╛ je pot°eba opravit jedno dv∞ pφsmenka, se to hodφ.
Mirek Zeman na Lup∞ prozradil, ╛e Contactel prodal Red Box a ╛e ho prodal Empyreu. RedBox.cz je portßl, Empyreum je spoleΦnost vlastnφcφ vyhledßvacφ technologii Empyreum Fultext TM. Je╣t∞ loni ten fulltext kraloval ΦeskΘmu fulltextovΘmu trhu (v²sledky od n∞j bral mj. Seznam), ale proto╛e neaktualizoval data, o svΘ postavenφ p°i╣el. Nynφ tedy koupil portßl. Zvlß╣tnφ -- normßln∞ jsou fulltexty kupovßny majiteli portßl∙, toto je opaΦn² p°φpad.
pond∞lφ, 7. Φervenec 2003
P°ehled nßv╣t∞vnosti velk²ch server∙ podle idotu komentuje P∙. V╣imnul jsem si toho a╛ te∩, je to zajφmavΘ (a p°ijde mi, ╛e i nezaujatΘ) hodnocenφ. ZejmΘna jsem si pov╣imnul v²sledku televiznφ kampan∞ Centra = prakticky ╛ßdn² nßr∙st nßv╣t∞vnosti.
ned∞le, 6. Φervenec 2003
Zvykl jsem si pro rychlou orientaci v blozφch pou╛φvat blogportßl na adrese http://blogportal.hlava.net. M∞l jsem tam hezky vyrovnanΘ a obarvenΘ blogy. Od tohoto vφkendu je na tΘ adrese ale Nov² blogportßl. ┌pln∞ jin², funguje to jinak, moje nastavenφ je v trapu.
⌐koda, ╛e tam n∞kde nez∙stal ten star² blogportßl. Mo╛nß bych se v tom novΘm nauΦil pracovat, ale jaksi nemßm motivaci. Nainstaluju si koneΦn∞ n∞jakou rss ΦteΦku. Kdybych si toti╛ do blogportßlu zase navolil do oblφben²ch v╣echny oblφbenΘ blogy, nemßm te∩ ╛ßdnou d∙v∞ru v to, ╛e mi to zase p°es vφkend nezmizφ.
Jirka Kosek n∞kde p°ednß╣el o XML schΘmatech a dal na web materißly z p°ednß╣ky. XML schΘmata (jak jsem to pochopil) jsou modernφ nßhradou za DTD. AΦkoli DTD stßle dob°e slou╛φ, p°i po°ßdnΘ prßci se narß╛φ na mnohß omezenφ DTD (nap°. datovΘ typy) vΦetn∞ divnΘ syntaxe (DTD nenφ XML). Z Koskov²ch slid∙ toho mo╛nß moc nepochopφte, ale doporuΦuji proklikat si to. Jß jsem se tφm alespo≥ zorientoval v problematice.
Mimochodem "slidy" z p°ednß╣ek Jirky Koska jsou krßsnou ukßzkou toho, na co se dß taky pou╛φt jazyk HTML. A taky XML. Nepochybuji, ╛e je to autor celΘ p∙vodn∞ napsal v XML (asi Emacsem) a do HTML vyexportoval p°es XSLT.
Souvisejφcφ: XML schΘmata a DocBook, Roman "Dagi" Pichlφk, Dagblog
st°eda, 2. Φervenec 2003
Nedßvno jsem vyslovil nßzor, ╛e by bylo dobrΘ vymyslet ΦeskΘ slovo pro "strßnky, kterΘ k sob∞ pat°φ", p°eklad anglickΘho slova "site" aneb "web site". Do╣lo mi dost zajφmav²ch nßzor∙. Na╣t∞stφ nemusφm rozhodnout v²sledek, rad∞ji ocituji nßzory a argumenty. Prvnφ se ozval David BubenφΦek:
╚eΦe, je to zapeklitΘ. Slovßci tomu °φkajφ nßdhern∞ - webka :] Taky jsem nad tφm del╣φ dobu ne·sp∞╣n∞ vßhal - p°iklßn∞l bych se k v²razu web.
Druh² se ozval Daniel DoΦekal:
Web site = webovΘ mφsto. Ji╛ dlouho pou╛φvanΘ
Pozd∞ji to Daniel podpo°il argumentem, ╛e mφsto je sprßvn² p°eklad a je to tak ve v╣ech slovnφcφch. Dopsal ov╣em smajlφk :-). Jak to vidφ Ji°φ Bure╣:
Sφdlo, webovΘ sφdlo. "Strßnky" bych ale za ubohΘ nepova╛oval. Spφ╣ mi jako ubohost p°ipadß ≥∙spφk n∞kter²ch "borc∙" s jejich sajty, sajtnama apod.
StejnΘho p°ekladu se zastal i dal╣φ patriot ΦeskΘmu jazyku Martin Kopta:
Bonjour, Yuh∙, pou╛φvßm prost∞ sφdlo. Dokonce jsem kdysi -- tu╣φm v roce 1998 -- m∞l na vizitce napsßno "sprßvce webov²ch sφdel". Tehdy mi "webmaster" zn∞l moc proflßkle a "domovnφk" je trochu zavßd∞jφcφ.
Jß ov╣em musφm dodat, ╛e by m∞ u Martina na vizitce nep°ekvapilo v∙bec nic, proto╛e podle zasv∞cen²ch osob je asi tak dvakrßt ╣φlen∞j╣φ ne╛ jß a to u╛ je co °φct. Zp∞t ale k problematice site. Pavel Kout pou╛φvß oznaΦenφ www-projekt, kterΘ se mi docela lφbφ:
Mφsto v²razu "site" nejΦast∞ji pou╛φvßm "www-projekt", znφ to Φesky a celkem to vystihuje skuteΦnost (ale mo╛nß se a╛ moc zam∞°uju na zßkaznφky :-)
Nechßvßm to otev°enΘ. Kdybyste m∞li n∞jakΘ nßpady nebo dal╣φ argumetny, napi╣te mi.
Reakce: Medvφdek P∙ obhajuje slovnφkov² p°eklad "mφsto". Argument je, ╛e se to tak v odbornΘ literatu°e p°eklßdß dlouho. Mimochodem, strßnka se zab²vß obrßzky zasßdrovan²ch JaponeΦek, zajφmavΘ.
Pixy napsal velk² p°φsp∞vek Je╣t∞ k p°eklßdßnφ website:
... AngliΦtina je idiomatick² jazyk, slo╛eniny a nasazovßnφ neologick²ch homonym jsou zcela be╛nΘ v∞ci. V Φestin∞ to samΘ p∙sobφ jak p∞st na oko a musφ se pou╛φvat jinΘ postupy...
P°edtφm Pixy v po╣t∞: Jß jsem taky pro web. Mφsto a sφdlo jsou p°φ╣ernosti a jsou to p°edev╣φm nßsilnΘ kalky, kterΘ v Φe╣tin∞ nedßvajφ smyl. Pou╛φvßm web, ve dvou v²znamech - 'web' an sich je celek, v╣echno za http://, 'n∞Φφ web' je pak ta website...
Zku╣en² personalista Ji°φ Navrßtil na Lup∞ pφ╣e o tom, jak se m∞nφ situace na poli shßn∞nφ programßtor∙ do profesionßlnφch t²m∙. Oproti nedßvnΘ minulosti nenφ jednoznaΦn∞ preferovßna znalost programovßnφ, n²br╛ tΘ╛ komunikaΦnφ schopnosti, zam∞°enφ na produkty a v╣eobecn² rozhled. AΦkoli v∞ci v Φlßnku popisovanΘ zn∞jφ na prvnφ pohled samoz°ejm∞ (a Φlßnek se tak zprvu zdß b²t lacin²m), posun je ilustrovßn na skuteΦn²ch datech z personßlnφch server∙ a rozebrßn z mnoha hledisek.
Posun mohu potvrdit -- kdy╛ jsme loni shßn∞li do t²mu dal╣φho webmastera, vybφrali jsme spφ╣e podle vystupovßnφ uchazeΦ∙ ne╛ podle jejich k≤d∙ (co╛ se vyplatilo).
Z p∞knΘ diskuse pod Φlßnkem bych rßd upozornil na p°φsp∞vky Michala Illicha a Salka (odkaz na v²sek z diskuse).
Je╣t∞ nedßvno jsem nev∞d∞l, co sed je. Jde o program pro automatickΘ zpracovßnφ textu. Funguje na Linuxu a na Unixu, jde mo╛nß o nejstar╣φ pou╛φvan² "skoro editor", spou╣tφ se z p°φkazovΘ °ßdky. Manußl sedu napsal na Root.cz Jan «alman. Jsem p°esv∞dΦen, ╛e se bude hodit, vypadß to Φtiv∞. P°φ╣t∞ tam dopφ╣e i n∞jakΘ p°φklady.
·ter², 1. Φervenec 2003
Lemmatizace je p°evod slov textu na zßkladnφ tvary (prvnφ pßdy). Oproti tomu stemming je p°evod na kmenovΘ tvary. V angliΦtin∞ je to totΘ╛, v Φe╣tin∞ nikoli. Dozv∞d∞l jsem se to z Φlßnku ╚esk² lemmatizßtor: ProΦ a hlavn∞ jak?, kter² napsal loni v lΘt∞ Petr Strossa na Scienceworld. Nasti≥uje problematiku homonomiφ, co╛ je t°eba slovo "tancφch", kterΘ m∙╛e znamenat tanec i tank. To se °e╣φ porovnßvßnφm se slovnφkem. V Φlßnku je dost nßpad∙ kolem algoritimizace a indexovßnφ vyhledßvaΦe lemmatizßtorem.
Lemmatizaci pou╛φvajφ dnes dva p°ednφ ΦeskΘ vyhledßvaΦe Jyxo a Morfeo (nedßvno WebFast). Jejich porovnßvßnφm se zab²vß lupnφ Φlßnek Jak se hledß na Jyxu, ve kterΘm nejsou ╛ßdnΘ podstatnΘ informace. Leda snad ╛e Jyxo hledß vlastn∞ stejn∞ ·sp∞╣n∞ jako Morfeo, ale jenom mo╛nß, anebo je taky mo╛nß lep╣φ. Alespo≥ jsem tam na╣el odkaz na ten hornφ Φlßnek.