pondělí 28. ledna 2013

Vsázka

Predikuji, že do dvaceti let Američané začnou používat šťávy. Už teď používají džusy z koncentrátů a colu z post-mixů. A při vzrůstající averzi Američanů k neekologickému chování jsou šťávy logickým vyústěním. Zbaví se tím jak plastových láhví, tak nákladů na jejich převoz.

Proč anglická Wikipedia stagnuje

Počet přibývajících článků na anglické Wikipedii má podobu klasické nasycovací S-křivky a totéž platí o počtu oprav. A Kaggle vyhlásilo soutěž na zjištění příčiny.


Dovolil bych si ale odhadnout příčinu a její možné řešení i bez nahlédnutí do dat. Stávající obsah dat nebo její forma reprezentace se nasytili. Wikipedia je založena na textovém obsahu. Jakmile ale článek nakyne do obézní velikosti, lidi přestanou být motivováni ho rozšiřovat. Naopak by ho raději viděli kratší. Pokud jste se ale někdy pokoušeli zkrátit 100 stránkovou studii na stránku, abyste ji mohli publikovat, víte, že zkracování článku je obtížný problém. A tak lidi raději nechávají články tak, jak jsou.

V případě multimediálního obsahu ale Wikipedia nenabyla nasycení. Problémem je spíše pracnost vložení multimediálního obsahu. Jak například přidám obrázek do pravého horního rohu. Jistě je na to šablona, ale kde ji najdu? Jak ji použiji? A už to začíná být složité. Jako řešení bych viděl přidání placeholderu do článků bez jediné fotografie, který by říkal: "Buďte první, kdo přidá fotografii". Po kliknutí by se objevil dialog pro nahrání fotografie z disku. Po nahrání by se ještě objevil formulář pro vyplnění důležitých metainformací, jako zda jste majitel. A Wikipedia by měla novou fotografii.

Věřím, že tenhle přístup by měl úspěch. Když člověk vidí, že článek není kompletní, je motivován ho doplnit, když může. Nahrání fotografie je jednoduché. To zná z facebooku. A doplnění metainformací? Když už se dostal až sem, tak se nevzdá na nějakém formuláři a vyplní ho. Navíc díky tomu, že se umožní jen nahrávání z počítače, tak lidi budou motivováni nahrávat jen originální fotografie, protože nahrání fotografie z internetu by bylo obtížné. Najít fotografii na Googlu, stáhnout, nahrát a nakonec ještě vyplnit formulář. Pochopitelně by byla potřeba kontrolovat, že data opravdu nejsou z internetu. Na to ale stačí automatický dotaz na Google. Když Google najde na internetu hodně podobných fotografií a nahrávač nevyplnil podrobné informace o autorství, pravděpodobně se jedná o pro Wikipedii nepoužitelnou fotografii.

U audia by byl postup podobný. Je daný článek o hudbě? Tak šup tam s audio placeholderem, ať lidi nahrávají. U skladeb starších 150 let a vlastních interpretací by to neměl být problém. Obdobně u videa nebo ontologických tagů. Zobrazte, že tam nějaká informace chybí, a někdo ji vyplní.

Z jiného soudku: občas se mi na Wikipedii stane, že pochybuji o správnosti uvedené informace. Ale nedaří se mi nikde najít informace potvrzující nebo vyvracející moji hypotézu. A tak to nechám být. Přitom bych se ale strašně rád podělil o mých pochybnostech. Psaní komentáře je složité a ponižující. Kdo by se taky veřejně hlásil k tomu, že je debil, že nechápe tak evidentní věc? Místo toho navrhuji implementovat obdobu funkcionality na Brittanice. Člověk pochybující o zobrazené informaci by ji probarvil, objevila by se kontextová nabídka a uživatel by zaškrtl: "navrhnout k revizi". A pilní wikipedisté by potom procházeli nejčastěji označovaná místa a opravovali je. Ať už opravou chyby, změnou formulace, přidáním vysvětlení nebo reference.

Jinak řečeno. Až uživatelům dáte prostor k vylepšování Wikipedie, rádi pomůžou, jako již dříve pomohli.

Update: v prosinci 2013 jsem zaznamenal, že na http://cs.wikipedia.org/wiki už začaly používat obrázkový placeholder:

pondělí 7. ledna 2013

3 mé výhody a nevýhody

  1. Mojí nevýhodou je nerozhodnost. Když se mne zeptáte, zda chci k snídani kakao nebo čaj, zaseknu se na půl minuty, než si to rozmyslím. Na druhou stranu mne ale tahle nedokonalost motivuje ke studiu rozhodování - machine learningu. Schválně až někdy půjdete k doktorovi, všímejte si, že očaři nosívají brýle a ušaři bývávají nedoslýchavý. Já jsem nerozhodný a studuji machine learning.
  2. Další nevýhodou je, že jsem detailista. Nad některými věcmi zbytečně strávím věčnost, jiné k mé škodě přehlížím. Na druhou stranu jsem díky této vlastnosti schopen vyřešit i zapeklité problémy, které ostatní vzdají.
  3. Jsem zapomnětlivý. Takže musím být organizovaný.