úterý 7. prosince 2010

Rozdíl mezi statistikou a data miningem

Statistici počítají s malým množstvím dat a snaží se z nich vyždímat co nejvíc. Naopak v data miningu se pracuje s velkým počtem dat a člověk se z toho snaží dostat alespoň něco. Každý směr má něco do sebe, zatímco statistika je vhodná pro úlohy typu testování léků, kde každý experiment stojí nemalé peníze, data mining se hodí na data generovaná počítači, kterých je obrovské množství a přitom zadarmo. A tím pádem se kladou rozdílné požadavky na používané nástroje. Zatímco u statistiky je jedno, jak rychlý je algoritmus, protože stejně běží jen na pár málo datech, u data miningu je rychlost jedna z ctností. Statistika naopak vyžaduje rigoróznost metody, zatímco u data miningu je jedno, jak to děláte, hlavně když to dává výsledky.

Žádné komentáře:

Okomentovat