31. prosince 2009

Tweeting Off My Dying Day: Excerpt II

Abych pridal nahodnosti obsahu L3.Malcolmova blogu, rozhodl 'sem se prispet vynatkem z me pred-novorocni kolaze, jiz 'sem nazval "Tweeting Off My Dying Day" Lec je prispevek kratky, povazuji jej za hodnotny prinos pro ctenare, at uz se po blogu potuluje z jakehokoli duvodu.

13:45 | Pt. II: Co podniknout s dnesnim dnem?

Sedim v silene obeznich ponozkach a hledim na monitor preze dvi paru cpicich hrnku prihrateho, bilinneho vyluhu. Beze zdani, snad ocekavam nenadaly zachvat pracovniho zapalu. Zrejme bych jej v teto chvili ocenil...
16. prosince 2009

Demarketing

Pojem demarketing je dle serveru www.businessdictionary.com definován jako úsilí, jehož cílem je odradit (nedestruktivním způsobem) poptávku po daném výrobku či službě, kterou firma za prvé nemůže nabídnout v dostatečné množství nebo za druhé v daném regionu jsou příliš vysoké náklady a společnost by měla příliš malý zisk. Obecné demarketingové strategie zahrnují například nízké ceny a nízkou reklamu produktů.

Lze tady říci, že demarketing je pokus obchodníků o snížení (odklonění nežádoucí) po-ptávky po výrobku (službě) po kterém je vyšší poptávka než je výrobce schopen produko-vat. Snaha o omezení poptávky může mít buďto dočasný nebo trvalý charakter. Dočasně může chtít společnost snížit poptávku po nějakém výrobku z důvodu rozšiřování výroby, nedostatečné připravenosti atd. Tento přístup může být použit jak v sektoru soukromém, tak i ve veřejném. Demarketingové strategie se týkají zvyšování cen, omezování reklamy a propagační činnosti nebo odstranění výhody výrobku. Neklade si za cíl zničit poptávku, ale pouze ji snížit aby byla na úrovni schopností produkce daného statku. Obchodníci se často snaží selektivním demarketingem snížit poptávku na určitém trhu, který je pro ně méně výhodný než ostatní trhy pro daný výrobek. Těmi trhy jsou například ty, kde jsou příliš vysoké náklady na výrobu, reklamu nebo propagaci výrobku.

Dalšími příklady demarketingu může být například snaha vlády v teplých, suchých letních měsících snížit spotřebu vody obyvatelstva nebo kampaň zahájená Ministerstva dopravy ČR nazvanou „Nemyslíš, zaplatíš“, která má varovat a alespoň částečně ukáznit řidiče, kteří používají různé dopravní prostředky. K tomu může využívat různá media pro komunikaci s veřejností (TV, rádio, tisk atd).

Demarketingová strategie je zaměřena na zachování dobrého jména klienta v době, kdy požadavky zákazníků nejsou přiměřené. V dlouhodobém horizontu má tento přístup vést ke zlepšení výnosů. Existují tři různé formy demarketingu. První je nazývaná obecný demar-keting. Je používaná když chce společnost snížit množství celkové poptávky. Druhým je tzv. selektivní demarketing, tím se společnost snaží snížit poptávku po statku na určitém trhu nebo se snaží odradit určitou skupinu zákazníků. Závěrečný typ demarketingu je jen zdánlivý demarketing. Demarketing lze rozdělit též dle stupně, který snižuje či reguluje poptávku. Dělí se na demarketing pasivní, aktivní a kompletní. Kompletní demarketing je využíván při ukončení prodeje a produkce daného výrobku.

Příkladem demarketingu může být dle mého názoru například snaha různých výrobců elek-troniky o protlačení svých nových výrobků na trh, tak aby se na něm prosadili. Každá firma chce na trhu uspět a právě proto používá takovéto strategie. Snaží se na svém novém vý-robku demonstrovat v čem všem je lepší a proč si ho má případný zájemce koupit. Tito výrobci srovnávají své výrobky, jeden starý a druhý nejnovější a poukazují na jejich rozdíly. Příkladem takovéhoto demarketingu může být uvedení DVD přehrávačů na trh. Původně zde byly video rekordéry, ve kterých se používaly video kazety. S příchodem právě DVD přehrávačů výrobci presentovaly výhody jako: lepší kvalita obrazu, lepší kvalita zvuku, lepší úschova medií (zejména díky velikosti) na kterých je daný film uložen.

Těmito kroky se snažili výrobci přimět zákazníky přestat kupovat obyčejné video rekordéry a tím utlumit poptávku po výrobku, který je zastaralý a v blízké budoucnosti se má přestat úplně vyrábět. Cílem této demarketingové strategie byla tedy snaha o omezení poptávky trvalého charakteru. Samozřejmě druhou stranou mince bylo to, že se snažili přimět k nákupu novějšího DVD přehrávače.

Naprosto obdobná situace nastala o několik let později, kdy se na trhu snaží prosadit Blu-Ray přehrávače. Výrobci opět presentují jeho lepší obraz, zvuk a mnohé další výhody. I DVD přehrávače se pravděpodobně během několika let přestanou vyrábět. Ovšem Blu-Ray není jasný vítěz souboje o příští rozšířený video přehrávač.
15. prosince 2009

Moderní metody data miningu

Data mining je proces získávání znalostí z databáze – pojem data mining bývá někdy používán jako synonymum k pojmu KDD (objevování znalostí v databázích). Data mining bývá v širším slova smyslu definován jako získávání dosud neznámých, ověřených a použitelných znalostí z rozsáhlých databází pro provádění klíčových manažerských rozhodnutí. [1]

Podstatou procedur a metodou práce v oblasti získávání relevantních informací ze souborů dat je vedle klasických statistických postupů rovněž řada úloh založených na:

1.      stromové struktuře informací,
2.   neuronových sítích,
3.   genetických algoritmech,
4.   netradiční (třírozměrné) vizualizaci údajů a
5.   stochastické predikci ekonomických časových řad. [2]

Stromová struktura informací

Cílem analýzy dat v oblasti klasifikací je vytváření stromové struktury informací, která se následně stane základem pro tvorbu strukturovaných manažerských rozhodnutí uvnitř organizace i ve vztahu organizace k okolí. Pro usnadnění práce v této problematice již v současné době existuje řada standardních algoritmů.

Praktickým příkladem může být následující. Výrobce osobních automobilů se rozhodne ke změně svojí cenové strategie na trhu. Management dané společnosti může postupovat ve třech krocích a to:

1. stanoví si „proměnnou“, kterou chce odhadovat. V tomto případě to budou spotřebitelské postoje vzhledem k měnící se cenové strategii. Tato proměnná má charakter proměnné vysvětlované, a musíme k ní proto nejdříve hledat proměnné vysvětlující, které budou sloužit k objasňování motivů v chování spotřebitelů. Tyto vztahy mohou být jak kvalitativní, tak i kvantitativní;

2. v další fázi pak musí vysvětlující proměnné (např. příjem respondenta, jeho postoj ke značce výrobku) významově shlukovat a současně vytvářet skupiny hodnot, aby zjistil, zda pro chování spotřebitele je určující rozdílnost mezi skupinami (meziskupinová variabilita) či rozdílnost hodnot uvnitř skupin (vnitroskupinová variabilita). K posouzení těchto skutečností slouží řada statistických testů;

3. vytvoří stromovou strukturu zvažovaných vysvětlujících proměnných od těch proměnných, které nejvíce ovlivňují postoje spotřebitelů k cenové strategii, až po ty nejméně významné vysvětlující proměnné. [2]

Větvené rozhodování vyvíjí alternativy postupně v několika sledech. Jde o model dynamický. Původní aplikace v praxi se zaměřovala hlavně na investiční úkoly a projekty. Větvené rozhodování se hodí všude tam, kde je třeba základní směry řešení rozvádět do dalších hledisek.

K formalizaci rozhodovacího procesu se využívá větveného grafu. Větvený graf pracuje s uzly a s hranami. Uzel je okamžik (bod), ve kterém dochází k rozhodnutí. Uzel může být deterministická (označuje situaci, v niž volí rozhodovatel z následujících variant další činnost podle své vůle), nebo stochastický (označuje situaci, kdy dochází k jednomu z několika možných průběhů v závislosti na náhodných vnějších vlivech). Hrany (činnosti) znázorňují možné průběhy následující po rozhodnutí ve styčnících (uzlech). Deterministické hrany vycházejí z deterministického uzlu a volbu varianty provádí rozhodovatel bez vnějších vlivů (dle své vůle). Naopak stochastické hrany následují po stochastickém uzlu. Závisejí na náhodných jevech, které rozhodovatel nemůže ovlivnit. [2]

Základním rozlišovacím hlediskem při třídění je míra informovanosti. Z tohoto hlediska rozeznáváme dva základní typy:

a) rozhodování za jistoty (deterministický model) a
b) za nejistoty – rizika (stochastický model)

V praxi jsou nejčastěji používány modely smíšené. Stochastický model je takový, která obsahuje jeden nebo více stochastických uzlů. Důležitým hlediskem při používání rozhodovacích stromů je počet účelových funkcí, které při řešení využíváme. Může to být jedna účelová funkce (např. minimální výrobní náklady), nebo dvě a více. [2]

Neuronové sítě

Neuronové sítě jsou koncipovány na analogii s funkcí neuronu v lidském mozku a používají se především v oblasti ekonomických předpovědí. Umělý neuron pracuje na podobných principech jako biologický. Vstupní informace jsou váženy vahami, odečítá se prahová hodnota a pomocí aktivační funkce se signál transformuje na výstupní signál. Výstupní signál je předán následujícím umělým neuronům ve skryté, resp. výstupní vrstvě.

Přenosová funkce neuronu je funkce, která transformuje vstupní signál na signál výstupní v intervalech 0 až 1 a -1 až +1. Funkce může být skoková či spojitá a musí být monotónní (přiřazení odezev výstupu na vstup je jednoznačné). Pro správný chod neuronu a neuronových sítí je důležité, jakou přenosovou funkci zvolíme. Mezi nejpoužívanější funkce patří:

1. perceptron
2. binární
3. logistická (sigmoida)
4. hyperbolický tangens

Prvky umělé neuronové sítě jsou spolu navzájem propojeny. Síť tak realizuje paralelní zpracování vstupních dat. Finálním produktem umělých neuronových sítí je výstup určité informace generovaný strukturovanou informací ze vstupu do systému. Tento výstup je obvykle nelineární funkcí váženého součtu těchto vstupů. Váhy přiřazené každému ze vstupů jsou odhadovány na základě procesu učení, kdy průběžně generované výstupy jsou porovnávány s výstupy cílovými. Získané odchylky mezi známými výstupy a získanými výstupy jsou korigovány a slouží jako zpětná vazba pro postupnou úpravu vah vstupů v nelineárním funkčním předpisu.

Neuronová síť se tedy skládá ze tří základních částí:

a) umělých neuronů,
b) spojení umělých neuronů a
c) vrstev neuronové sítě

Umělé neurony a jejich spojení jsou organizovány do vrstev, které jsou nejčastěji tři:

a) vstupní
b) skrytá
c) výstupní

Typy neuronových sítí:
Neuronové sítě mohou obsahovat různé přenosové funkce, spojení mezi sebou a adaptivní – učící algoritmus. To vše pak určuje, o jakou síť se jedná. Technické neuronové sítě se dělí podle několika kritérií.

Podle počtu vrstev
·        - s jednou vrstvou (Hopfieldova síť, Kohonenova síť)
·         - s více vrstvami (ART síť)

Sítě s jednou či dvěma vrstvami bývají většinou speciální sítě, které mají svůj speciální učící algoritmus a topologii, zatímco pro sítě se třemi a více vrstvami se obvykle používá klasická vícevrstvá síť s algoritmem Backpropagation.

Podle algoritmu učení
·         - učitelem (síť s algoritmem Backpropagation)
- bez učitele (Hopfieldova síť)

Učení s učitelem znamená, že se síť snaží přizpůsobit svou odezvu na vstupní informace tak, aby se její momentální výstup co nejvíce podobal požadovanému originálu. Bez učitele je proces, ve kterém síť vychází z informací, které jsou obsaženy ve vstupních vektorech.

Podle stylu učení
·         - s deterministickým učením (algoritmus Backpropagation)
·         - se stochastickým učením (náhodné nastavení vah) [2]

V případě, že se jedná o zjištění vah sítě výpočtem, pak mluvíme o deterministickém učení. Jestliže získáváme váhy pomocí generátoru náhodných čísel, mluvíme o stochastickém učení. Tento způsob se obvykle používá jen při startu sítě.

Neuronová síť na svém začátku neumí téměř nic. Musí se učit a k tomuto účelu byly vyvinuty algoritmy, pomocí kterých se příslušná síť naučí danou množinu informací. Algoritmus se obvykle dělí na dvě fáze, a to fázi aktivační (vybavovací) a adaptační (učící), která ke své činnosti potřebuje trénovací množinu.

Jedním z hlavních důvodů velkého rozmachu neuronových sítí je jejich pružnost, flexibilita. Neuronové sítě mohou být lepší než tradiční metody předpovídání pro měsíční a čtvrtletní časové řady. Jsou lepší než tradiční metody předpovídání pro dlouhodobé předpovědi, ale často jsou tak dobré jako tradiční metody s krátkodobým časovým horizontem.

Genetické algoritmy

Genetické algoritmy byly odvozeny na základě biologické genetiky a teorie evoluce, která ovlivňuje vývoj všeho živého na této planetě. Na stejných základech pracují i genetické algoritmy v počítačových aplikacích. Náhodně je vygenerována množina chromozomu, ze které jsou vybírány dvojice (rodiče) na základě toho, jak dobře splňují kriteriální funkci. Potomci jsou tvořeni polovinou z každého rodiče a nahrazují je.

Struktura genetického algoritmu
Vlastní algoritmus genetické optimalizace je cyklus, ve kterém jsou vytvářeni noví potomci, kteří jsou použiti jako rodiče v dalším cyklu. Po každém cyklu se vyhodnocuje vhodnost potomka a na základě toho se buď pokračuje na ohodnocení, nebo se končí. Vlastní cyklus genetického algoritmu je následující: 


1)      Navržení genetické struktury
Při navrhování genetické struktury je důležité, jak budou reprezentovány jednotlivé alely (váhy) a jak budou v jednotlivých chromozomech rozmístěny. Reprezentace alele a rozmístění v genech ovlivňuje výkonnost příslušného algoritmu.
2)      Inicializace
Je to v podstatě jednoduchý proces, kdy se náhodným způsobem (pomocí generátoru náhodných čísel), vygeneruje populace prvotních rodičů.
3)      Ohodnocení
a)      Konverze genotypu na fenotyp
Je to proces, kdy se použití binárních genů provede přepočet na dekadickou hodnotu.
b)      Ohodnocení objektivní funkce
Počítá se výsledek objektivní funkce. Obvykle se předpokládá, že daná funkce je ovlivňována všemi geny zhruba stejně významně.
c)      Konverze objektivní funkce na vhodnost
Objektivní funkce se musí zkonvertovat na hrubou vhodnost, která je zkonvertována na jemnou vhodnost a to z důvodu přirozeného výběru. U jedinců s příliš vysokou vhodností je tato snížena, zatímco průměrné hodnoty jsou nedotčeny.
d)     Konverze vhodnosti na selekci rodičů
Je to operace, při které se určí, který jedinec a kolikrát bude vybrán k vytvoření potomka.
4)      Volba rodičů
V tomto kroku je vytvořeno pole, které bude nejprve vyplněno rodiči s nejvyšší selekcí, poté rodiči s menší selekcí až po jedince se selekcí menší než 1. Z tohoto pole se pak budou pářením vytvářet noví potomci.
5)      Reprodukce
Při reprodukci dochází k dělení chromozomů a vytváření potomků.
6)      Mutace
Jsou nezbytnou součástí genetických algoritmů. Díky nim lze mnohdy najít nové lepší jedince, kteří lépe vyhovují okolním podmínkám. V podstatě existují dvě základní cesty, jak přistupovat k mutaci. První je mutace s malým účinkem, ale s vysokou četností výskytu. A druhý typ je menší četnost výskytu s větším účinkem. Rozpoznání vhodné metody je obtížný úkol.
7)      Zpět na 3) nebo konec [2]

Genetické algoritmy souvisí s neuronovými sítěmi přes jejich váhy.

Netradiční (třírozměrná) vizualizace údajů

Netradiční vizualizace údajů je postup, který v manažerských rozhodováních nabývá stále většího významu. Rozsah a rychlost příchodu informací do rozhodovacího procesu nutí jejich uživatele k větší absorpci a selekci údajů při nutnosti zachovat ekonomii reálného času zpracování a vyhodnocení těchto přicházejících informací. Proto používání grafů může manažerům tyto pracovní fáze výrazně usnadnit a urychlit. Jde především o metody tzv. exploratorní analýzy dat, kam patří například nejrůznější grafy (krabičkový graf, vícerozměrný komparativní krabičkový graf, vnější a vnitřní hradby, rootogram a další). Tyto metody obvykle nemohou v plné míře nahradit komplexní statistickou analýzu přicházejících dat, ale jsou často alespoň efektivním kompromisem mezi reálným časem zpracování dat a kvalitou manažerského rozhodování.

Průzkumová (exploratorní) analýza dat je tedy souhrn datově orientovaných statistických technik, které lze stručně popsat následovně:
·         - Jsou založeny na grafických přístupech při vyhledávaní typických vlastností dat,
·         - Využívají soustavy robustních kvantilových charakteristik,
·         - Předpokládají interaktivní práci s daty na počítači.

Za svůj vznik vděčí tyto techniky především rozvoji počítačové grafiky. Grafický přístup je vysoce názorný, ale zároveň jsou výsledky méně jednoznačné než při numerickém zpracování.

Doménou průzkumové analýzy dat jsou ovšem různé typy grafické prezentace dat, umožňující posuzovat charakteristické vlastnosti a zvláštnosti dat jako celku i jejich jednotlivých případů.

·         Diagram rozptýlení, který je konstruován tak, že na vodorovnou osu je vyneseno pořadové číslo měření a na svislou osu naměřená hodnota. Body v grafu umožňují identifikovat odlehlé hodnoty, stupeň asymetrie, místa huštění a zředění dat i případné pravidelnosti v datech.

·         Krabicový graf, sestrojený jako obdélník s příčkou, která udává polohu mediánu souboru. Obě užší strany obdélníku leží postupně v hodnotách dolního a horního kvartilu. Z obou protilehlých stran vycházejí úsečky, které končí v minimální a maximální hodnotě. Tento graf umožňuje posuzovat symetrii dat a výskyt odlehlých hodnot.

Graf rozptýlení s kvantily je graf, který obsahuje spojnici bodů o souřadnicích [x(i), pi] na pozadí kvantilových obdélníků, sestrojených pro kvartily, oktily a sedecily. Tímto grafem lze komplexně posoudit prakticky všechny vlastnosti dat.[2]

V případě podrobení dat statické analýze, představují informace, které jsou obsažené v exploratorních grafech cenné vodítko, pokud jde o výběr statistické metody. V praxi je často nutné provést třídění souboru jednotek podle více než jednoho znaku. Třídění podle nejméně dvou znaků může být prováděno jako třídění vícestupňové (hierarchické), kdy je soubor tříděn v postupných krocích a třídění podle každého dalšího znaku je prováděno uvnitř tříd, vytvořených podle znaku předchozího nebo jako třídění kombinační, kdy (nejčastěji podle dvou znaků) je třídění prováděno současně podle více znaků.

Výsledek kombinačního třídění můžeme prezentovat v kombinační tabulce (v případě alfabetických znaků tabulku označujeme jako kontingenční, v případě numerických znaků jako tabulku korelační). Ke grafickému znázornění výsledků kombinačního třídění se využívá prostorových 3D grafů. S rostoucím počtem znaků klesá přehlednost třídění a zejména kombinační třídění je v tomto případě nutno provádět ne do jedné tabulky, ale do systému tabulek.

Stochastická predikce v ekonomických časových řadách

Stochastická predikce v ekonomických časových řadách je založena jak na dnes již standardních postupech analýzy časových řad (především Boxova-Jenkinsova metodologie), tak na některých netradičních metodách konstruovaných pro speciální rozhodovací schémata (např. metody nepřímých odhadů čtvrtletních hodnot agregátů v systému národního účetnictví). Nemalou roli začínají hrát v oblasti predikcí také neuronové sítě.

Boxovy-Jenkinsonovy modely patří mezi stochastické modely, které mohou modelovat trend i sezonnost. Jsou flexibilnější než klasické dekompoziční modely, ovšem jejich jistou nevýhodou je potřeba poměrně dlouhých časových řad (minimálně 50 pozorování), náročnost zpracování a problematická je také pro méně zkušeného uživatele i interpretaci výsledných modelů. Boxovy-Jekinsonova metoda patří mezi tzv. adaptivní přístupy, tzn. že  je schopná přizpůsobovat se změnám v průběhu časových řad i v ekonomikách procházejících rychlými změnami.

V Boxově-Jenkinsonově metodologii rozlišujeme při práci s časovou řadou následující kroky:


·         - transformace dat časové řady tak, abychom odstranily případný trend a sezonnost v datech,
·         - identifikace modelu, což je rozhodnutí, jaký typ modelu vybrat a explicitně určit tzv. řád modelu,
·         - odhad parametrů modelu,
·         - diagnostické ověřování modelu, které má potvrdit nebo zamítnout vhodnost sestrojeného modelu,
- výpočet předpovědi pro vybraný a ověřený model. [2]



Použitá literatura


[1] KLÍMERK, P. Studijní pomůcka pro distanční studium. 1. vyd. Zlín: UTB ve Zlíně, 2006. 168 s. ISBN 80-7318428-1
[2] KLÍMEK, P. Ekonomické aplikace statistiky a data miningu. 1. vyd. Bučovice: Martin Stříž, 2008. ISBN 978-80-87106-10-5



Translate

Návštěvnost

About Us