Kategorizace a klasifikace: studijní opora

4. Kategorizace jako objektivní proces organizace znalostí

V rámci "umělé" kategorizace lze rozlišit tři typy, založené na různých způsobech určování ekvivalence: systémový/obsahový přístup a "nesystémové" přístupy formální a subjektivní.[1]

Systémový přístup ke kategorizaci

Přístup ke kategorizaci, který pracovně nazýváme "systémový", hraje klíčovou roli v organizaci znalostí. Je založený na ekvivalenci obsahu. V lingvistice se pro tento typ ekvivalence tradičně používá označení synonymie. Podle systémových komponent zastoupených v kritériu ekvivalence lze rozlišit několik typů kritérií obsahové ekvivalence: struktura, funkce, vztahy, prvky, vlastnosti, hodnoty.

Ve všech případech systémového přístupu je ekvivalence určená zevnitř, obsahově, analýzou struktury (tím, co jsme zjistili, "co to je", angl. isness). Tento přístup předpokládá intelektuální aktivitu, vyžadující obvykle lidskou inteligenci. Aby bylo možné zařadit určitý objekt do třídy ekvivalence, je nutné ho důkladně analyzovat. Inteligence je zapotřebí jednak pro zjištění charakteristik objektů, jichž může být nekonečný počet, ale zejména pro výběr těch vlastností, které se projeví jako užitečné pro daný účel v daném kontextu.

Nejvýznamnějším typem kategorizace, používaným tradičně v praxi organizace znalostí, je kategorizace založená na stejných vlastnostech (atributech), případně vyžadující nejen stejné atributy, ale i jejich hodnoty. Tento postup, jakkoli vzdálený "přirozenému" lidskému uvažování, se stal de facto standardem v návrhu struktur informačních systémů a softwarových aplikací.

"Nesystémové" přístupy ke kategorizaci

Formální ekvivalence se určuje zvenčí, podle "povrchu", formy (tím, co vidíme, "jak to vypadá"). V lingvistice se pro tento typ ekvivalence tradičně používá označení homonymie. Na rozdíl od systémového přístupu, který zkoumá vnitřní vlastnosti, se zájem soustředí na metadata přidělená zkoumaným objektům, tj. na vnější vlastnosti. Kritériem ekvivalence je zpravidla stejné označení (názvy, metadata) prvků, funkcí, vlastností, vztahů. Tento postup lze automatizovat a svěřit tak kategorizaci počítači.

Třetím způsobem je subjektivní, arbitrární určování ekvivalence, přizpůsobené individuálním potřebám toho, kdo konceptualizaci realizuje.[2] Tento typ ekvivalence je obvykle vyjadřován extenzionálně, tj. vyjmenováním (enumerací) ekvivalentních prvků. Do této skupiny patří i tzv. kanonicky určená ekvivalence a ekvivalence zdůvodněná různými pragmatickými důvody, kdy jsou ekvivalentní věci sdružovány na základě společného cíle či účelu. Zcela arbitrárním způsobem je určení kategorií založené na náhodě, například stanovení skupin soutěžících týmů ve sportovních soutěžích losováním.

[1] Poznámka: Tyto názvy byly zformulovány jako ryze pracovní pouze pro účely tohoto textu, nejsou tedy součástí odborné terminologie.

[2] Poznámka: Jako subjektivní lze samozřejmě označit i kritéria ekvivalence pro účely kategorizace v lidské mysli, již zkoumá kognitivní věda.