7. Indexový soubor

7.2. Typy indexů

typy indexu

Termínové indexy

 

a) strukturovaný - fulltextový

1. Plnotextový (fulltextový) index

index s rozdělením víceslovných výrazů na jednotlivá slova

vyhledávaná jednotka: text (dokument), příp. jeho část

složení:

1. slovo
2. pořadové číslo dokumentu v kolekci
3. pořadí slova v rámci dokumentu (příp. v rámci elementu)

Příklad: Plnotextový index vytvořený pro záznamy knih

Číslo
záznamu/dokumentu
Text
116 Čapek, Karel. Loupežník. 31. 1958
117 Apollinaire, Guillaume. Pražský chodec. 60. 1984
118 Hartwigová, Julia. Apollinaire. 48. 1967
119 Čapek, Karel. R.U.R. 32. 1962
120 Čapek, Karel. Krakatit. 48. 1958
121 Dostojevskij, Fjodor Michajlovič. Idiot. 120. 1984
122 Čapek, Karel. Věc Makropulos. 48. 1967
123 Hrabal, Bohumil. Pábitelé. 1967
124 Čapek, Karel. Život a dílo skladatele Foltýna. 32. 1978
125 Hrabal, Bohumil. Ostře sledované vlaky. 32. 1978
126 Hrabal, Bohumil. Inzerát na dům, ve kterém už nechci bydlet. 1967
127 Apollinaire, Guillaume. Kaligramy. 32. 1962
128 Orwell, George. 1984. 32. 1991
129 Olbracht, Ivan. Nikola Šuhaj loupežník. 25. 1962

Slovo Číslo
záznamu/dokumentu
Pořadí
v dokumentu
120 121 5
1958 116 5
120 5
1962 119 5
127 5
129 7
1967 118 5
123 4
126 11
1978 124 1
1984 117 1
121 1
128 1
1991 128 1
25 129 1
31 116 1
32 119 1
124 1
125 1
127 1
128 1
48 118 1
120 1
122 1
60 117 1
a 124 2
Apollinaire 117 1
118 1
127 1
Bohumil 123 2
125 2
126 2
bydlet 126 8
Čapek 116 1
119 1
120 1
122 1
124 1
dílo 124 3
Dostojevskij 121 1
dům 126 3
Fjodor 121 2
Foltýna 124 5
George 128 2
Guillaume 117 2
127 2
Hartwigová 118 1
Hrabal 123 1
125 1
126 1
chodec 117 2
Idiot 121 1
Inzerát 126 1
Ivan 129 2
Julia 118 2
Kaligramy 127 1
Karel 116 2
119 2
120 2
122 2
124 2
Krakatit 120 1
kterém 126 5
loupežník 129 3
Loupežník 116 1
Makropulos 122 2
Michajlovič 121 3
na 126 2
nechci 126 7
Nikola 129 1
Olbracht 129 1
Orwell 128 1
Ostře 125 1
Pábitelé 123 1
Pražský 117 1
R.U.R. 119 1
skladatele 124 4
sledované 125 2
Šuhaj 129 2
126 6
ve 126 4
Věc 122 1
vlaky 125 3
Život 124 1



2. Strukturovaný index

klasický index relační databáze (s celými hodnotami atributů/položek)

vyhledávaná jednotka: záznam

složení:

1. hodnota atributu/pole
2. pořadové číslo záznamu v souboru
3. pořadové číslo pole nebo název pole v záznamu

Příklad: Strukturovaný index vytvořený pro záznamy knih

Základní soubor               Index
Číslo
záznamu
Autor Název Cena Rok
vydání
Hodnota pole Číslo
záznamu
Název pole
116 Čapek, Karel Loupežník 31 1958 120 121 Cena
117 Apollinaire, Guillaume Pražský chodec 60 1984 1958 116 Rok vydání
118 Hartwigová, Julia Apollinaire 48 1967 120 Rok vydání
119 Čapek, Karel R.U.R 32 1962 1962 119 Rok vydání
120 Čapek, Karel Krakatit 48 1958 127 Rok vydání
121 Dostojevskij, Fjodor Michajlovič Idiot 120 1984 129 Rok vydání
122 Čapek, Karel Věc Makropulos 48   1967 118 Rok vydání
123 Hrabal, Bohumil Pábitelé   1967 123 Rok vydání
124 Čapek, Karel Život a dílo skladatele Foltýna 32 1978 126 Rok vydání
125 Hrabal, Bohumil Ostře sledované vlaky 32   1978 124 Rok vydání
126 Hrabal, Bohumil Inzerát na dům, ve kterém už nechci bydlet   1967 1984 117 Rok vydání
127 Apollinaire, Guillaume Kaligramy 32 1962 121 Rok vydání
128 Orwell, George 1984 32 1991 128 Název
129 Olbracht, Ivan Nikola Šuhaj loupežník 25 1962 1991 128 Rok vydání
  25 129 Cena
31 116 Cena
32 119 Cena
124 Cena
125 Cena
127 Cena
128 Cena
48 118 Cena
120 Cena
122 Cena
60 117 Cena
Apollinaire 118 Název
Apollinaire, Guillaume 117 Autor
127 Autor
Čapek, Karel 116 Autor
119 Autor
120 Autor
122 Autor
124 Autor
Dostojevskij, Fjodor Michajlovič 121 Autor
Hartwigová, Julia 118 Autor
Hrabal, Bohumil 123 Autor
125 Autor
126 Autor
Idiot 121 Název
Inzerát na dům, ve kterém už nechci bydlet 126 Název
Kaligramy 127 Název
Krakatit 120 Název
Loupežník 116 Název
Nikola Šuhaj loupežník 129 Název
Olbracht, Ivan 129 Autor
Orwell, George 128 Autor
Ostře sledované vlaky 125 Název
Pábitelé 123 Název
Pražský chodec 117 Název
R.U.R 119 Název
Věc Makropulos 122 Název
Život a dílo skladatele Foltýna 124 Název

b) index z 1 pole (elementu) - index z více polí (elementů)

1. Index vytvořený z hodnot 1 pole (elementu)

Příklad: Index vytvořený z hodnot pole NÁZEV

index-nazev

2. Index vytvořený z hodnot více polí (elementů)

  • složený index (původní položky zůstanou zachovány, třídí se kaskádovitě)
  • hodnoty různých polí (elementů) jsou umístěny do stejného pole indexového souboru

Příklad: Složený index vytvořený z hodnot polí AUTOR a NÁZEV

slozeny index

Využití indexového souboru pro kontextové operátory

a) operátor proximity

podmínka vzdálenosti se vyhodnocuje přes absolutní hodnocení rozdílu pořadí slov

b) operátor pořadí

podmínka pořadí je vyhodnocována na základě větší velikosti čísla udávajícího pořadí slov