Systém TOPIC 4.0
Příručka uživatele

Jiří Kosek a Milan Šimůnek

Tato stránka obsahuje elektronickou verzi skript:

Systém TOPIC - verze 4.0
Příručka uživatele
VŠE 1996, 63 str., ISBN 80-7079-907-5

Elektronická podoba skript může být volně používána jednotlivci pro studijní a vzdělávací účely. Bez písemného souhlasu autorů je zakázáno šířit skripta v jakékoliv formě (tištěné, zrcadla na jiných serverech, CD-ROM apod.). Skripta je zakázáno tisknout -- k dispozici je původní tištěná verze skript, která má mnohem lepší grafickou úpravu než vytištěná webovská stránka.

© Copyright 1996-97, Jiří Kosek & Milan Šimůnek, All Rights Reserved. <HR> <H1>Obsah</H1> <UL> <LI><A HREF="#x0">Předmluva</A> <LI><A HREF="#x1">Úvod</A> <LI><A HREF="#x2">Základy práce se systémem</A> <UL> <LI><A HREF="#x2.1">Spuštění programu</A> <LI><A HREF="#x2.2">Druhy dotazů</A> <LI><A HREF="#x2.3">Práce s&nbsp;dotazy a okny</A> <LI><A HREF="#x2.4">Parametry dotazu</A> </UL> <LI><A HREF="#x3">První dotaz</A> <UL> <LI><A HREF="#x3.1">Zadání dotazu</A> <LI><A HREF="#x3.2">Prohlížení nalezených dokumentů</A> </UL> <LI><A HREF="#x4">Tematické dotazy</A> <UL> <LI><A HREF="#x4.1">Popis tematického dotazu</A> <LI><A HREF="#x4.2">Použití tematického dotazu</A> <LI><A HREF="#x4.3">Zadávání tematického dotazu</A> <LI><A HREF="#x4.4">Váhy</A> <LI><A HREF="#x4.5">Určování celkového skóre dokumentu</A> <LI><A HREF="#x4.6">Postup tvorby stromů</A> <LI><A HREF="#x4.7">Omezení při tvorbě stromů</A> </UL> <LI><A HREF="#x5">Prosté dotazy</A> <UL> <LI><A HREF="#x5.1">Popis prostého dotazu</A> <LI><A HREF="#x5.2">Použití prostého dotazu</A> <LI><A HREF="#x5.3">Zadávání prostých dotazů</A> </UL> <LI><A HREF="#x6">Formulářové dotazy</A> <UL> <LI><A HREF="#x6.1">Popis formulářového dotazu</A> <LI><A HREF="#x6.2">Použití formulářových dotazů</A> <LI><A HREF="#x6.3">Zadávání formulářových dotazů</A> </UL> <LI><A HREF="#x7">Operátory</A> <UL> <LI><A HREF="#x7.1">Listové operátory</A> <LI><A HREF="#x7.2">Proximitní operátory</A> <LI><A HREF="#x7.3">Boolovské operátory</A> <LI><A HREF="#x7.4">Koncepční operátory</A> <LI><A HREF="#x7.5">Relační operátory</A> <LI><A HREF="#x7.6">Modifikátory</A> </UL> <LI><A HREF="#x8">Asistenti</A> <UL> <LI><A HREF="#x8.1">Asistent "Témata"</A> <LI><A HREF="#x8.2">Asistent "Hledat témata"</A> <LI><A HREF="#x8.3">Asistent "Slova"</A> <LI><A HREF="#x8.4">Asistent "Stemy"</A> <LI><A HREF="#x8.5">Asistent "Tezaurus"</A> <LI><A HREF="#x8.6">Asistent "Statistický tezaurus"</A> <LI><A HREF="#x8.7">Asistent "Soundex"</A> <LI><A HREF="#x8.8">Asistent "Wildcard"</A> <LI><A HREF="#x8.9">Asistent "Pole"</A> </UL> <LI><A HREF="#x9">Spuštění TOPICu ve&nbsp;Windows</A> <LI><A HREF="#x10">Slovníček pojmů</A> <LI><A HREF="#x11">Přehled ovládání programu</A> <UL> <LI><A HREF="#x11.1">Dotaz</A> <LI><A HREF="#x11.2">Editace tematických dotazů</A> <LI><A HREF="#x11.3">Témata</A> <LI><A HREF="#x11.4">Prohlížení dokumentů</A> <LI><A HREF="#x11.5">Tisk</A> <LI><A HREF="#x11.6">Spolupráce se schránkou (clipboardem)</A> <LI><A HREF="#x11.7">Ostatní</A> </UL> </UL>


Předmluva

Skripta, která právě držíte v ruce, jsou určena především posluchačům semináře Metody zpracování informací, který je akreditovaný Katedrou informačního a znalostního inženýrství Fakulty informatiky a statistiky VŠE.

V rámci semináře jsou studenti mimo jiné seznamováni s různými hypertextovými a fulltextovými systémy. Jedním z technologicky nejvyspělejších zástupců druhé skupiny je systém TOPIC.

První část skript vás krok za krokem seznámí s možnostmi TOPICu při vyhledávání informací, tj. s uživatelským rozhraním a se základními prvky dotazů. Druhá část skript přináší referenční přehled všech možností systému.

Při psaní skript jsme nevycházeli jen z firemní dokumentace, ale především z vlastních zkušeností, které jsme získali během půlroční práce na přípravě několika fulltextových databází pro Katedru filosofie.

Naše skripta jsou proto vhodným doplňkem ke skriptům Metody zpracování informací I. -- informační zdroje a služby a Metody zpracování informací II. -- ukládání a vyhledávání. Studentovi jsou některé z teoretických pasáží přiblíženy na příkladě ryze praktického komerčního produktu.

Náš velký dík patří RNDr. Janu Rauchovi, CSc., který nám nabídl možnost bližšího seznámení se systémem TOPIC a v průběhu psaní skript nám vycházel maximálně vstříc a poskytl mnoho užitečných rad.

Naše poděkování patří i Donu Knuthovi, který všem zdarma poskytl tak výborný nástroj na zpracování textů jakým je TeX.

Děkujeme i oponentům, Ing. Josefu Černochovi a PhDr. Janu Žbirkovi, kteří řadou podnětů přispěli k vylepšení obsahu skript.

V Praze 19. června 1996

Autoři


Úvod

Jedním z nejvýznamnějších převratů v šíření informací v dějinách lidstva byl jistě vynález knihtisku J. G. Gutenbergem, který se datuje kolem roku 1450. Umožnil produkovat tištěné dokumenty (knihy) větší rychlostí než celý regiment profesionálních mnichů-písařů. Podobný zlom po více než 500 letech je způsoben používáním nových informačních a komunikačních technologií. Ty umožňují uchovávat velké množství informací rozličného druhu, různě je zpracovávat a díky celosvětovým počítačovým sítím i sdílet po celé Zemi. Významu informací si je dnes vědom již téměř každý, a proto je dnešní doba velmi často nazývána dobou informační.

Většina nově vznikajících informací je vytvářena a uchovávána v elektronické podobě a starší prameny se do této podoby velmi často převádí. Musíme si však zároveň uvědomit, že tzv. strukturovaná data tvoří maximálně 10 % z tohoto objemu. Pod pojmem strukturovaná data máme na mysli data se striktně definovou strukturou, jak je tomu zejména v ekonomických a personálních agendách zpracovávaných SŘBD. Vyhledávání ve strukturovaných datech je poměrně jednoduché, neboť známe přesný význam jednotlivých informací (databázových položek).

Zbývajících 90 % tvoří nestrukturované informace, tj. většinou plné texty, které jsou někdy doplněny malou strukturovanou informací (např. jméno autora, název článku apod.). V těchto informacích již nelze při vyhledávání využívat znalosti struktury dat, ale je potřeba vyhledávat podle obsahu samotného textu.

Jedním z technologicky nejvyspělejších systémů určených pro vyhledávání ve velkých objemech nestrukturovaných textových dat je TOPIC. Jde o produkt americké firmy Verity, jehož lokalizovanou verzi u nás distribuuje firma Tovek.

Historie samotného TOPICu není nezajímavá a proto si ji alespoň stručně přiblížíme. Firma Verity byla založena v roce 1988 ve městě Mountain View, které leží ve známém Silicon Valley. Firma vznikla oddělením od vládní výzkumné agentury ADS (Advanced Decision Systems). Lidé, kteří Verity založili pracovali v letech 1984--88 u ADS na projektu RUBRIC, který byl určen pro zpravodajské služby, kterým měl poskytnout o třídu větší možnosti při prohledávání rozsáhlých textů než tehdy běžně dostupné systémy.

Základní schéma systému TOPIC

Základní principy systému TOPIC jsou podobné jako u jiných fulltextových systémů. Předtím než mohou být dokumenty prohledávány, je nutno je zaindexovat -- tj. sestavit invertované seznamy slov obsažených v dokumentech a případně další pomocné indexy. Pokud již máme index vytvořen, můžeme systému klást dotazy. TOPIC na základě údajů v indexu vytvoří seznam relevantních dokumentů. Z tohoto seznamu si uživatel může vybrat a prohlédnout ty dokumenty, které ho opravdu zajímají. Celý proces nám pomůže přiblížit připojený obrázek.

Skripta, která držíte v ruce se podrobně zabývají ovládáním nejdůležitějších funkcí klienta TOPICu ve verzi 4.0 pro prostředí MS-Windows* a tvorbou dotazů v tomto systému. Nepokrývají širokou oblast práce administrátorů TOPICovských databází -- přípravu dokumentů pro zpracování a jejich indexování, zařazování obrázků do dokumentů a vytváření hypertextových odkazů mezi dokumenty. Rovněž se nezabývají dalšími možnostmi jako je indexování v reálném čase apod. Pro získání těchto znalostí je nejlépe použít originální dokumentaci k systému.

Existují i klienti pro další platformy. Např. xtopic pro X-Window, pmtopic pro OS/2, topic pro Macintosh a ctopic pro znakové terminály a MS-DOS.

Celá skripta jsou rozčleněna do jedenácti kapitol. Následující kapitola popisuje spuštění a ovládání TOPICu. Ve druhé kapitole si ukážeme zadání jednoduchého dotazu. Kapitoly 4 až 6 se podrobněji zabývají tvorbou jednotlivých druhů dotazů. Kapitola sedmá obsahuje referenční popis všech operátorů použitelných při tvorbě dotazů. V osmé kapitole je vysvětlena funkce asistentů, kteří usnadňují tvorbu dotazů. Devátá kapitola pojednává o spuštění programu v prostředí MS-Windows. Poslední dvě kapitoly obsahují stručný slovníček pojmů a přehled klávesových zkratek použitelných pro ovládání programu.


Základy práce se systémem

V této kapitole se seznámíme se základním ovládáním klienta TOPICu pro Windows. Budou naznačeny základní možnosti pro zadávání dotazů, které jsou podrobněji rozebrány v následujících kapitolách.

Spuštění programu

Ikonka TOPICu Naše příručka popisuje klienta TOPICu pro Windows -- pro jeho spuštění je tedy nezbytné nejdříve spustit systém Windows. Ve Windows je TOPIC nejčastěji indikován ikonou podobnou obrázku u okraje tohoto odstavce. Tato ikona se obvykle nachází ve skupině "Verity" spolu s ostatními programy od této firmy.


Vzhled klientského programu pro Windows

V případě, že je systém dobře nakonfigurován,* můžeme jej spustit. Po spuštění a inicializaci se okno programu* rozdělí na tři části. V horní části je menu, které slouží k zadávání příkazů. Zbytek obrazovky je určen pro zobrazení dotazu a vyhovujících dokumentů (viz obrázek na předchozí straně). Poměr plochy obrazovky vyhrazené pro dotaz a výsledek lze libovolně měnit, pokud myš přesuneme nad pás oddělující tyto dvě části od sebe (kurzor myši přitom změní tvar na `').

Podrobnosti o konfiguraci TOPICu naleznete v kapitole Spuštění TOPICu ve Windows na straně .
Pokud by uživatel požadoval, aby se okno programu objevilo vždy ve stejné velikosti a na stejném místě -- např. přes celou obrazovku, existuje možnost zadat tyto rozměry v preferenčním souboru. Bohužel se nám nepodařilo zjistit způsob zadání, na který by TOPIC při spuštění zareagoval. Originální dokumentace v tomto ohledu zarytě mlčí.

Druhy dotazů

TOPIC disponuje více druhy dotazů, které se liší náročností zadání a možností ovlivnit výsledky prohledávání. Dotaz z předešlého paragrafu byl tzv. prostý dotaz. Prostý dotaz obsahuje slova a fráze oddělená čárkami nebo logickými spojkami. Při vyhledávání se všechna slova skloňují a mají stejnou váhu. (Podrobnější informace o prostém dotazu naleznete na straně .)

Dalším typem dotazu je formulářový dotaz. Formulářový dotaz obsahuje kromě místa pro zadání hledané fráze jako u prostého dotazu i pole pro zadání podmínek pro jednotlivé položky strukturované části textové databáze. V jistém smyslu tedy můžeme hovořit o jakémsi rozšíření prostého dotazu. (Podrobněji viz strana .)

Tematický dotaz je nejsilnější zbraní celého systému. Jak již název napovídá, při formulaci dotazu vlastně definujeme jednotlivá témata. Dotaz má hierarchickou strukturu, kde jednotlivé uzly odpovídají jednotlivým tématům, která jsou definována jako agregace dalších témat nebo konkrétních termínů (pokud již dosáhneme nejnižší úrovně v hierarchii -- listů stromu). (Podrobněji viz strana .)

Než se pustíme do důkladného rozebírání možností jednotlivých druhů dotazů, podíváme se podrobněji na části systému, které jsou nezávislé na použitém druhu dotazu.

Práce s dotazy a okny

Pokud vytváříme komplikovanější dotazy nebo chceme nějaký dotaz použít vícekrát, je velmi užitečná funkce Uložit Dotaz (Ctrl+F7) resp. Uložit jako (F7), která uloží aktuální dotaz do souboru zadaného jména. Doporučujeme ukládat dotazy do souborů s příponou `.qry'. Soubory s dotazy pak snadno rozeznáme od jiných.

Jednou uložený dotaz můžeme opět vyvolat pomocí volby Otevřít dotaz (F3). Pro vytváření nového dotazu slouží volba menu Nový dotaz, kterou lze aktivovat i stiskem Alt+F3.

V jednom okamžiku můžeme mít otevřených i několik dotazů. Mezi jednotlivými okny se pak můžeme přepínat buď pomocí myši anebo pomocí kláves Shift+F6 resp. Ctrl+Shift+F6. V menu Window rovněž nalezneme možnost, jak okna uspořádat do dlaždic -- Tile -- nebo do kaskády -- Cascade. Pod čarou se zde nachází seznam otevřených dotazů a prohlížených dokumentů. Dotazy jsou identifikovány svým jménem; u dokumentů je za jménem dotazu ještě připojeno :Dokument.

Kdykoliv během práce s dotazem můžeme přecházet mezi zobrazením dotazu jako prostý, formulářový nebo tematický dotaz. Samotný dotaz se nezmění, bude pouze jinak zobrazen. K přechodu můžeme použít buď volby menu Dotaz nebo příslušnou klávesovou kombinaci Alt+1, 2 nebo 3.

Po přepnutí z tematického dotazu na prostý nebo formulářový dotaz není příliš vhodné dotaz upravovat. Dojde pak totiž k automatickému nastavení vah na standardní hodnoty 0.50 nebo 1.00 podle druhu operátoru. Pouhým přepnutím bez následné editace se váhy nezmění.

Parametry dotazu

Chování TOPICu při zpracování dotazu lze ovlivnit v dialogu, ke kterému se můžeme dostat přes menu Dotaz|Parametry dotazu nebo stiskem Ctrl+F3.

Nastavení paremetrů dotazu

V horní části dialogu je zobrazeno jméno dotazu, jeho autor a čas poslední modifikace dotazu. V poli poznámka můžeme k dotazu doplnit krátký vysvětlující text.

Mnohem zajímavější je však další vstupní pole, které označuje hodnotu minimálního skóre. V seznamu vyhovujících dokumentů se objeví pouze ty dokumenty, jejichž skóre je vyšší nebo rovno zadanému. Můžeme tak snadno omezit počet dokumentů, které musíme prohlédnout ručně. Pokud používáme komplexní tematické dotazy, lze říci, že dokumenty se skórem menším než 0.50 již většinou nejsou příliš relevantní.

Další vstupní pole obsahuje název skupiny témat, do které pojmový strom definovaný dotazem patří.

Pokud je proškrtnuto Automatické zatřídění výsledků jsou při provádění dotazu do seznamu vyhovujících dokumentů zařazeny rovnou všechny vyhovující dokumenty. Pokud pole proškrtnuto není, je v seznamu zobrazeno pouze tolik dokumentů, kolik je místa pro seznam na obrazovce. Ostatní dokumenty jsou do seznamy přidány až po stisku tlačítka Zatříď nebo klávesy Alt+F5.

Po zaškrtnutí pole Automaticky poznávat témata nemusíme v prostém a formulářovém dotazu uzavírat názvy témat mezi složené závorky, témata se rozpoznají automaticky.

Pokud zaškrtneme tuto volbu, musíme si dávat pozor, zda se slova, která hledáme, neshodují s některým již vyvořeným tématem. V tomto případě by dotaz dělal něco jiného než bychom očekávali.

Zaškrtnutím pole Iterace nad výsledky dotazu se nám otevírá možnost dohledávání nad množinou vyhovujících dokumentů. Pokud je volba aktivní, je následné prohledávání omezeno pouze na dokumenty, jež vznikly jako výsledek posledního dotazu, a ne na všechny dokumenty v databázi.

Pokud je pro dotaz aktivní volba Označovat nově vybrané dokumenty, mohou být v seznamu vyhovujících dokumentů některé dokumenty označeny inverzní ikonkou dokumentu. Jsou to ty dokumenty, které jsou výsledkem dotazu poprvé -- tzn. že dotaz byl změněn nebo že do databáze přibyly nové dokumenty.

Zaškrtnutí volby Použij tyto parametry pro nové dotazy způsobí, že nově vytvářené dotazy budou mít nastaveny parametry dotazu stejně. Nastavení lze samozřejmě kdykoliv později změnit.


První dotaz

Zadání dotazu

Nejlepší si je práci s TOPICem hned vyzkoušet. Horní část obrazovky je po spuštění vyhrazena pro zadání dotazu. Do pole vepíšeme termíny, které nás zajímají, a po stisku tlačítka Výběr nebo klávesy Enter se v dolní části obrazovky začnou objevovat dokumenty, které obsahují zadaná slova.

Zobrazení výsledků prostého dotazu

V našem případě jsme jako dotaz zadali Internet, elektronické obchodování, "EDI". Výsledky dotazu vidíte na obrázku (patrně se od těch vašich budou lišit, protože používáte jinou textovou databázi -- v našem případě se jedná o databázi článků z počítačového týdeníku Computerworld). Každý řádek odpovídá jednomu dokumentu. Kromě názvu článku a údajích o čísle a ročníku časopisu, ve kterém byl článek původně otisknut (to jsou údaje, které budou záviset na databázi), je zobrazováno i tzv. skóre. Skóre je desetinné číslo od nuly do jedné a vyjadřuje relevanci dokumentu k dotazu. Čím větší skóre, tím je dokument více relevantní. Standardně jsou vyhovující dokumenty řazeny sestupně právě podle velikosti jejich skóre.

V případě, že si některý z nalezených dokumentů chceme prohlédnout, stačí na něj dvakrát kliknout myší či jej zvýraznit a stisknout Enter. Objeví se nové okno, které obsahuje text dokumentu, ve kterém jsou hledaná slova zvýrazněna (viz obrázek na následující straně). Zobrazení dokumentu může občas působit dojmem, že počítač "zamrzl" -- u delších dokumentů totiž trvá dlouho než jsou zarovnány na aktuální rozměry okna. Proto je zapotřebí vyzbrojit se větší dávkou trpělivosti.

Na tomto místě si můžeme povšimnout toho, že zvýrazněná jsou i slova odpovídající různým tvarům slova Internet. TOPIC totiž automaticky předpokládá, že při prohledávání chceme využít možností stemování. Pokud nechceme vyhledávat i ostatní tvary slova, můžeme slovo uzavřít mezi uvozovky a stemování se potlačí -- to je vhodné u zkratek jako je např. EDI. Okno s textem dokumentu opustíme klávesou Esc.

Zobrazení nalezeného dokumentu

Vraťme se ještě k seznamu vyhovujících dokumentů. Bez zajímavosti není malá ikonka vlevo od hodnoty skóre. Tato ikonka indikuje, zda jsme již dokument četli či ne (v rámci jedné seance TOPICu) a zda je dokument výsledkem dotazu poprvé. Význam ikonek je následující:

 -- doposud neprohlédnutý dokument;

 -- již prohlédnutý dokument;

 -- dokument vyhovuje dotazu poprvé.*

Další informace o tom, kdy je dokument označen tímto symbolem, lze nalézt u popisu parametrů dotazu na straně .

Prohlížení nalezených dokumentů

Dokument, který si chceme prohlédnout se zobrazí v novém okně. Pro pohyb po dokumentu můžeme použít kurzorové šipky, klávesy PageDown a PageUp pro pohyb o stránku dolů a nahoru nebo scroll-bar u okraje okna. Kombinace kláves Ctrl+Home vyvolá skok na začátek dokumentu a oproti tomu Ctrl+End skočí na konec dokumentu.

V dokumentu jsou zvýrazněna slova, která jsme dotazem specifikovali. Po jednotlivých slovech z dotazu se v dokumentu můžeme pohybovat pomocí kláves Shift+F9 a Shift+F8 (příkazy jsou dostupné i v menu Navigace|Předchozí výskyt a Navigace|Další výskyt).

Pokud bychom v článku chtěli provádět dohledávání, můžeme pomocí Navigace|Hledat text nebo Ctrl+F5 prohledávat zobrazený dokument na výskyt konkrétního řetězce.

Pokud se budeme chtít přesunout na jiný dokument, musíme pomocí Esc opustit prohlížeč dokumentů a v seznamu si vybrat další dokument. V případě, že se chceme přesunout na sousední dokument v seznamu, stačí použít klávesu F9 či F8 pro pohyb o jeden dokument vpřed či vzad.

Další možnosti nám nabízí menu Úpravy. Úsek textu označený myší nebo pohybem kurzoru při současně stisknuté klávese Shift můžeme pomocí Úpravy|Kopírovat nebo Ctrl+Ins zkopírovat do schránky (clipboardu). Ze schránky pak můžeme text přenést do libovolné jiné aplikace -- např. do textového editoru. Pokud bychom chtěli označit celý text, můžeme stisknout Shift+F2 nebo zvolit příkaz Úpravy|Vybrat vše.

Druhou možností, jak získat celý dokument v podobně vhodné pro další zpracování, je použití volby Aplikace|Uložení do souboru. Tento příkaz se nejprve zeptá na jméno souboru, a poté do něj uloží v textové podobě dokument.

Pokud v textu nalezneme slovo, které je pro hledanou oblast zájmu typické, ale my jsme ho v dotazu opomněli, stačí jej označit a pomocí klávesy Ins či příkazu Úpravy|Přidat do dotazu přidat do dotazu. Lze zvolit, zda se vybraný text přidá do již existujících dotazů nebo zda se text vloží do nového dotazu.

Poslední důležitější volbou z menu Úpravy je možnost změnit písmo, kterým je text dokumentu zobrazován. K tomu slouží volba Úpravy|Změnit font, po které se objeví standardní Windowsovský dialog pro změnu písma. Tato volba umožní docílit vhodného způsobu zobrazení vybraného dokumentu v okně.

Pokud bychom se o dokumentu chtěli dozvědět něco bližšího, můžeme použít F5 či Soubor|Zobrazit informaci. V nově otevřeném okně se objeví základní údaje o dokumentu (název, délka apod.) a o databázi, ve které je dokument umístěn. Konkrétní podoba je však opět dána způsobem vytvoření té či oné databáze.

Pokud bychom chtěli dokument vytisknout přímo z prostředí TOPICu, stačí zvolit Soubor|Tisk nebo stisknout Shift+F10.


Tematické dotazy

V této kapitole přeneseme svoji pozornost přímo k nejdůležitější části systému TOPIC, kterou jsou tematické dotazy. Pomocí tematických dotazů můžeme nejlépe vyjádřit náš požadavek na vyhledávané dokumenty.

Přestože je tento dotaz ze všech tří typů nejsložitější, bude výhodné si ho vysvětlit již nyní. Zbylé dva typy dotazů (prostý a formulářový) pak pro nás budou snadno pochopitelné a navíc budeme moci při jejich konstruování využívat již existující témata.

Nejprve si vysvětlíme strukturu tematického dotazu, a potom si vyzkoušíme jeho tvorbu. Na závěr této kapitoly se podíváme trochu podrobněji na způsob, kterým TOPIC využívá tematický dotaz při vyhledávacím procesu, a pokusíme se zachytit i postup tvorby složitějších dotazů a jejich skupin.

Popis tematického dotazu

A nyní se již podrobněji podívejme na první jednoduchou ukázku tematického dotazu:

Ukázka stromu -- ekonomie

Jak je z obrázku patrné, tematický dotaz se vytváří ve formě stromu. Ten budeme nazývat pojmovým stromem, protože se na svých nejnižších úrovních skládá z pojmů -- slov charakteristických pro danou oblast zájmu. Těmto nejnižším úrovním pojmového stromu se říká listy. Pouze listy mohou obsahovat konkrétní slova. V naší ukázce jsou na listech pojmy jako "inflace", "nezaměstnanost", "poptávka" apod.

Slova významem nebo oblastí blízká se sdružují do témat (topiců). Tématem (topicem) rozumíme libovolnou podmnožinu pojmového stromu. V našem případě je to například "_Makroekonomie" nebo "_HDP", ale i celý strom -- "_Ekonomie". Tato témata lze samostatně používat v dalších dotazech (nejen tematických, ale i prostých a formulářových).

List nebo téma nazveme uzlem, pokud nám nebude záležet na tom, jedná-li se o list nebo o téma. Napojení uzlu na další úroveň je vyřešeno pomocí operátoru (podrobněji viz strana ) a váhy přidělené tomuto uzlu (podrobněji viz strana ). Operátor určuje způsob napojení uzlu na vyšší úroveň a váha důležitost tohoto uzlu vzhledem k ostatním uzlům na stejné úrovni.

Listy

Nejprve se podíváme na ukázku listu:

Ukázka listu - Inflace

Většina listů (kromě listů připojených k vyšší úrovni proximitními nebo logickými operátory) začíná vahou, kterou jsou připojeny k vyšší úrovni. V našem případě je to číslo 0.50.

Napravo od váhy je značka "kosočtverce" -- `'. Ta se vyskytuje u všech uzlů (tedy i témat) a slouží k vybrání uzlu pomocí myši nebo k jeho přesunu na jinou pozici.

Následuje některý z listových operátorů (viz strana ) uzavřený mezi znaky `<' a `>'. V našem případě je to operátor <STEM>, který dovoluje výskyt slova v různých tvarech -- např. (o) "inflaci", (s) "inflací" apod.

Nakonec následuje vlastní název listu -- slovo, jehož výskyt vyžadujeme v nalezených dokumentech. V našem příkladě se jedná o slovo "Inflace".

Témata

Podobná je i struktura témat:

Ukázka tématu - Makroekonomie

Kromě kořenu stromu, mají i témata svoji váhu. Následuje referenční značka `' a název tématu -- např. "_Makroekonomie".

Narozdíl od listů mají témata úplně vpravo některý z operátorů pro připojení uzlů nižší úrovně. Můžeme například požadovat, aby v nalezených dokumentech byla všechna slova z nižších uzlů -- potom je zde operátor <AND> nebo alespoň jedno -- použijeme operátor <OR> apod. Podrobněji se o operátorech dočtete na straně .

Úplně na pravém konci tématu pak nalezneme některou z těchto značek:

-- neexistují podřízené úrovně;

-- podřízené úrovně existují, ale jsou schované (pro jejich zobrazení je nutné kliknout myší na tuto značku).

-- existují podřízené úrovně k tomuto tématu a jsou viditelné;

Použití tematického dotazu

Tematické dotazy budou po delší práci s TOPICem tvořit jakousi "kostru", s jejíž pomocí budeme tvořit dotazy pro konkrétní oblasti zájmu. Proto je vhodné rozmyslet si dobře jejich strukturu, aby některé téma nebylo řešeno odlišně ve dvou různých stromech a aby se již vytvořená témata využívala při tvorbě nových stromů (viz postup tvorby stromů na straně ).

Zadávání tematického dotazu

Nyní jsme si vysvětlili alespoň základy struktury tematického dotazu a můžeme si vyzkoušet jeho zadání. Při zadávání doporučujeme již od začátku používat klávesnici. Po krátké chvíli budete schopni vytvářet stromy daleko rychleji než při použití myši.

Definice oblasti zájmu

Představme si, že chceme vytvořit dotaz pro vyhledání všech dokumentů, které se nějakým způsobem týkají ekonomie. Předpokládejme dále, že jsem již dříve provedli analýzu dokumentů a našich požadavků a chceme vytvořit pojmový strom o následující struktuře:

Ekonomie

Navíc chceme zdůraznit větší význam slov z oblasti Makroekonomie před slovy z Mikroekonomie. Obecná ekonomie má pro nás nejmenší důležitost.

Vlastní tvorba dotazu

Nejprve vybereme v menu Soubor položku Nový dotaz nebo stiskneme klávesu Alt+F3. Potom v menu Dotaz zvolíme Tematický dotaz nebo použijeme klávesu Alt+3.

V poli pro zadávání dotazu se objevil nepojmenovaný vrchol stromu s operátorem <ACCRUE> a my bychom mohli začít s tvorbou dotazu. Ještě než začneme, provedeme malou úpravu v menu Zobrazit. Zde místo volby Strom vybereme Osnova. Tato změna, přestože zatím nic nevidíme, bude mít za následek, že se podřízené uzly stromu nebudou odsazovat napravo od nadřízeného uzlu. Místo stromové struktury, jak jsme ji dosud poznali, se všechny uzly nižší úrovně umístí pod nadřízený uzel a odsadí se o jeden znak. Pojmový strom tedy bude vypadat podobně jako struktura uvedená výše. Tím ušetříme spoustu místa a zejména při tvorbě složitějších dotazů bude vše daleko přehlednější.

A nyní již skutečně začneme s vlastním zadáváním dotazu. Každý uzel stromu, by měl mít odpovídající název. Tento název se zároveň stane názvem tématu. Stiskneme klávesu Tab (tabulátor) -- uzel se stane aktivním (na obrazovce se objeví jako inverzní) a na místě názvu začne blikat kurzor. (Místo použití tabelátoru můžeme také kliknout myší na obdélníček v místě, kde má být název uzlu.) Zadáme "_Ekonomie" a zadávání ukončíme klávesou Enter.

Pojmenování uzlů musí splňovat určité podmínky, které si souhrnně popíšeme později. Prozatím nám bude stačit, že se v názvu tématu nesmějí objevit mezery a že se nerozlišuje mezi velkými a malými písmeny.

Dotaz by měl nyní vypadat takto:

Samotný vrchol stromu - Ekonomie

Způsob zadávání témat se znakem `_' (podtržítko) na začátku slova není povinný. Název tématu však musí být vždy odlišný od slova v libovolném listě. Tímto způsobem lze tedy jednoduše odlišit témata od konkrétních slov.

Nyní musíme přidat tři uzly nižší úrovně -- Makroekonomie, Mikroekonomie a Obecná ekonomie:

Uzel "_Ekonomie" musí být aktivní (inverzní). Pokud tomu tak není, stiskneme klávesu Tab nebo klikneme myší na značku před slovem "_Ekonomie".

V menu Dotaz zvolíme Přidat operátor. Objevilo se okénko pro výběr operátoru. Pomocí kurzorových kláves -- šipek nahoru/dolu vybereme Accrue a stiskneme Enter. (Nebo myší dvakrát klikneme na Accrue.) Na obrazovce se objevil nový uzel bez názvu, s vahou 0.50 a značka u uzlu "_Ekonomie" se změnila na .

Pomocí šipky dolu vybereme nový uzel a začneme s jeho nastavením. Stiskneme jednou klávesu Tab. Zvýraznila se váha uzlu.* Stiskneme Tab ještě jednou a kurzor začne blikat v místě pro zadání jména. (Na blikající kurzor se dostaneme též pomocí kliknutí myší na obdélníček za značkou .) Nyní můžeme zadat název uzlu -- např. "_Makroekonomie" -- a stisknout Enter. Tím jsme nový uzel zadali.

Záleží na konkrétním nastavení barevné palety ve Windows. U standardního nastavení bohužel k žádnému zvýraznění nedojde. Pokud však máme nastaveny barvy pro LCD displeje, které jsou navíc mnohem příjemnější pro oči, zvýraznění je dobře viditelné.

Pokud potřebujeme opravit zadaný název, postupujeme následovně: Pomocí postupného stisku klávesy Tab nebo kliknutím myší se nastavíme na název -- ten změní svoji barvu. Pokud bychom nyní stiskli některou alfanumerickou klávesu, celý text by se nejprve vymazal a na jeho místě by se objevil jediný znak -- ten, který jsme právě stiskli. To znamená, že bychom museli celý text napsat znovu. Pokud však chceme pouze opravit případný překlep, musíme nejprve stisknout některou z kurzorových kláves (šipka vlevo/vpravo). Tím se v textu objeví blikající kurzor a my můžeme text editovat.

Podobným způsobem jako název můžeme opravit váhu a operátor. Při zadávání váhy lze na oddělení desetinné části použít jak tečku, tak čárku. Váhu lze zadávat i jako číslo mezi 1 a 100 a TOPIC si je sám vydělí stem. Při změně operátoru pomocí klávesnice nemusíme psát znaky `<' a `>' -- TOPIC si je doplní sám. Pokud na operátor klikneme myší, objeví se seznam všech operátorů, které má v daném případě smysl zadat, a můžeme některý z nich vybrat -- opět klávesou Enter nebo dvojitým kliknutím.

Při psaní operátorů ručně musíme dát pozor, abychom zadali pouze ten operátor, který má v dané situaci smysl. Jinak TOPIC ohlásí chybu.

Nyní se vrátíme k našemu dotazu a přidáme další uzel -- "_Mikroekonomie": Pomocí šipky nahoru vybereme uzel "_Ekonomie" a v menu Dotaz opět zvolíme Přidat operátor. Způsobem popsaným výše zadáme název "_Mikroekonomie" a váhu upravíme na 0.40. Stejný postup ještě jednou zopakujeme pro uzel "_Obecná_ekonomie". Jak již víme, nesmíme při zadávání názvu tématu použít mezeru. Slova tedy oddělujeme pomocí podtržítka nebo pomlčky. Mezeru můžeme také vynechat úplně a použít velké písmeno -- "_Obecná_Ekonomie".

Dotaz nyní vypadá takto:

Dotaz s první podúrovní

V následující části provedeme rozšíření tématu "_Makroekonomie":

Doposud jsme zadávali pouze témata. Nyní se poprvé dostáváme k zadávání listů stromu -- konkrétních slov. K jejich zadávání slouží v menu Dotaz volby Přidat následníka a Přidat souseda. Volbu Přidat následníka používáme v případě, že máme vybraný uzel, pod který chceme slovo přidat. Přidat souseda potom při postupném zadávání všech slov v jedné úrovni. Protože se jedná o časté činnosti, existují pro ně horké klávesy: Ctrl+A -- přidání následníka a Ctrl+D -- přidání souseda.

Vybereme tedy uzel "_Mikroekonomie" a stiskneme Ctrl+A. Objevil se prázdný rámeček s blikajícím kurzorem. Nyní můžeme zadat libovolné slovo nebo i sousloví -- při zadávání listů je totiž možné používat i mezery. Zadáme například "Spotřebitel" a stiskneme Enter.

Na obrazovce můžeme vidět přibližně toto:

Dotaz s jedním listem

A nyní nezbývá nic jiného než pomocí Ctrl+D přidat "Trh", "Výrobek" a "Cena". Potom ještě stejným postupem přidáme listy "Nabídka" a "Poptávka" do "_Obecná_ekonomie" a "Nezaměstanost", "Inflace" a "Zahraniční obchod" do "_Makroekonomie".

Po zadání posledního listu si všimněme změny použitého operátoru ze <STEM> na <PHRASE>. Sousloví "Zahraniční obchod" bylo totiž automaticky rozloženo na dvě slova -- "Zahraniční" a "obchod", z nichž každé se může vyskytovat v libovolném pádě. O tom se můžeme přesvědčit tak, že vybereme uzel "Zahraniční obchod" a stiskneme kurzorovou šipku vpravo. Tato klávesa slouží k "rozbalení" libovolného tématu, u kterého se vyskytuje nám již známá značka . K opačnému cíli -- k "zabalení" určitého tématu se používá kurzorová šipka vlevo. Zabalením needitovaných části stromu si můžeme ulehčit přesun z jednoho uzlu na druhý.

Takto například můžeme rozbalit "Zahraniční obchod" a naopak zabalit celou "Mikroekonomii" a "Obecnou ekonomii".

Tvorba stromu -- rozbalená a zabalená témata

Jako poslední úkol nám zbývá doplnění listu s hrubým domácím produktem. O hrubém domácím produktu se však často píše pouze jako o HDP, proto přidáme ještě jednu podúroveň a použijeme operátor OR.

Nejprve vybereme uzel "_Makroekonomie" a v menu Dotaz opět zvolíme Přidat operátor tak jako na začátku práce s naším dotazem. Z nabízeného seznamu ale nyní vybereme OR. U nově vzniklého uzlu zadáme název "_HDP". Pomocí Ctrl+A přidáme list "Hrubý domácí produkt" a k němu pomocí Ctrl+D přidáme zkratku "HDP". U této zkratky můžeme ještě změnit operátor ze <STEM> na <WORD>, protože u této zkratky nepředpokládáme její skloňování.*

Pozor na existenci zkratek, u kterých se sice v rozporu s pravidly pravopisu, ale pro zvýšení srozumitelnosti, může skloňování používat. Jedná se například o zkratku MS-DOS.
Povšimněme si ještě, že standardně dosazené váhy u listů pod operátorem <OR> jsou 1.00.

Provedení dotazu s vytvořeným stromem

Nyní se nám podařilo zadat celý pojmový strom a můžeme si vyzkoušet jeho funkčnost pomocí klávesy Ctrl+R nebo kliknutím na tlačítko Výběr. Výsledek závisí na použité databázi. Jednu z možností uvádí obrázek na následující straně.

Hotový strom s výsledky dotazu

Změna pořadí uzlů

I když pořadí uzlů nemá vliv na výsledek dotazu, může být někdy nutné z důvodů logického členění změnit pořadí uzlů. Může se nám také stát, že potřebujeme určitý uzel přesunout do jiné úrovně. Bohužel takto přesouvat uzly lze pouze pomocí myši a jenom v typu zobrazení Strom.

Vezmeme si tedy do ruky myš a v menu Zobrazení zvolíme Strom. Nyní můžeme myší kliknout na referenční značku (napravo od váhy uzlu) a držíme tlačítko stisknuté. Jak budeme měnit pozice myši, bude se po jednotlivých částech pojmového stromu pohybovat i tlustá čára. Tu nastavíme do míst, kam chceme přesunout uzel, a pustíme tlačítko myši. Uzel se přesune na vyznačené místo. Pokud měl uzel podřízené uzly, přesunou se s ním.

Váhy

Váhy se používají společně s operátory pro výpočet celkového skóre dokumentu vzhledem k dotazu.

Váhy lze použít pouze u uzlů připojených pomocí některého z koncepčních operátorů (AND, OR a ACCRUE). Použití vah však není povinné. Pokud váhu u připojovaného uzlu neuvedeme, použije se standardní -- pro AND a OR je to 1.00 a pro ACCRUE 0.50. Při změně operátoru např. z AND na ACCRUE se automaticky opraví váhy u všech připojených uzlů, které používaly standardní nastavení -- v tomto případě z 1.00 na 0.50.

Jak váhy ovlivňují skóre

Přiřazením čísla k určitému uzlu určujeme, jakým způsobem (vahou od 0.01 do 1.00) se daný uzel podílí na celkovém skóre daného dokumentu při výběru. Čím vyšší váha, tím více závisí skóre dokumentu na tom, zda obsahuje či neobsahuje slova z daného uzlu nebo na něj napojených uzlů nižší úrovně. Změnou vah můžeme docílit změnu pořadí dokumentů v seznamu relevantních dokumentů.

Autoři programu doporučují zadávání vah v rozsahu od 0.80 do 0.20. Při použití vyšších vah dochází ke "sploštění" výsledků (hlavně u operátoru ACCRUE) -- mnoho dokumentů má totiž skóre 1.00 bez ohledu na počet výskytů jednotlivých slov. Jako vhodný postup pro určování vah se ukazuje nechat nejprve TOPIC, aby dosadil standardní váhy podle typu operátoru (AND, OR, ACCRUE) a až podle výsledků prvního dotazu se snažit o jejich korekci.

Určování celkového skóre dokumentu

Tato operace je klíčovou částí celého vyhledávání. Právě na ní totiž závisí použitelnost celé koncepce stromů, operátorů a vah. Znalost tohoto postupu nám umožňuje lépe porozumět významu jednotlivých operátorů a vah ve stromu a lépe tak vytvářet vlastní stromy.

TOPIC postupuje od listů až vrcholu stromu a postupně vypočítává skóre:

Postup tvorby stromů

Vytváření stromů není jednoduchou záležitostí a vyžaduje kromě znalosti operátorů také dobrou znalost dané oblasti. V úvahu je nutné brát i požadavky uživatelů na použití takto vytvořených stromů. Důležitý je také konkrétní druh a forma zdroje, ze kterého jsou dokumenty brány -- agenturní zprávy, diplomové práce, články z časopisů apod.; a také jakým způsobem byla vytvořena databáze pro použití v TOPICu -- jaké byly vytvořeny položky a jejich typ apod.

Protože se jedná o rozsáhlou oblast problémů, jsou ve větších firmách tvořeny celé týmy, které zahrnují specialisty z dané oblasti a specialisty na TOPIC, kteří se snaží společně splnit požadavky uživatelů.

Specialisté na TOPIC se dělí na dvě skupiny:

Takto vytvořené stromy mohou být zařazeny do skupiny tzv. systémových stromů, které jsou dostupné všem uživatelům a navíc jsou "předindexovány" s celou databází, což zrychluje proces vyhledávání při jejich použití v dotazech.

Každý uživatel si samozřejmě může vytvářet svoje vlastní uživatelské stromy.

Používané strategie tvorby stromů

Tvorba stromu je v podstatě zavádění určitého systému na danou oblast zájmu. Proto se při jejich tvorbě mohou používat metody běžné v systémové analýze. Jedná se zejména o tyto způsoby:

Omezení při tvorbě stromů

Jak jsme si již řekli dříve, musíme při tvorbě pojmového stromu brát ohledy na omezení TOPICu.

Délka a velikost

Maximální délka konkrétního slova v listu je 128 znaků. Maximální délka názvu tématu může být opět 128 znaků včetně pomlček a podtržítek.

Jedno téma se může skládat až z 20 000 podtémat. Ale vzhledem k paměťovým nárokům může být již při počtu kolem 1 000 podtémat ohlášen nedostatek paměti. V názvu tématu nelze použít jako oddělovače slov mezery.

Velká a malá písmena

Při definici stromu nezáleží na použití velkých a malých písmen. Jedinou výjimkou je použití modifikátoru CASE při definici názvu listu.

Použití nealfanumerických znaků

Aby bylo možné při definici stromu v názvech listů zadat znaky jako `/', `&' apod., je nutné, aby bylo použití těchto znaků nadefinováno administrátorem databáze v souboru style.lex.


Prosté dotazy

Jak již víme z předcházejících kapitol, prostý dotaz je nejjednodušším druhem dotazu v systému TOPIC. S prostým dotazem jsme se již určitě všichni setkali u některého z vyhledávacích systémů, například v knihovně. Jedná se o zjednodušenou formu tematického dotazu (viz strana ).

Popis prostého dotazu

Při formulaci prostého dotazu zadáváme jednotlivá slova nebo fráze, jejichž výskyt požadujeme v nalezených dokumentech. Nejjednodušší formou prostého dotazu je pouhé jedno slovo. Pokud chceme zadat slov více, oddělujeme je čárkou (která zde zastupuje operátor ACCRUE) nebo operátory (logickými spojkami) AND a OR.

Ukázka prostého dotazu

Rozdělení slov do úrovní jako v tematickém dotazu lze udělat pomocí závorek, do kterých uzavřeme skupinu slov. V prostém dotazu, narozdíl od tematického, nemůžeme používat váhy. TOPIC automaticky nastaví standardní -- 0.50 pro slova oddělená čárkou a 1.00 pro slova oddělená operátory AND a OR. Všechny operátory a modifikátory mají stejný význam jako u tematického dotazu. Pokud uzavřeme slovo do uvozovek, TOPIC je nebude skloňovat (jedná se tedy pouze o jinak zadaný operátor WORD). Stejně jako u tematického dotazu, nerozlišuje systém malá a velká písmena (pokud to výslovně neuvedeme pomocí modifikátoru CASE).

Po stisku tlačítka Výběr nebo klávesy Enter vyhledá TOPIC všechny dokumenty, které obsahují dané slovo (slova) a/nebo slova od něj odvozená (různé pády apod.).

Na obrázku si můžeme prohlédnout ukázku jednoduchého dotazu. Takto formulovaný dotaz nalezne všechny dokumenty, ve kterých se vyskytuje zkratka "ČNB" a zároveň sousloví "růst HDP". Nalezené dokumenty mají skóre určené podle počtu výskytů daných slov (nebo slov od nich odvozených) v dokumentu vzhledem k jeho délce.

Použití prostého dotazu

Hlavní předností prostého dotazu je jeho jednoduchost. Téměř každý, s pouhou minimální znalostí operátorů, dokáže během krátké chvíle vytvořit dotaz podle svých požadavků.

TOPIC ale nabízí ještě větší umocnění této síly. V prostých dotazech totiž můžeme na místě slova použít celá témata. Ukažme si jejich použití na příkladě:

V minulé kapitole jsme vytvořili tematický dotaz "_Ekonomie", ve kterém byla témata "_Makroekonomie", "_Mikroekonomie" a "_Obecná_ekonomie". Nyní chceme vytvořit dotaz, který nalezne všechny dokumenty týkající se ČNB a jejího vlivu na naší ekonomomiku. Nebude nás ale zajímat celé téma "_Obecná_ekonomie". Vzhled dotazu si můžeme prohlédnout na obrázku.

Ukázka prostého dotazu s tématem

V dotazu byla použita témata "_Ekonomie" a "_Obecná_ekonomie". Povšimněme si jejich uzavření do složených závorek. Těmi jsme přikázali TOPICu zařazení celého tématu, který tato slova zastupují, do dotazu bez ohledu na nastavení parametrů dotazu. Pokud bychom v menu Dotaz zvolili Parametry dotazu a zaškrtli volbu Automatické rozpoznávání témat, nebylo by nutné uzavírat témata do složených závorek.

Zadávání prostých dotazů

Při vytváření prostého dotazu postupujeme následovně: V menu Soubor zvolíme Nový dotaz nebo stiskneme klávesu Alt+F3. Pokud je to nutné zvolíme v menu Dotaz položku Prostý dotaz nebo stiskneme klávesu Alt+1.

Nyní můžeme do rámečku zadávat jednotlivá slova, operátory a témata. Při psaní můžeme používat editační klávesy a překlepy opravujeme jako v textovém editoru. Při vkládání témat do dotazu můžeme použít asistenta témat (menu Dotaz, volba Pomůcky nebo klávesa F2).

Pokud chceme spustit vyhledávání, stačí stisknout klávesu Enter.


Formulářové dotazy

Posledním z typů dotazů v systému TOPIC je formulářový dotaz. Ten rozšiřuje dotazování o možnost zadat podmínku pro konkrétní položku databáze, se kterou pracujeme. Administrátor databáze při její tvorbě určí jaké bude obsahovat položky. Často to budou položky jako je název článku, autor, datum zveřejnění apod. Záleží na typu databáze jaké konkrétní položky bude obsahovat.

Ukázka formulářového dotazu

Popis formulářového dotazu

Bez ohledu na databázi se budou v okénku formulářového dotazu objevovat dva druhy polí. Nejprve je to pole Topic, do kterého umisťujeme již vytvořené pojmové stromy týkající se celého dokumentu bez ohledu na členění do položek. Následují položky databáze spolu se speciální položkou Text nebo Doc, která zastupuje text dokumentu. Pro každou z položek uvedených na formuláři můžeme zadat zvláštní podmínku. Například požadovat dokumenty s datem mladším než 20. 12. 1995 tak, jak můžeme vidět na ukázce.

Každá položka se chová jako zvláštní prostý dotaz. Jednotlivé dotazy na položky jsou spojeny na způsob operátoru ACCRUE. To znamená, že v seznamu nalezených dokumentů jsou i dokumenty, které nesplňují všechny podmínky, ale jsou potom ohodnoceny nižším skórem. Pokud u některé položky zaškrtneme Povinné, musí daný dokument splňovat podmínku, aby byl zařazen do seznamu nalezených dokumentů.

Použití formulářových dotazů

Formulářové dotazy se používají jako rozšíření prostého dotazu. Můžeme využívat podmínek pro jednotlivé položky databáze. Často používanou položkou bude datum.

Zadávání formulářových dotazů

Při vytváření formulářového dotazu postupujeme následovně: V menu Soubor zvolíme Nový dotaz nebo stiskneme klávesu Alt+F3. Pokud je to nutné zvolíme v menu Dotaz položku Formulářový dotaz nebo stiskneme klávesu Alt+2.

Nyní můžeme do rámečku pro jednotlivé položky zadávat slova, operátory a celá témata způsobem stejným jako u prostého dotazu. Mezi jednotlivými položkami se pohybujeme klávesou Tab. Pokud jsme nastaveni na volbě Povinné, můžeme klávesou Mezera měnit její zaškrtnutí/nezaškrtnutí.

Pokud chceme spustit vyhledávání, stačí stisknout klávesu Enter.


Operátory

V této kapitole se nejprve podíváme na operátory. Systém disponuje několika typy operátorů, které mají různé použití a jejichž vzájemnou kombinací lze zkonstruovat komplexní dotazy:

Kromě toho, že lze pomocí operátorů dosáhnout specifických výsledků při prohledávání, lze u podřazených topiků některých operátorů použít i váhy (viz str. ). Chování operátorů lze ovlivnit pomocí tří modifikátorů (NOT, MANY a CASE), jejichž význam je vysvětlen na konci kapitoly.

Vybavení TOPICu oparátory je opravdu komplexní. V praxi se však používá jen jejich velmi úzký okruh.

Listové operátory

Operátor WORD

Operátor WORD slouží k označení listu topiku, který obsahuje slovo, které chceme nalézt. Vybrány jsou všechny dokumenty, které dané slovo obsahují.

Hledané slovo a slovo v dokumentu se musí přesně shodovat (na velikosti písmen nezáleží). Častěji než operátor WORD použijeme STEM, který nalezne i slova pozměněná v koncovce.

Operátor STEM

Operátor STEM použijeme, pokud chceme vybrat dokumenty, které obsahují dané slovo v jednom ze tvarů lišících se koncovkou. V češtině je používání tohoto operátoru téměř nezbytné, protože máme několik pádů a vzorů jmen, které se liší právě koncovkami.

Operátor SOUNDEX

Operátor SOUNDEX používáme v případech, kdy požadovaná slova v dokumentech "znějí podobně jako" slovo v listu topiku. Použijeme-li operátor SOUNDEX například se slovem počítač, vyhoví dotazu navíc i dokumenty, které obsahují slova počasí, počítání či sčítač.*

Operátor SOUNDEX je pojmenován po metodě, která vznikla ještě dříve než první počítače. Základním principem je vynechání samohlásek a přiřazení specifického čísla každé souhlásce. Po několika triviálních úpravách získáme číslo. Slova v angličtině podobně znějící mají toto číslo shodné.  -- pozn. aut.

Operátor SOUNDEX můžeme použít v případě, kdy neznáme přesné znění slova. Pokud však operátor SOUNDEX nemusíme používat nezbytně, raději se mu vyhýbáme, protože může do výsledku zahrnout mnoho nerelevantních dokumentů.

Operátor WILDCARD

Operátor WILDCARD se používá v případech, kdy hledané slovo obsahuje různé substituční (zástupné) znaky. Mezi tyto znaky patří např. `*' a `?', které mají stejný význam jako v operačním systému MS-DOS nebo UNIX (tj. zastupují libovolný počet znaků či jeden znak). Přehled všech speciálních znaků použitelných při tvorbě substitucí je uveden v připojené tabulce.

Zástupné znaky, které lze použít spolu s operátorem WILDCARD
Znak Funkce Omezení
? Zastupuje jeden libovolný alfanumerický znak. Např. ?ěsto nalezne slova město i těsto. Otazník `?' nemá speciální význam v množině ([...]) a v alternativním vzorku ({...}).
* Zastupuje žádný, jeden nebo několik libovolných alfanumerických znaků. Např. kop* nalezne slova kop, kopa, kopáč, kopule i koprový. Hvězdička `*' nesmí být použita jako první znak hledaného řetězce. Hvězdička `*' nemá speciální význam v množině ([...]) a v alternativním vzorku ({...}).
[...] Zastupuje jeden z několika znaků uvedených v množině. Např. v[ůoa]le nalezne slova vůle, vole a vale. Levá hranatá závorka `[' se používá výhradně k otevření definice množiny a pravá `]' k jejímu uzavření.
{...} Zastupuje jeden z několika specifikovaných řetězců. Např. defini{č,tiv}ní nalezne slova definiční i definitivní. Levá složená závorka `{' se používá výhradně k otevření definice alternativních vzorků a pravá `}' k jejímu uzavření.
^ Zastupuje libovolný znak, který není obsažen v množině. Např. mikro[^ns] nalezne všechna slova jako mikro? s výjimkou slov mikron a mikros. Stříška `^' je za speciální znak považována pouze, pokud bezprostředně následuje za otevíracím znakem množiny `['.
- Slouží k specifikování rozsahu znaků uvnitř množiny. Např. a[a-d]z nalezne slova aaz, abz, acz a adz. Pomlčka `-' má speciální význam pouze uvnitř množiny, tj. mezi znaky `[' a `]'.

Pomocí zástupných znaků, lze zapsat podmínky, kterým vyhovuje velké množství slov. Při formulaci dotazu na to musíme brát ohled a pokud možno se vyvarovat podmínkám typu vy*, kterým vyhovuje nepředstavitelné množství dokumentů.

Pokud chceme použít nějaký ze speciálních znaků, bez jeho speciálního významu, musíme před něj předřadit zpětné lomítko `\'. Toto se nemusí provádět uvnitř množiny (zde se píše zpětné lomítko jen před znak `]', pokud nemá být ukončovacím znakem množiny).

Operátor THESAURUS

Použití tohoto operátoru způsobí, že jsou vybrány i ty dokumenty, které obsahují synonymum daného slova. Ve standardní programu verzi je využíván tezaurus "Random House Thesaurus", který je bohužel určen pro anglický jazyk (např. pro slovo altitude existují ve slovníku následující synonyma: loftiness, tallness, pitch, height a elevation).

Operátor SUGGEST

Tento operátor lze použít k výběru dokumentů, které obsahují statisticky blízká slova zvolenému termínu. Statistická blízkost slov je vyhodnocována při indexování dokumentů. Jako statisticky blízká jsou vyhodnocena slova, která se často opakují blízko sebe.

Operátor TYPO

Operátor TYPO má podobný význam jako operátor SOUNDEX, tj. slouží k nalezení dokumentů, které obsahují slova s podobným zápisem. Operátor TYPO je striktnější než SOUNDEX -- nalezne méně odpovídajících slov.

Operátor TYPO je vhodné používat v případech, kdy byl text zpracován technologií OCR* a v nasnímaném textu se mohou vyskytovat překlepy.

Optical Character Recognizing -- automatické rozpoznávání znaků na obrazové předloze.

Proximitní operátory

Operátor PHRASE

Operátor PHRASE je používán v případech, kdy podřízené uzly topiku obsahují dvě nebo více slov, která dohromady tvoří frázi. V dokumentu, který má být vyhledán, se pak musí uvedená slova vyskytovat ihned po sobě v uvedeném pořadí.

Operátoru PHRASE mohou být podřízeny buď další operátory PHRASE nebo listy, které obsahují jakýkoliv listový operátor (kromě relačního).

Operátor SENTENCE

Operátor SENTECE vyhledá všechny dokumenty, které obsahují v jedné větě všechna slova specifikovaná v podřízených uzlech. Narozdíl od operátoru PHRASE nezáleží na pořadí slov.

Operátoru SENTENCE mohou být podřízeny další operátory SENTENCE, PHRASE nebo listy, které obsahují jakýkoliv listový operátor (kromě relačního).

Operátor PARAGRAPH

Tento operátor se používá k vyhledání dokumentů, které obsahují v jednom odstavci všechny uzly podřízené uzlu s operátorem PARAGRAPH.

Operátoru PARAGRAPH mohou být podřízeny další operátory PARAGRAPH, SENTENCE, PHRASE nebo listy, které obsahují jakýkoliv listový operátor (kromě relačního).

Boolovské operátory

Boolovské operátory slouží k definici topiků, které mají vyhledat dokumenty obsahující nějaké (ANY) nebo všechny (ALL) podřízené uzly. Podřízené uzly nemohou mít narozdíl od koncepčních operátorů (AND, OR a ACCRUE) váhu jinou než 1.00.

Operátor ANY

Operátor ANY se používá k vyhledání dokumentů, které vyhovují alespoň jednomu z podřízených uzlů topiku. Podřízené topiky nesmějí mít přiřazenu váhu.

Podřízené uzly mohou být následujících druhů: topiky používající operátory ANY, ALL, PARAGRAPH, SENTENCE a PHRASE a listy obsahující libovolné listové operátory kromě relačních.

Operátor ALL

Operátor ALL se používá k vyhledání dokumentů, které obsahují všechny podřízené uzly topiku. Podřízeným uzlům opět nesmí být přiřazena žádná váha.

Podřízené uzly mohou být následujících druhů: topiky používající operátory ANY, ALL, PARAGRAPH, SENTENCE a PHRASE a listy obsahující libovolné listové operátory.

Koncepční operátory

Koncepční operátor může být použit v topiku, který je nadřazený topikům s přiřazenými váhami.

Operátor OR

Operátor OR použijeme v těch případech, kdy požadujeme jako výsledek dokumenty, které vyhovují alespoň jednomu z podřazených uzlů (topiků). Narozdíl od použití operátoru ANY je výsledek dotazu seřazený dle relevance jednotlivých dokumentů.

Podřízené uzly mohou používat následující operátory: AND, OR, ACCRUE, ANY, ALL, SENTENCE, PARAGRAPH nebo PHRASE a jakýkoliv listový operátor.

Operátor AND

Operátor AND vybere ty dokumenty, které vyhovují všem podřízeným topikům. Narozdíl od operátoru ALL bude výsledek dotazu seřazený podle relevance.

Podřízené uzly mohou používat následující operátory: AND, OR, ACCRUE, ANY, ALL, SENTENCE, PARAGRAPH nebo PHRASE a jakýkoliv listový operátor.

Operátor ACCRUE

Operátor ACCRUE "dělá TOPIC TOPICem". Vybírá totiž ty dokumenty, které obsahují alespoň některé z podřízených topiků. Výsledná váha dokumentu je tím vyšší, čím více podřízených topiků dokument obsahuje. Někdy proto bývá funkce operátoru ACCRUE označována jako "čím více, tím lépe".

Podřízené uzly mohou používat následující operátory: AND, OR, ACCRUE, ANY, ALL, SENTENCE, PARAGRAPH nebo PHRASE a jakýkoliv listový operátor.

Relační operátory

Relační operátory se používají ve spojení s listovými topiky (s topiky na nejnižší úrovni), které obsahují některou z položek definovaných v databázi.* Výsledkem dotazu jsou pouze ty dokumenty, jejichž pole splňují zadané podmínky. Obsahem polí mohou být čísla, alfanumerické řetězce nebo data.

Přehled všech položek definovaných v databázi lze získat pomocí Dotaz|Pomůcky|Pole nebo stiskem F2 a zvolením Pole.

Pole lze při prohledávání používat jednak ve formulářovém dotazu a jednak v tematickém dotazu. V tematickém dotazu vypadá použití relačního operátoru následovně:

jméno topiku název pole
relační operátor
hodnota k porovnání

Operátor rovnosti `='

Operátor `=' se používá v případech, kdy vyžadujeme naprostou shodu hodnoty položky dokumentu se zadanou hodnotou.

Operátor větší než `>'

Operátor `>' se používá v případech, kdy požadujeme dokumenty u nichž je hodnota položky větší než zadaná hodnota.

Operátor větší nebo rovno `>='

Operátor `>=' se používá v případech, kdy požadujeme dokumenty u nichž je hodnota položky větší nebo rovna hodnotě zadané.

Operátor menší než `<'

Operátor `<' se používá v případech, kdy požadujeme dokumenty u nichž je obsah položky menší než zadaná hodnota.

Operátor menší nebo rovno `<='

Operátor `<=' se používá v případech, kdy požadujeme dokumenty u nichž je hodnota položky menší nebo rovna hodnotě zadané.

Operátor MATCHES

Operátor MATCHES se používá v případech, kdy požadujeme dokumenty s určitým přesným obsahem dané položky. Obsah položky a zadaný řetězec se musí zcela shodovat; nejsou tedy vybrány ty dokumenty, které obsahují zadané slovo v položce jako podřetězec.

Kromě běžných znaků lze v tomto a následujících relačních operátorech použít i zástupné znaky `?' a `*', které mají stejný význam jako u operátoru WILDCARD (viz str. ).

Operátor SUBSTRING

Operátor SUBSTRING vybere ty dokumenty, které v zadané položce obsahují kdekoliv požadovaný řetězec. Hledaný řetězec se může nacházet na libovolném místě položky -- na začátku, na konci nebo uvnitř.

Operátor CONTAINS

Operátor CONTAINS se používá v případech, kdy chceme položky dokumentů prohledávat na výskyt nějaké fráze. Funkci operátoru si nejlépe ukážeme na jednoduchém příkladu.

Dejme tomu, že chceme položky prohledávat na výskyt fráze nový počítačový virus. Tato podmínka je rozložena do tří po sobě jdoucích slov: (1) nový, (2) počítačový a (3) virus. Dokument, který bude vybrán musí obsahovat v dané položce tyto tři slova v pořadí v jakém jsou uvedena a nesmí mezi nimi být vloženo žádné jiné slovo (za slova se považují pouze skupiny písmen, nikoliv číslic). Následující pole tedy dotazu vyhoví: Objevil se nový počítačový virus či Nový počítačový virus přišel z USA; naopak pole obsahující Objeven nový polymorfní počítačový virus dotazu nevyhoví, protože slovo polymorfní zadanou frázi rozdělilo a rovněž nevyhoví pole nový virus objeven, protože neobsahuje slovo počítačový.

Operátor STARTS

Operátor STARTS slouží k definici začátku řetězce, který musí daná položka u vybraných dokumentů obsahovat. Efekt operátoru je stejný jako u operátoru MATCHES, pokud na konec hledaného řetězce doplníme hvězdičku `*'.

Operátor ENDS

Operátor ENDS slouží k definici konce řetězce, který musí daná položka u vybraných dokumentů obsahovat. Efekt operátoru je stejný jako u operátoru MATCHES, pokud na začátek hledaného řetězce doplníme hvězdičku `*'.

Modifikátory

Modifikátory upravují chování některých operátorů. Nemohou proto být použity samostatně, nýbrž pouze společně s některým z operátorů.

Mezi modifikátory patří:

Jednotlivé modifikátory si nyní popíšeme podrobněji.

Modifikátor NOT

Modifikátor NOT se používá k vyřazení dokumentů vyhovujících topikům, jejichž nadřazený uzel obsahuje operátor AND nebo OR. Funkce modifikátoru je následující:

Výsledné skóre závisí i na ostatních uzlech pojmového stromu.

Modifikátor MANY

Tento modifikátor určuje skóre uzlu (i listu) podle počtu výskytů slova z uzlu v dokumentu a podle celkové délky dokumentu.

Modifikátor je možné použít se všemi operátory kromě AND, OR a ACCRUE a listů používajících relační operátory.

Při použití operátoru MANY jsou nalezené dokumenty se stejným skórem řazeny podle pořadí zpracování. Proto může být dokument se stejným skóre, ale s menším počtem výskytů daného slova, umístěn před dokumentem, který byl zpracován později.

Modifikátor CASE

Používá se u listů s operátorem WORD nebo WILDCARD, kde přikazuje nalezení slov pouze s přesně danými velkými a malými písmeny. Je tedy rozdíl, zda hledáme VŠE, vše či Vše.


Asistenti

Asistenti jsou funkce TOPICu, které usnadňují orientaci ve velkém množství témat a uplatní se i při konstrukci dotazů. Asistent se vyvolá pomocí volby menu Dotaz|Pomůcky nebo stiskem klávesy F2. Standardně se objeví asistent pro témata. Pokud bychom chtěli použít jiného asistenta, stačí kliknout na tlačítko Témata a v zobrazeném seznamu vybrat požadovaného asistenta (viz obr.).

Asistent témat a výběr druhu asistenta

Asistent "Témata"

Pomocí tohoto asistenta si můžeme prohlížet seznam všech témat (topiků) doposud nadefinovaných. V okně jsou zobrazeny názvy jednotlivých témat. Pokud na některé z nich klikneme, objeví se jeho další podúrovně. Zobrazení je podobné jako v tematickém dotazu s tím rozdílem, že nejsou zobrazovány váhy. V případech, kdy je již nadefinován velký počet témat, můžeme do vstupní řádky vepisovat jméno požadovaného tématu; odpovídající téma se automaticky vyvolá.

Pokud nalezneme téma, které nás zajímá, stačí jej myší zvýraznit a pomocí klávesy Ins vložit do dotazu (podobně jako označené slovo z dokumentu). Témat můžeme označit více najednou, pokud při klikání přidržíme klávesu Ctrl. Popsaný způsob přenosu termínů do dotazů funguje ve všech asistentech.

Asistent "Hledat témata"

Funkce tohoto asistenta je obdobná jako u předchozího. Pouze možnosti prohledávání jsou mnohem bohatší. U každé položky definované pro téma* můžeme zadat, která slova má obsahovat (viz obr.). Zaškrtnutí volby Povinné zajistí, že daná položka musí zadané slovo skutečně obsahovat. Nalezená témata lze opět procházet a označená přenést pomocí klávesy Ins do dotazu.

U každého tématu si systém pamatuje jméno, datum poslední modifikace, autora a krátkou poznámku. Tyto údaje lze prohlížet a měnit pomocí parametrů dotazu (viz strana  ).

Asistent "Hledat témata"

Asistent "Slova"

Tento asistent slouží k prohlížení slov, která se v dokumentech vyskytla. Nemůže se stát, že by v nějakém dokumentu bylo slovo, které není zobrazeno v tomto seznamu. Můžeme si tak snadno ověřit, zda hledaný termín vůbec v nějakém dokumentu existuje.

Asistent "Slova"

Asistent "Stemy"

Tento asistent slouží k nalezení různých tvarů jednoho slova. Po kliknutí na slovo se objeví jemu příslušející další tvary. Můžeme si zde prohlédnout jaká slova budou hledána, pokud použijeme stemování. Na připojeném obrázku vidíme, že ke slovu manažer existuje opravdu velmi mnoho různých tvarů, které budou při použití stemování v dotazu rovněž nalezeny.

Asistent "Stemy"

Asistent "Tezaurus"

Tezaurus v lokalizované verzi TOPICu není obsažen. Tezaurus existuje ve verzi pro angličtinu. Jeho použití v češtině je problematické, neboť tezaurus nelze použít společně se stemováním.

Asistent "Statistický tezaurus"

Statistický tezaurus pracuje tak, že na základě výskytu slov v dokumentech určí slova, která se často vyskytují spolu a existuje mezi nimi tedy jistá, alespoň statistická souvislost. Po kliknutí na určitý termín se objeví jemu přiřazené termíny. Na připojené ukázce je rovněž vidět, že lze označit více slov, která se mají přenášet do dotazu.

Asistent "Statistický tezaurus"

Asistent "Soundex"

Asistent slouží k prohlížení slov, která podobně znějí. Jeho funkce jsou obdobné jako u ostatních asistentů.

Asistent "Wildcard"

Asistent umožňuje vyzkoušet, která slova odpovídají masce zadané v dotazu pomocí operátoru WILDCARD. Funkce asistenta je opět podobná jako u ostatních.

Asistent "Pole"

Tento asistent zobrazuje všechny položky definované v databázi. Po zvolení určité položky se objeví seznam všech různých hodnot, které položka v dokumentech nabývá.


Spuštění TOPICu ve Windows

Jako každý jiný program ve Windows, je i TOPIC zastoupen ikonou. Podíváme-li se na příkaz asociovaný s ikonou -- pomocí Soubor|Popis nebo stiskem Alt+Enter -- zjistíme, že samotný klient je realizován programem wintopic. Aby byl TOPIC správně spuštěn, je potřeba správně nastavit parametry spuštění. Tuto práci již většinou provedl administrátor TOPICovské databáze, ale pro úplnost si uvedeme malý příklad.

Budeme-li chtít spustit TOPIC, který je uložen v adresáři x:\topic\bin s textovou databází, jejíž preferenční soubor (.prf) je uložen v adresáři x:\db\users\user1\topic.prf, musí být v popisu souboru obsaženo následující:

Povelový řádek: x:\topic\bin\wintopic.exe -l cestina -c 1250 -datefmt dmy -pref topic.prf
Pracovní adresář:x:\db\users\user1

Parametr -l určuje jazyk, který bude používán pro uživatelské rozhraní;* -c určuje kódovou stránku -- v našem případě standardní kódová stránka Windows CP 1250, která umožňuje zobrazení všech českých znaků. Parametr -datefmt zajistí, že datum bude zobrazováno ve formátu, na který jsme zvyklí ve střední Evropě. Poslední parametr -pref určuje preferenční soubor, ve kterém je uloženo mnoho dalších informací nezbytných pro správný chod TOPICu.

Je nutné si uvědomit, že zvolený jazyk se používá jak pro texty, kterými program s uživatelem komunikuje, tak pro hledání různých tvarů slov v dokumentu. Proto doporučujeme spouštět TOPIC ve stejném jazyce jako je používaná databáze. V opačném případě ztratíme možnost využívat stemování (viz slovníček pojmů na straně ).

Slovníček pojmů

Tato kapitola je zpracována formou stručného slovníčku, ve kterém jsme se pokusili shrnout méně obvyklé pojmy použité v textu skript.

List
nejnižší úroveň pojmového stromu (topiku). Obsahuje již konkrétní slovo nejčastěji doplněné operátorem STEM.
Pojmový strom
hierarchicky uspořádaná skupina topiků navzájem spojených operátory, která vymezuje prohledávací podmínku pro dokumenty týkající se určitého tématu.
Stemování
způsob prohledávání plných textů, při kterém jsou nalezeny i všechny gramatické tvary hledaného slova.
Tezaurus
slovník synonym, který může být při vyhledávání dokumentů použit k nalezení dokumentů, jež obsahují synonyma hledaného slova.
Topik (téma)
část pojmového stromu, která odpovídá určitému pojmu. Topik je definován jako agregace dalších topiků a na nejnižší (listové) úrovni i konkrétních slov.
Uzel
má podobný význam jako topik, ale používá se v případech, kdy nás více zajímá pouze vrchol topiku, tj. definice jména topiku a operátoru, kterým jsou k uzlu připojeny topiky na nižší úrovni.
Položka databáze
je hodnota, která může být uložena u každého dokumentu. Obvykle slouží k zaznamenání názvu dokumentu, jeho autora nebo data vydání.
Pole
je část dialogového okna, do které se ve formulářovém dotazu zapisují podmínky pro jednotlivé položky databáze. Obvykle bývá pro každou položku databáze definováno i pole ve formulářovém dotazu.

Přehled ovládání programu

Následující kapitola uvádí stručný přehled klávesových zkratek použitelných pro ovládání programu. Pokud pracujeme s TOPICem často, je výhodné si pro nejčastěji prováděné operace tyto zkratky zapamatovatefektivita práce je pak mnohem vyšší než při použití myši.

Dotaz

Alt+F3
Vytvoření nového dotazu
F3
Otevření dotazu uloženého v souboru
Ctrl+F7
Uložení dotazu do souboru
F7
Uložení dotazu do souboru pod novým jménem
Alt+F2
Správce dotazů
Alt+1
Prostý dotaz
Alt+2
Formulářový dotaz
Alt+3
Tematický dotaz
Ctrl+F3
Nastavení parametrů dotazu
Ins
Vložení označeného slova do dotazu
Shift+F4
Vyjmutí označeného topiku z dotazu
Shift+F5
Nastavení kritérií třídění výsledků dotazu
Ctrl+R
Zahájení provádění dotazu
Ctrl+X
Přerušení výběru
Alt+F5
Sloučení výsledků dotazu

Editace tematických dotazů

Ctrl+A
Přidání následníka do pojmového stromu
Ctrl+D
Přidání souseda (uzlu na stejné úrovni) do pojmového stromu
Ctrl+C
Skrytí definice topiku nebo označené části pojmového stromu
Ctrl+E
Rozvinutí (zobrazení včetně nižších úrovní) označeného uzlu
Tab
Pohyb po jednotlivých částech uzlu
Kurzorové šipky
Pohyb po pojmovém stromu

Témata

F4
Otevření označeného topiku jako samostatný dotaz
Alt+F7
Uložení témat

Prohlížení dokumentů

F9
Zobrazení dalšího dokumentu
F8
Zobrazení předchozího dokumentu
Shift+F9
Skok na další výskyt některého z hledaných slov
Shift+F8
Skok zpět na předchozí výskyt některého z hledaných slov

Tisk

Shift+F10
Vytištění aktivního objektu (dotazu, výsledku dotazu nebo dokumentu)
Alt+F10
Nastavení formátu stránky pro tisk

Spolupráce se schránkou (clipboardem)

Ctrl+Del
Vyjmutí označeného objektu a přesunutí do schránky
Ctrl+Ins
Zkopírování označených objektů do schránky
Shift+Ins
Vložení objektu ze schránky
Shift+F2
Označení všech objektů
Del
Smazání označených objektů

Ostatní

F5
Zobrazení doplňkové informace k aktivnímu objektu
Shift+F3
Výběr databáze použité pro dotazování
Alt+F2
Vyvolání správce dotazů
Esc
Zavření aktivního okna
Alt+F4
Ukončení programu
Alt+Tab
Pohyb mezi běžícími aplikacemi
Alt+Esc
Přepnutí na další běžící aplikaci
Ctrl+Esc
Přehled spuštěných aplikací
Stránku vytvořil Jiří Kosek
Poslední změna 13-11-1997