XML-Informationssysteme
Was leistet Oracle Intermedia (1)
- Speicherung von Volltexten unterschiedlicher Formate (txt, doc, rtf, ...)
- Speicherung von Multimedia-Daten unterschiedlicher Formate
- integriert in Oracle 8i, so daß strukturierte Daten und Volltextdaten im selben System gespeichert werden können
- effizient (Messung auf einem WinNT-PC, 512 MB RAM, 500 Mhz Pentium):
- Laden: ca. 2.000 Dokumente/min (durchschnittliche Größe der Dokumente 4 KB)
- Indexieren: Neuaufbau in ca. 1,5 min
- Abfragen: ca. 12 Abfragen/sec (Mix verschiedener Abfragen)
- Zeichensätze: 7 Bit (ASCII), 8 Bit (ISO 8859-X), 16 Bit (Unicode: ISO 10646)
- Stopwortlisten: Stopworte werden nicht in den Index aufgenommen
- Maskierungen:
- Links, Mitte, Rechts
- Einzeichen: _
- Mehrzeichen: %
- Wortabstandsoperator: near
- boolesche Operatoren: and, or, binary not
- Minus- und Komma-Operator: accumulate, minus
- linguistische Operationen:
- phonetische Ähnlichkeit: soundex
- Vollformerweiterung: stem
- Rechtschreibähnlichkeit: fuzzy