Glengamoi (Forum) · AspHeute · .NET Heute (RSS-Suche) · AspxFiles (Wiki) · .NET Blogs
ASP German Homepage Homepage
 

Liste

.NET 2.0 (1)
.NET Allgemein (16)
.NET Fu (5)
ADO.NET (11)
Aprilscherz (3)
ASP Grundlagen (44)
ASP Tricks (83)
ASP.NET (44)
ASPIntranet.de (5)
C# (28)
Datenbank (44)
Dokumentation (4)
IIS 6.0 (1)
Komponenten (29)
Optimierung (10)
Server (21)
Sicherheit (34)
Tee Off (6)
VB.NET (6)
WAP (8)
Web Services (11)
XML (9)

RSS 2.0 - Die neuesten fünf Artikel auf AspHeute.com


 

Suchen





 

English Articles
Chinese Articles
Unsere Autoren
 
Link zu AspHeute
Impressum
Werben
Anfragen

PDF Dokumente suchbar machen

Geschrieben von: Christoph Wille
Kategorie: Server

Auf Firmenwebsites finden sich sehr oft Dokumente im Adobe Acrobat PDF (Portable Document Format) Format, da sich mit ihnen das Layout über verschiedenste Plattformen hinweg bewahren läßt, womit sie ideal für Produktbeschreibungen oder Handbücher sind. Wie aber schafft man es, dem Besucher der Website die Inhalte dieser Dokumente in einem Suchformular zur Verfügung zu stellen?

Der einfachste Weg zum Erfolg ist sich auf den bewährten Index Server (bzw. Indexing Service) zu verlassen, der ja auch bei HTML Dokumenten zum Einsatz kommt, wie zum Beispiel hier auf AspHeute.com. Eine Klippe muß man allerdings umschiffen - der Indexing Service weiß nicht, wie er ein PDF Dokument indizieren soll. Dazu benötigt er etwas Hilfe, und zwar in Form eines sogenannten IFilters. Dieser stellt dem Indexing Service die Wörter der Dokumente zum indizieren zur Verfügung, agiert sozusagen als "Importfilter".

Dankenswerterweise stellt Adobe einen solchen IFilter auf ihrer Website zum Download zur Verfügung. Die aktuelle Version zum Zeitpunkt der Artikelerstellung war 4.1, und diese kann sowohl unter NT 4.0 als auch unter Windows 2000 installiert werden.

Installation des Adobe PDF IFilter

Nach dem Download stellt sich die Installation sehr unkompliziert dar. Einzig und allein der Indexing Service muß gestoppt werden:

Danach startet man das Setup für den PDF IFilter, welches ohne Fragen (und hoffentlich Fehler) komplettiert. Nun kann der Indexing Service wieder gestartet werden.

Funktionstest

War das schon alles?, werden sich nun einige fragen. Ja, es ist so einfach. Zum Beweis kopieren Sie einfach einige PDF Dokumente in ein Verzeichnis, das durch einen Index Server Catalog bedient wird (das Anlegen eines Catalogs wird im Artikel Arbeiten mit Index Server Catalogs beschrieben). Warten Sie ein wenig, damit Index Server die Dateien scannen kann, dann wählen Sie Query the catalog im MMC Snap-in aus, und setzen eine Abfrage ab:

Nun werden nicht nur Resultate aus HTML Dateien angezeigt, sondern auch Resultate aus PDF Dateien. Mit Hilfe der Abfragesprache des Indexing Service kann man die Abfragen auch gezielt auf spezifische Dateitypen einschränken, um zB nur Produktbeschreibungen aus PDF Dokumenten als Resultat zu erhalten.

Schlußbemerkung

Man soll die Bordmittel des IIS und seiner zusätzlichen Services nicht unterschätzen. Oft kommt man damit weiter, als man im ersten Moment vermuten würde.

Verwandte Artikel

Arbeiten mit Index Server Catalogs
Objektbasierte Index Server Suche

Links zu anderen Sites

Acrobat for Windows Downloads
Searching the Contents of PDF Files on a Web Site

Wenn Sie jetzt Fragen haben...

Wenn Sie Fragen rund um die in diesem Artikel vorgestellte Technologie haben, dann schauen Sie einfach bei uns in den Community Foren der deutschen .NET Community vorbei. Die Teilnehmer helfen Ihnen gerne, wenn Sie sich zur im Artikel vorgestellten Technologie weiterbilden möchten.

Haben Sie Fragen die sich direkt auf den Inhalt des Artikels beziehen, dann schreiben Sie dem Autor! Unsere Autoren freuen sich über Feedback zu ihren Artikeln. Ein einfacher Klick auf die Autor kontaktieren Schaltfläche (weiter unten) und schon haben Sie ein für diesen Artikel personalisiertes Anfrageformular.

 

Und zu guter Letzt möchten wir Sie bitten, den Artikel zu bewerten. Damit helfen Sie uns, die Qualität der Artikel zu verbessern - und anderen Lesern bei der Auswahl der Artikel, die sie lesen sollten.

Bewerten Sie diesen Artikel
 Sehr gut   Nicht genügend  
   1  2  3  4  5  
 

  
   Für Ausdruck optimierte Seite

©2000-2006 AspHeute.com
Alle Rechte vorbehalten. Der Inhalt dieser Seiten ist urheberrechtlich geschützt.
Eine Übernahme von Texten (auch nur auszugsweise) oder Graphiken bedarf unserer schriftlichen Zustimmung.