Ich habe fertig bis Tag 2 SCHNELLE Ausbildung in sonnigen Needham, MA, und ich bin voller Ideen (welche alle gute Ausbildung Klassen tun, um mich). Ein spezieller Aspekt der hat mich schnell denken und wollte ich es aufschreiben, während es noch frisch und normalen täglichen "Zeug war" aus meinem Kopf verdrängt.
Wir SharePoint WSS 3.0 / MOSS-Implementierer stellen häufig eine harte Problem mit jeder vernünftige Größe SharePoint-Projekt: Wie kriegen wir die nicht markierter Daten in SharePoint geladen, so dass sie alle in unserem perfekt gestaltete Informations-Architektur passt?
Oft genug, Das ist so ein schwieriges Problem nicht, weil wir uns aus der Misere Zweck: "Wir kümmern uns nicht um nichts mehr als 3 Monate alt." "Wir werden all das alte Zeug mit Stichwortsuche behandeln und gehen vorwärts wir Mach es richtig…" Etc..
Aber, Was passiert, wenn wir nicht uns Ärger Zweck kann und wir auf 10 Tausenden oder 100's von Tausenden blicken (oder sogar Millionen) docs — das Laden und Tagging ist unser frommer Wunsch?
SCHNELL könnte die Antwort sein.
FASTETEN Suchprozess enthält viele bewegliche Teile aber eine vereinfachte Ansicht ist dies:
- Ein Crawler-Prozess sucht nach Inhalten.
- Es findet Inhalte und übergibt es an einen Brokerprozess, der verwaltet einen Pool von Dokumentprozessoren.
- Brokerprozess übergibt es an eines der Dokumentprozessoren.
- Der Dokument-Prozessor analysiert das Dokument, und über eine Rohrleitung-Prozess, analysiert die Bejeezus aus dem Dokument und übergibt es an einen Index-Generator Typ Prozess.
Auf das Raumschiff schnell, Wir haben eine Menge an Kontrolle über die Dokumentenverarbeitung Rohrleitung. Wir können mischen und entsprechen zu 100 Pipelinekomponenten und, die meisten interessanterweise, Wir können unsere eigenen Komponenten schreiben.. Wie ich sage, SCHNELL ist Dokumente analysieren, allen Varianten aber Sonntag und viele nützliche Informationen über diese Dokumente kompiliert. Diese verrückte schnell Leute sind eindeutig verrückt und obsessive über Dokumentenanalyse weil sie Werkzeuge bzw. Strategien wirklich Dokumente kategorisieren.
Also … SCHNELL in Kombination mit unseren eigenen benutzerdefinierte Pipelinekomponente verwenden, Wir greifen alle diese Kontextinformationen von FAST und es zurück zu MOSS feed. Es könnte soetwas gehen:
- Dokument wird schnell von MOSS zugeführt.
- Normal verrückt-obsessiv schnell Dokument Parsen und Kategorisierung passiert.
- Unsere eigene benutzerdefinierte Pipelinekomponente Tropfen einige dieser Kontext-Informationen aus einer Datenbank.
- Ein Prozess von unserer eigenen Design liest die Kontextinformationen, Einige entscheidet über wie man das MOSS-Dokument innerhalb unserer IA passen und markiert sie oben mit einem Webdienst und das Objektmodell.
Natürlich, keine solche automatisierter Prozess kann perfekt aber Dank der obsessiv sein. (und möglicherweise insane-but-in-a-good-way schnell Menschen), Wir haben eine echte Kämpfe Schuss auf eine wirklich effektive Masse Ladeprozess, die mehr als nur eine SQL-Datenbank mit einem Haufen kaum durchsuchbare Dokumente ausfüllen.
</Ende>