He terminado de día 2 de rápida formación en Needham soleado, MA, y estoy rebosante de ideas (me hacen que todas las clases de la buena formación). Un aspecto particular de rápido me tiene pensando y quería escribirlo mientras que estaba todavía fresco y normal día a día "cosas" lo empujó fuera de mi cabeza.
Tenemos SharePoint WSS 3.0 / Los implementadores de MOSS con frecuencia enfrentan un problema difícil con cualquier proyecto de SharePoint tamaño razonablemente: ¿Cómo hacemos que todos los datos sin etiquetar cargados en SharePoint que todo encaja dentro de la arquitectura de la información perfectamente diseñado?
A menudo bastante, Esto no es un problema tan difícil porque nosotros mismos nos alcance fuera de problemas: "No nos importa nada más 3 meses de edad." "Lo manejamos cosas tan viejas con búsqueda por palabra clave y va adelante lo haremos a la manera correcta…" Etc..
Pero, Qué sucede si no podemos alcance nosotros mismos fuera de problemas y estamos viendo decenas de miles o cientos de miles (o incluso millones) de docs — la carga y etiquetado de cual es nuestro deseo devoto?
RÁPIDA podría ser la respuesta.
Proceso de búsqueda de FAST incluye una gran cantidad de piezas móviles, pero esto es una visión simplificada:
- Un proceso sobre orugas busca contenido.
- Se encuentra contenido y lo toquen a un proceso intermediario que gestiona un conjunto de procesadores de documento.
- Corredor proceso toquen a uno de los procesadores de documento.
- El procesador del documento analiza el documento y a través de un proceso de tubería, analiza la bejeezus del documento y lo toquen a un proceso de tipo generador de índice.
En la nave rápida, tenemos un montón de control sobre el documento de canalización de proceso. Podemos mezclar y combinar sobre 100 los componentes de la tubería y, más Interesantemente, podemos escribir nuestros propios componentes. Como yo digo, RÁPIDO está analizando documentos de todos los sentidos pero el domingo y recopila mucha información útil acerca de los documentos. Esos locos rápidos son claramente insano y obsesivo sobre el análisis del documento porque tienen herramientas o estrategias que realmente clasificar documentos.
Por lo tanto … usar en combinación con nuestro propio componente de canalización personalizado, podemos tomar toda esa información de contexto de rápido y alimentación a MOSS. Podría ir a algo como esto:
- Documento alimenta rápidamente de MOSS.
- Categorización y análisis del normal loco-obsesivo documento rápido pasa.
- Nuestro propio componente de canalización personalizado gotas de esa información de contexto de una base de datos.
- Un proceso de nuestro propio diseño Lee la información de contexto, algunas decisiones sobre cómo encajar ese documento MOSS dentro de nuestro IA y marca usando un servicio web y el modelo de objetos.
Claro, No tal proceso automatizado puede ser perfecto, pero gracias a la obsesiva (y posiblemente insane-but-in-a-good-way rápido), puede que tengamos una verdadera lucha disparó un proceso verdaderamente eficaz de la carga total que más que llenar una base de datos SQL con un montón de documentos apenas-búsqueda.
</final>