Amaitu dut eguna 2 eguzkitsua Needham prestakuntza Fast, MA, eta ideiak naiz bursting (eta hori ona prestakuntza klaseak me do). One particular aspect of FAST has me thinking and I wanted to write it down while it was still fresh and normal day-to-day "stuff" galtzen da nire burua.
Dugu SharePoint WSS 3.0 / MOSS inplementatzaileen maiz aurre SharePoint edozein arrazoiz-tamainako proiektu batekin arazo gogorra: Nola SharePoint guztiak duela gure informazio-, ezin hobeto prestatuta arkitekturaren barruan, hala nola egokitzen kargatzen untagged datu guztiak lortu ditugu?
Sarritan nahikoa, hau da, ez da zaila da arazo bat, hala nola, geure burua esparrua ditugun arazoak direla eta: "We don’t care about anything more than 3 months old." "We’ll handle all that old stuff with keyword search and going-forward we’ll do it the RIGHT way…" Etc.
Baina, what happens if we can’t scope ourselves out of trouble and we’re looking at 10’s of thousands or 100’s of thousands (edo nahiz eta milioika) Docs — kargatzea eta horietatik markatzea ultramontanoa, XIX gure nahia da?
FAST erantzuna izan liteke.
Azkarra bilatzeko prozesuan piezak mugituz asko biltzen ditu, baina erraztua ikuspegi bat da hau:
- Crawler prozesu bat eduki bilatzen.
- Edukia aurkitu, eta eskuak off bat broker duen prozesu dokumentu prozesadoreak igerileku bat kudeatzen.
- Broker prozesua eskuetan da off dokumentu prozesadore bat.
- Dokumentu prozesadorea dokumentua aztertzen du eta gasbide-prozesu baten bidez, ANALIZA LAS bejeezus the out of du dokumentuaren, eta it HANDS off to bat-indizea builder-mota-prozesua.
Starship FAST the On, we have a lot of control over the document processing pipeline. We can mix and match about 100 pipeline, osagai eta, , gehien interesgarriagoa da, we can write our own components. Like I say, FAST is analyzing documents every which way but Sunday and it compiles a lot of useful information about those documents. Those crazy FAST people are clearly insane and obsessive about document analysis because they have tools and/or strategies to REALLY categorize documents.
Beraz, … FAST erabiliz,-konbinazioa in, gure custom own pipeline-osagaia-rekin, we can grab all that context information from FAST and feed it back to MOSS. It might go something like this:
- Dokumentua MOSS tik FAST elikatzen.
- Normal ero obsesibo-FAST dokumentu analisi eta kategorizazio gertatzen.
- Gure Ohiko gasbide osagai jaisten testuinguru informazio hori off batzuk, datu-base bat.
- Gure diseinu propioa prozesuan testuinguru informazioa irakurtzen, MOSS nola egiten duen dokumentua egokitzeko gure IA barruan erabaki batzuk, eta markatzen sortu duen web zerbitzu eta objektu eredua erabiliz.
Jakina, Ez dira Prozesu automatikoa perfektua baina esker izan daiteke obsesiboa (eta, seguru asko, baina erokeria-in-a-ona-era FAST pertsonak), masa benetan eraginkorra karga prozesua ez duela gehiago filmatu benetako borroka bat eduki ahal izango dugu, besterik baino bete SQL datu base bat ozta-bilaketak dokumentu sorta batekin.
</amaiera>