SharePoint en snel — de Reese's Peanut Butter Cups van Enterprise Apps?

Ik heb dag eindigde 2 van snelle opleiding in zonnige Needham, MA, en ik ben barstensvol ideeën (welke alle goede opleidingsklassen doen voor mij). Een bepaald aspect van snel heeft me denken en ik wilde te noteren terwijl het was nog steeds fris en normale dagelijkse "spul" duwde het out of my head.

We SharePoint WSS 3.0 / MOSS uitvoerders vaak geconfronteerd een taai probleem met elk redelijk en middelgrote SharePoint project: Hoe krijgen we alle niet-gecodeerde gegevens in SharePoint geladen zodanig dat alles binnen onze perfect ontworpen informatie-architectuur past?

Vaak genoeg, Dit is niet zulk een moeilijk probleem omdat we onszelf scope out of trouble: "We don't care over iets meer dan 3 maanden oud." "We zullen omgaan met al die oude spullen met zoeken op trefwoord en gaan-forward we doen het de juiste manier…" Enz.

Maar, Wat gebeurt er als wij ons uit de problemen kan niet werkingssfeer en we 10 duizenden of 100 's van duizenden kijken (of zelfs miljoenen) voor docs — het laden en tagging van die onze vrome wens is?

SNELLE misschien wel het antwoord.

SNEL het zoekproces omvat een heleboel bewegende delen maar één vereenvoudigde weergave is dit:

  • Een proces crawler zoekt naar inhoud.
  • Het vindt inhoud en het uit handen van een makelaar proces dat een pool van document processors beheert.
  • Makelaar proces handen het af om één van de document-processors.
  • De processor document het document analyseert en via een pijpleiding proces, analyseert de bejeezus van het document en het handen uit om een index bouwer type proces.

Op het sterrenschip FAST, We hebben een heleboel controle over het document verwerking pijpleiding. We kunnen mix en match over 100 pijpleiding componenten en, meest interessant, We kunnen onze eigen componenten schrijven. Zoals ik zeg, SNEL documenten is analyseren elke welke manier maar zondag en gecompileerd een heleboel nuttige informatie over deze documenten. Die gekke snel mensen zijn duidelijk krankzinnig en obsessief over documentanalyse omdat ze gereedschappen en/of strategieën echt om documenten te categoriseren.

Dus … met behulp van snel in combinatie met onze eigen aangepaste pijplijncomponent, We kunnen grijpen alle informatie in dat kader van snel en voeden het terug naar MOSS. Het kan gaan iets als dit:

  • Document wordt ingevoerd in snel van MOSS.
  • Normale gek-obsessief snel document parseren en categorisatie gebeurt.
  • Onze eigen aangepaste pijplijncomponent druppels sommige van die context informatie uit een database.
  • Een proces van onze eigen ontwerp leest de context informatie, Sommige beslist over hoe fit dat MOSS document binnen onze IA en markeert het omhoog met behulp van een webservice en het objectmodel.

Natuurlijk, geen dergelijke geautomatiseerde proces kan worden perfect, maar dankzij de obsessief (en eventueel insane-but-in-a-good-way snel mensen), kunnen we een echte gevechten schot op een echt effectieve massa belasting proces dat meer dan alleen een SQL-database met een bos van nauwelijks-searchable documenten vullen.

</einde>

Abonneren op mijn blog.

Technorati Tags: , ,

Laat een antwoord achter

Uw e-mailadres wordt niet gepubliceerd. Verplichte velden zijn gemarkeerd *