Rydw i wedi gorffen i fyny o ddydd 2 o hyfforddiant FAST yn heulog Needham, MA, ac rwy'n llawn syniadau (mae'r holl ddosbarthiadau hyfforddiant da yn ei wneud i mi). Mae un agwedd benodol ar gyflym mi feddwl ac yr oeddwn am ei ysgrifennu i lawr tra oedd yn dal yn ffres ac yn arferol o ddydd i ddydd "stwff" gwthio allan o fy mhen.
Rydym yn SharePoint WSS 3.0 / Gweithredwyr MOSS aml yn wynebu problem anodd gyda unrhyw brosiect SharePoint rhesymol o faint: Sut ydym yn cael yr holl ddata heb ei dagio llwytho i mewn i SharePoint fel bod y cyfan yn cyd-fynd o fewn ein pensaernïaeth gwybodaeth sy'n berffaith?
Ddigon aml, nid yw hyn yn broblem mor anodd gan ein bod cwmpas ein hunain allan o drwbl: "Dwi ddim yn poeni am unrhyw beth mwy na 3 mis oed." "Fe ymdrin â bod mor hen stwff gyda chwiliad gair allweddol a mynd ymlaen byddwn yn gwneud yn y ffordd gywir…" Ac ati.
Ond, Beth sy'n digwydd os na all bennu cwmpas ein hunain allan o drafferth ac rydym yn edrych ar gwariad miloedd neu cannoedd o filoedd (neu hyd yn oed miliynau) o docs — llwytho a tagio sef ein dymuniad devout?
Efallai FAST yn ateb.
Proses chwilio FAST yn cynnwys llawer o rannau sy'n symud ond un farn syml yw hyn:
- Mae proses crawler yn edrych ar gyfer cynnwys.
- Mae'n canfod cynnwys a dwylo i ffwrdd i broses brocer sy'n rheoli cronfa o broseswyr ddogfen.
- Broses Brocer dwylo i ffwrdd i un o'r ddogfen proseswyr.
- Mae'r prosesydd ddogfen yn dadansoddi'r ddogfen a thrwy broses biblinell, dadansoddi bejeezus allan o'r ddogfen a dwylo i ffwrdd i broses fath adeiladwr mynegai.
Ar y FAST starship, Mae gennym lawer o reolaeth dros y ddogfen prosesu arfaeth. Gallwn gymysgu a cyfatebol am 100 cydrannau gweill ac, y rhan fwyaf o ddiddorol, gallwn ysgrifennu ein hunain cydrannau. Hoffwn ddweud, Yn gyflym wrthi'n dadansoddi dogfennau mhob ffurf ond ddydd Sul ac mae'n llunio llawer o wybodaeth ddefnyddiol am y dogfennau hynny. Bobl cyflym wallgof hynny yn glir gwallgof ac yn obsesiynol ynglŷn â dadansoddiad ddogfen oherwydd bod ganddynt offer a/neu strategaethau i mewn gwirionedd yn categoreiddio dogfennau.
Felly … ddefnyddio FAST ar y cyd â'n elfen biblinell addef arfer, gallwn cipio'r holl wybodaeth honno yn y cyd-destun o gyflym a bwydo yn ôl i MOSS. Efallai yn mynd rhywbeth fel hyn:
- Dogfen yn cael ei bwydo i mewn i FAST gan MOSS.
- Normal crazy-obsesiynol FAST dosrannu ddogfen a chategoreiddio yn digwydd.
- Mae ein cydran biblinell addef arfer yn gostwng rhywfaint o'r wybodaeth cyd-destun i ffwrdd i gronfa ddata.
- Proses o ein dylunio hunain yn darllen y wybodaeth cyd-destun, gwneud rhai penderfyniadau ar sut i osod y ddogfen honno MOSS o fewn ein IA ac mae'n nodi i fyny gan ddefnyddio gwasanaeth ar y we ac mae'r model gwrthrych.
Wrth gwrs, ni all unrhyw broses awtomataidd o'r fath fod yn berffaith, ond diolch i'r obsesiynol (a phobl FAST bosibl wallgof-ond-in-a-da-ffordd), efallai y bydd gennym ymladd go iawn yn saethu mewn proses llwyth màs gwirioneddol effeithiol sy'n gwneud mwy na dim ond llenwi cronfa ddata SQL gyda chriw o ddogfennau prin-chwilio.
</diwedd>