SharePoint і хуткай — Рыз арахісавае масла кубкі карпаратыўных прыкладанняў?

Я скончыў дзень 2 з хуткага навучання ў сонечным Needham, Масачусэтс, і я распірала ад ідэй (якія ўсе добрыя навучальныя класы са мной зрабіць). One particular aspect of FAST has me thinking and I wanted to write it down while it was still fresh and normal day-to-day "stuff" штурхнуў яе з маёй галавы.

Мы SharePoint WSS 3.0 / MOSS выканаўцы часта сутыкаюцца з жорсткім праблема з любым разумных памераў праекта SharePoint: Як мы можам атрымаць усе немаркіраванай дадзеныя, загружаныя ў SharePoint так, што ўсё гэта ўпісваецца ў нашу ідэальна падыходзяць інфармацыйнай архітэктуры?

Досыць часта, гэта не такая складаная праблема, таму што мы сябе сферу далей ад непрыемнасцяў: "We don’t care about anything more than 3 months old." "We’ll handle all that old stuff with keyword search and going-forward we’ll do it the RIGHT way…" Etc.

Але, what happens if we can’t scope ourselves out of trouble and we’re looking at 10’s of thousands or 100’s of thousands (або нават мільёны) з дакументаў — загрузка і маркіроўку, якая з'яўляецца нашым запаветнай марай?

ХУТЧЭЙ можа быць адказам.

Працэс пошуку ХУТКА ўключае ў сябе шмат якія рухаюцца частак, але адна спрошчаным выглядзе гэта:

  • Працэс гусенічным шукае зместу.
  • Ён знаходзіць змест і перадае яго да брокеру працэс, які кіруе пулам дакумента працэсараў.
  • Брокер працэс перадае яго ў адзін з працэсараў дакумент.
  • Дакумент працэсар аналізуе дакумент і па трубаправодзе працэсу, аналізуе bejeezus з дакумента і перадае яго ў тып Process Builder індэкс.

На зоркалёце ХУТКА, we have a lot of control over the document processing pipeline. We can mix and match about 100 Трубаправоды і кампаненты, што самае цікавае, we can write our own components. Like I say, FAST is analyzing documents every which way but Sunday and it compiles a lot of useful information about those documents. Those crazy FAST people are clearly insane and obsessive about document analysis because they have tools and/or strategies to REALLY categorize documents.

Так … Функцыя хуткага пераходу ў спалучэнні з нашымі ўласнымі карыстацкіх кампанентаў трубаправода, we can grab all that context information from FAST and feed it back to MOSS. It might go something like this:

  • Дакумент падаецца ў хутка ад MOSS.
  • Нармальны вар'ят обсессивно-ХУТКА разбор дакумента і катэгарызацыі адбываецца.
  • Нашы ўласныя кампаненты трубаправода падае некаторыя з кантэксту, што інфармацыю з да базы дадзеных.
  • Працэс нашага ўласнага дызайну чытае кантэкстнай інфармацыі, робіць некаторыя рашэнні аб тым, каб адпавядаць, што MOSS дакумента ў нашым IA і адзначае яго з дапамогай вэб-службаў і аб'ектная мадэль.

Вядома, няма такой аўтаматызаваны працэс не можа быць дасканалым, але дзякуючы дакучлівай (і, магчыма, вар'яцкія, але-в-добрым-шлях хутка людзі), у нас можа быць рэальнага бою стралялі па-сапраўднаму эфектыўнага працэсу маса грузу, што робіць больш, чым проста запоўніць базу дадзеных SQL з кучай ледзь пошуку дакументаў.

</канец>

Падпісацца на мой блог.

Пакінуць каментар

Ваш электронны адрас не будзе апублікаваны. Абавязковыя палі пазначаныя * *