شیرپوینت و FAST — لیوان کره بادام زمینی ریس نرم افزار سازمانی?

من به پایان رسید تا روز 2 آموزش FAST در آفتابی Needham, MA, و من سرشار از ایده (که تمام کلاس های آموزش خوب به من). One particular aspect of FAST has me thinking and I wanted to write it down while it was still fresh and normal day-to-day "stuff" تحت فشار قرار دادند آن را از سر من.

ما شیرپوینت WSS 3.0 / در مجریان MOSS اغلب مشکل سخت با هر پروژه شیرپوینت اندازه منطقی با آن مواجه است: چگونه می توانم تمام اطلاعات untagged لود شده به شیرپوینت به طوری که آن را همه در درون کاملا طراحی معماری اطلاعات ما متناسب با ما?

اغلب به اندازه کافی, این چنین یک مشکل سخت نیست چون ما خودمان را دامنه از مشکلات: "We don’t care about anything more than 3 months old." "We’ll handle all that old stuff with keyword search and going-forward we’ll do it the RIGHT way…" Etc.

اما, what happens if we can’t scope ourselves out of trouble and we’re looking at 10’s of thousands or 100’s of thousands (یا حتی میلیون ها) اسناد — در حال بارگذاری و برچسب زدن که آرزوی مؤمن ما است?

FAST ممکن است پاسخ.

فرایند جستجو FAST شامل بسیاری از قطعات در حال حرکت است، اما یک مشاهده ساده این است:

  • روند خزنده به نظر می رسد برای محتوای.
  • آن را پیدا کرد و آن دست کردن به یک روند کارگزار است که مدیریت یک استخر پردازنده های سند.
  • فرایند کارگزار آن دست کردن به یکی از پردازنده های سند.
  • پردازنده سند تجزیه و تحلیل سند و از طریق یک فرایند خط لوله, تجزیه و تحلیل bejeezus سند و آن دست کردن به یک ایندکس از نوع روند سازنده.

FAST کشتی فضایی, we have a lot of control over the document processing pipeline. We can mix and match about 100 اجزای خط لوله و, جالب, we can write our own components. Like I say, FAST is analyzing documents every which way but Sunday and it compiles a lot of useful information about those documents. Those crazy FAST people are clearly insane and obsessive about document analysis because they have tools and/or strategies to REALLY categorize documents.

پس … با استفاده از FAST در ترکیب با خود جزء خط لوله سفارشی ما, we can grab all that context information from FAST and feed it back to MOSS. It might go something like this:

  • سند به FAST از MOSS تغذیه.
  • عادی دیوانه وسواسی تجزیه سند FAST و طبقه بندی اتفاق می افتد.
  • خود را جزء خط لوله سفارشی ما قطره برخی از این اطلاعات زمینه را به پایگاه داده.
  • فرایند طراحی خود ما اطلاعات متن را می خواند, باعث می شود برخی از تصمیم گیری در مورد چگونگی جا که سند خزه در داخل IA ما و نشانگر آن را با استفاده از یک وب سرویس و مدل شی.

البته, چنین فرآیند خودکار می تواند کامل باشد اما به لطف به وسواس (و مردم FAST احتمالا دیوانه اما در یک خوب راه), ما ممکن است یک جنگ واقعی عالی در یک فرآیند بار جرم واقعا موثر است که می کند بیشتر از فقط پر کردن یک پایگاه داده SQL با یک دسته از اسناد به سختی قابل جستجو.

</پایان>

مشترک شدن در وبلاگ من.

پاسخ

آدرس ایمیل شما منتشر نخواهد شد. بخشهای موردنیاز علامتگذاری شدهاند *