катэгорыя Архівы: Пошук SharePoint

Настройка Тэзаўрус ў MOSS

Я працую над дакументам агляд архітэктуры гэтым тыдні, і гэта мяркуе,, між іншым, that the client consider using the thesaurus to help improve the end user search experience. Having never done this myself, I wanted to do a quick hands-on test so that my suggestion is authentic.

Гэта было дзіўна цяжка зразумець, як гэта зрабіць, хоць гэта, на самай справе, quite easy. There’s a pretty good bit of information on the thesaurus (праверка тут і тут, напрыклад). Аднак, гэтыя дакументы з'яўляюцца альбо WSS 2.0 / SPS 2003 oriented or they don’t actually spell out what do to after you’ve made your changes in the thesaurus. They provide a great overview and fair bit of detail, але гэта не дастаткова, каб перасекчы лінію фінішу.

Гэтыя крокі працаваў для мяне:

  1. Make the changes to the thesaurus. (Гл. ніжэй важная заўвага)
  2. Go to the server and restart the "Office SharePoint Server Search" абслугоўванне.

Кончык капялюшы Г-н. J. Рэ. Прабірацца (Bio). He provided the key bit about restarting the search service and rescued me from endless, time consuming and unnecessary iisresets and full index crawls. This episode даказвае, яшчэ раз, што Twitter is the awesome. (Выконвайце за мной на Twitter тут. I follow any SharePoint person that follows me).

I don’t know if this functionality is available in WSS. If it is or is not, калі ласка, пакіньце каментар або напішыце мне, і я буду абнаўляць гэты пост.

Важнае заўвага: There’s conflicting information on which XML thesaurus file to change. There’s this notion of "tsneu.xml" as being the "neutral" тэзаўрус. I wasted some time working with that one. У маім выпадку, I needed to change the "tsenu.xml" файл знаходзіцца ў тэчцы ідэнтыфікатара само прыкладанне: \\win2003srv C $ Program Files Microsoft Office Servers 12.0 Data Office Server Applications 3c4d509a-75c5-481C-8bfd-099a89554e17\Config. I assume that in a multi-farm situation, Вы зрабілі б гэта змена ўсюды запыту сервер працуе.

</канец>

Падпісацца на мой блог.

SharePoint і хуткай — Рыз арахісавае масла кубкі карпаратыўных прыкладанняў?

Я скончыў дзень 2 з хуткага навучання ў сонечным Needham, Масачусэтс, і я распірала ад ідэй (якія ўсе добрыя навучальныя класы са мной зрабіць). One particular aspect of FAST has me thinking and I wanted to write it down while it was still fresh and normal day-to-day "stuff" штурхнуў яе з маёй галавы.

Мы SharePoint WSS 3.0 / MOSS выканаўцы часта сутыкаюцца з жорсткім праблема з любым разумных памераў праекта SharePoint: Як мы можам атрымаць усе немаркіраванай дадзеныя, загружаныя ў SharePoint так, што ўсё гэта ўпісваецца ў нашу ідэальна падыходзяць інфармацыйнай архітэктуры?

Досыць часта, гэта не такая складаная праблема, таму што мы сябе сферу далей ад непрыемнасцяў: "We don’t care about anything more than 3 months old." "We’ll handle all that old stuff with keyword search and going-forward we’ll do it the RIGHT way…" Etc.

Але, what happens if we can’t scope ourselves out of trouble and we’re looking at 10’s of thousands or 100’s of thousands (або нават мільёны) з дакументаў — загрузка і маркіроўку, якая з'яўляецца нашым запаветнай марай?

ХУТЧЭЙ можа быць адказам.

Працэс пошуку ХУТКА ўключае ў сябе шмат якія рухаюцца частак, але адна спрошчаным выглядзе гэта:

  • Працэс гусенічным шукае зместу.
  • Ён знаходзіць змест і перадае яго да брокеру працэс, які кіруе пулам дакумента працэсараў.
  • Брокер працэс перадае яго ў адзін з працэсараў дакумент.
  • Дакумент працэсар аналізуе дакумент і па трубаправодзе працэсу, аналізуе bejeezus з дакумента і перадае яго ў тып Process Builder індэкс.

На зоркалёце ХУТКА, we have a lot of control over the document processing pipeline. We can mix and match about 100 Трубаправоды і кампаненты, што самае цікавае, we can write our own components. Like I say, FAST is analyzing documents every which way but Sunday and it compiles a lot of useful information about those documents. Those crazy FAST people are clearly insane and obsessive about document analysis because they have tools and/or strategies to REALLY categorize documents.

Так … Функцыя хуткага пераходу ў спалучэнні з нашымі ўласнымі карыстацкіх кампанентаў трубаправода, we can grab all that context information from FAST and feed it back to MOSS. It might go something like this:

  • Дакумент падаецца ў хутка ад MOSS.
  • Нармальны вар'ят обсессивно-ХУТКА разбор дакумента і катэгарызацыі адбываецца.
  • Нашы ўласныя кампаненты трубаправода падае некаторыя з кантэксту, што інфармацыю з да базы дадзеных.
  • Працэс нашага ўласнага дызайну чытае кантэкстнай інфармацыі, робіць некаторыя рашэнні аб тым, каб адпавядаць, што MOSS дакумента ў нашым IA і адзначае яго з дапамогай вэб-службаў і аб'ектная мадэль.

Вядома, няма такой аўтаматызаваны працэс не можа быць дасканалым, але дзякуючы дакучлівай (і, магчыма, вар'яцкія, але-в-добрым-шлях хутка людзі), у нас можа быць рэальнага бою стралялі па-сапраўднаму эфектыўнага працэсу маса грузу, што робіць больш, чым проста запоўніць базу дадзеных SQL з кучай ледзь пошуку дакументаў.

</канец>

Падпісацца на мой блог.

Гранавітая Ситтера Плот Пошук No More

У мяне была прычына сёння папрацаваць з CodePlex гранёны пошук project today.

Гэта было прыкладна ў той час, але я не вырашалася спампаваць і выкарыстоўваць па звычайных прычынах (галоўным чынам недахопам часу), plus outright fear 🙂

Калі вы хочаце палепшыць свой пошук і вывучэнне новых варыянтаў, download it and install it when you have an hour or so of free time. I followed the installation manual’s instructions and it took me less than 20 minutes to have it installed and working. It provides value minute zero.

It does look pretty hard to extend. The authors provide a detailed walk-through for a complex BDC scenario. I may be missing it, but I wish they would also provide a simpler scenario involving one of the pre-existing properties or maybe adding one new managed property. I shall try and write that up myself in the next period of time.

Вынік — ў хвілінах, Вы можаце ўсталяваць, наладзіць яго, use it and add some pretty cool functionality to your vanilla MOSS search and be a hero 🙂

</канец>

Падпісацца на мой блог.

Technorati Тэгі:

SharePoint Пошук па шаблоне: “Прафесійны” Ці не Ствалавыя “Праграмаванне”

На форуме Пошук MSDN, людзі часта пытаюцца пытанне, як гэта:

"I have a document named ‘Programming Guide’ but when I search for ‘Pro’ пошук не знаходзіць яго."

Яно не можа адчуваць, што гэта, but that amounts to a wildcard search. The MOSS/WSS user interface does not support wildcard search out of the box.

Калі капнуць у частцы вэб-пошуку, Вы знойдзеце сцяжок, "Enable search term stemming". Stemming is a human-language term. It’s not a computer language substring() Тып функцыі.

Вось некаторыя сцяблы:

  • "fish" is a stem to "fishing"
  • "major" is a stem to "majoring"

Гэта не звязана:

  • "maj" is not a stem to "major"
  • "pro" is not a stem to "programmer"

The WSS/MOSS search engine does support wild card search through the API. Here is one blog article that describes how to do that: http://www.dotnetmafia.com/blogs/dotnettipoftheday/archive/2008/03/06/how-to-use-the-moss-enterprise-search-fulltextsqlquery-class.aspx

3. Ўдзельнік прадукт, Ontolica, provides wild card search. I have not used that product.

</канец>

Падпісацца на мой блог.

Technorati Тэгі: