He acabat el dia 2 de ràpida formació de Needham assolellat, MA, i estic ple d'idees (fer que totes les bones classes d'entrenament per a mi). Un aspecte particular de pressa em té pensant i volia escriure mentre era encara fresc i normal del dia a dia "coses" empès això del meu cap.
Ens SharePoint WSS 3.0 / Executors de molsa freqüentment encarar amb un problema difícil amb qualsevol projecte de SharePoint raonablement mida: Com podem obtenir totes les dades sense etiquetar carregats a SharePoint tal que tot encaixa dins de la nostra arquitectura de la informació perfectament dissenyat?
Amb prou freqüència, això no és un problema difícil perquè nosaltres mateixos abast fora de problemes: "No ens preocupem per res més que 3 mesos d'edat." "Ens en encarreguem coses de tot el que sempre amb cerca per paraula clau i anant endavant ho farem el camí correcte…" Etc..
Però, Què passa si nosaltres no abast-nos fora de problemes i estem buscant a 10 de milers o al 100 de milers (o fins i tot milions) de documents de — la càrrega i Etiquetatge del qual és el nostre desig de devot?
RÀPID podria ser la resposta.
Procés de cerca de ràpid inclou un munt de parts que es mouen, però una visió simplificada és la següent:
- Un procés de rastrejador busca contingut.
- Es troba el contingut i les mans fora a un procés de corredor que gestiona una piscina de processadors de document.
- Procés de corredor és les mans fora a un dels processadors de document.
- El processador de document analitza el document i mitjançant un procés de canonada, analitza la bejeezus del document i les mans fora d'un procés de tipus de constructor d'índex.
En la nau ràpid, tenim un munt de control sobre el document de processament de canonades. Podem barrejar i lligar amb sobre 100 components de canonades i, més interessantment, podem escriure components de la nostra pròpia. Com vaig dir, RÀPID és analitzar documents de totes direccions però diumenge i recull una gran quantitat d'informació útil sobre els documents. Són aquestes persones ràpids boig clarament boig i obsessiu sobre l'anàlisi del document perquè tenen eines i/o estratègies realment classificar documents de.
Així … utilitzant ràpid en combinació amb la nostra pròpia component personalitzat canonada, podem agafar tota aquella informació de context de ràpid i alimentar-lo altra vegada a la molsa. Es podria anar alguna cosa com això:
- Document s'alimenta en ràpid de molsa.
- Normal bojos obsessiu document ràpid analitzar i categorització passa.
- Nostra pròpia component personalitzat canonada cau alguns d'aquella informació de context fora a una base de dades.
- Un procés de producció pròpia llegeix la informació de context, fa algunes decisions sobre com encaixar aquest document molsa dins nostre IA i marca utilitzant un servei web i el model d'objecte.
Clar, cap tal procés automatitzat pot ser perfecte, però gràcies a l'orientalisme (i la gent possiblement insane-but-in-a-good-way ràpid), podem tenir una veritable lluita disparat a un procés de càrrega massa veritablement eficaç que alguna cosa més que omplir una base de dades SQL amb un grapat de documents amb prou feines searchable.
</final>