Saya sudah selesai sehingga hari 2 latihan yang cepat dalam cerah Needham, MA, dan saya saya penuh dengan idea-idea (mana semua latihan baik kelas lakukan untuk saya). Salah satu aspek tertentu cepat membuatkan saya berfikir dan saya ingin tuliskan ia semasa ia masih segar dan normal harian "barangan" ditolak keluar dari kepala saya.
Kami SharePoint WSS 3.0 / Pelaksana MOSS kerap menghadapi masalah sukar dengan mana-mana projek SharePoint bersaiz munasabah: Bagaimanakah kita boleh mendapatkan semua data untagged dimuatkan ke dalam SharePoint sehinggakan ia sesuai dalam senibina maklumat direka sempurna untuk kami?
Selalunya cukup, ini tidak apa-apa masalah yang sukar kerana kita skop diri daripada masalah: "Kita tidak peduli tentang apa-apa lebih daripada 3 bulan yang lama." "Kami akan mengendalikan hal-hal yang lama dengan kata kunci carian dan MARA akan kita akan lakukan dengan cara yang betul…" Dan lain-lain.
Tetapi, apa akan terjadi sekiranya kita tidak skop tata diri daripada masalah dan kami sedang mencari 10 's ribu atau 100 's of beribu Lapangan (atau berjuta-juta) docs — muatan dan tag yang ingin kita taat?
FAST mungkin jawapan yang.
Proses pencarian FAST termasuk banyak bahagian yang bergerak tetapi satu pandangan dipermudahkan adalah ini:
- Proses crawler mencari kandungan.
- Ia mendapati kandungan dan tangan ia pergi ke proses broker yang menguruskan kolam pemproses dokumen.
- Proses Broker tangan ia pergi ke salah satu daripada pemproses dokumen.
- Pemproses dokumen menganalisis dokumen dan melalui satu proses perancangan, menganalisis bejeezus daripada dokumen itu dan tangan di luar untuk pembina indeks proses jenis.
Pada FAST starship, kami mempunyai banyak kawalan ke atas dokumen pemprosesan paip. Kita boleh mencampur dan mencocokkan tentang 100 komponen saluran paip dan, yang paling menarik, kita boleh menulis komponen kita sendiri. Seperti yang saya katakan, Puasa adalah menganalisis dokumen setiap mana cara tetapi Ahad dan ia menyusun banyak maklumat yang berguna tentang dokumen-dokumen tersebut. Orang-orang gila cepat adalah jelas tidak siuman dan kejengkelan tentang analisis dokumen kerana mereka mempunyai alat dan/atau strategi untuk benar-benar mengkategorikan dokumen.
Jadi … menggunakan FAST digabungkan dengan komponen saluran paip adat kita sendiri, kita boleh merebut semua maklumat konteks itu dari puasa dan memberi makan kembali ke Lumut. Ia mungkin pergi sesuatu seperti ini:
- Dokumen dimasukkan ke FAST dari MOSS.
- Normal gila-keterlaluan parsing dokumen FAST dan kategori yang berlaku.
- Komponen saluran paip sendiri adat kami turun beberapa maklumat konteks pergi ke pangkalan data.
- Proses reka bentuk kita sendiri membaca maklumat konteks, membuat beberapa keputusan mengenai bagaimana untuk menyesuaikan bahawa dokumen MOSS dalam IA kami dan menandakan ia menggunakan perkhidmatan web dan model objek.
Kursus, tiada proses automatik seperti boleh menjadi sempurna tetapi terima kasih kepada keterlaluan (dan orang-orang FAST mungkin gila-tetapi-in-a-baik-cara), kita mungkin mempunyai pertempuran sebenar ditembak di massa beban proses benar-benar berkesan yang tidak lebih daripada sekadar mengisi pangkalan data SQL dengan sekumpulan dokumen yang hampir-dicari.
</akhir>