Aku sudah selesai hari 2 CEPAT pelatihan di Needham cerah, MA, dan aku meledak dengan ide-ide (mana semua pelatihan yang baik kelas lakukan untuk saya). Salah satu aspek khusus dari cepat telah saya berpikir dan aku ingin untuk menuliskannya sementara itu masih segar dan normal sehari-hari "barang" didorong keluar dari kepala saya.
Kami SharePoint WSS 3.0 / MOSS pelaksana sering menghadapi masalah sulit dengan setiap proyek SharePoint berukuran cukup: Bagaimana kita mendapatkan semua data ditandai dimuat ke SharePoint sedemikian rupa sehingga semua cocok dalam arsitektur informasi yang dirancang sempurna kami?
Cukup sering, ini bukan masalah seperti sulit karena kita lingkup diri masalah: "Kami tidak peduli tentang apa-apa lebih dari 3 bulan." "Kami akan menangani barang semua yang lama dengan pencarian kata kunci dan pergi ke depan kami akan melakukannya dengan cara yang benar…" Dll.
Tapi, apa yang terjadi jika kita tidak bisa scope diri dari masalah dan kita sedang melihat 10 ribu 's atau 100 ribu (atau bahkan jutaan) docs — pemuatan dan penandaan yang adalah keinginan kami taat?
CEPAT mungkin jawabannya.
Proses pencarian cepat di mencakup banyak bagian yang bergerak tetapi satu pandangan yang disederhanakan ini:
- Proses crawler yang terlihat untuk konten.
- Itu menemukan konten dan tangan itu ke proses broker yang mengelola sebuah kolam dokumen prosesor.
- Broker proses tangan itu ke salah satu dokumen prosesor.
- Prosesor dokumen menganalisa dokumen dan melalui proses pipa, menganalisis bejeezus dari dokumen dan tangan itu ke indeks pembangun jenis proses.
Pada kapal cepat, Kami memiliki banyak kontrol atas dokumen pengolahan pipa. Kita dapat mencampur dan mencocokkan tentang 100 Pipa komponen dan, paling menarik, kita dapat menulis kami sendiri komponen. Seperti saya katakan, CEPAT adalah menganalisis dokumen segala arah tetapi hari Minggu dan mengkompilasi banyak informasi yang berguna tentang dokumen-dokumen. Orang-orang cepat gila jelas gila dan obsesif tentang dokumen analisis karena mereka memiliki alat-alat dan/atau strategi untuk benar-benar mengkategorikan dokumen.
Jadi … menggunakan cepat dalam kombinasi dengan kita sendiri kustom pipa komponen, kita bisa ambil semua informasi konteks yang dari cepat dan pakan kembali ke MOSS. Itu mungkin pergi sesuatu seperti ini:
- Dokumen dimasukkan ke cepat dari Lumut.
- Parsing normal gila-obsesif cepat dokumen dan kategorisasi terjadi.
- Kita sendiri kustom pipa komponen tetes beberapa konteks informasi off ke database.
- Proses desain kami sendiri membaca informasi konteks, membuat beberapa keputusan tentang bagaimana menyesuaikan MOSS dokumen dalam IA kami dan menandai menggunakan layanan web dan object model.
Tentu saja, tidak ada proses otomatis dapat menjadi sempurna tetapi berkat obsesif (dan orang-orang cepat mungkin insane-but-in-a-good-way), kita mungkin memiliki real pertempuran menembak beban massa yang benar-benar efektif proses yang lebih dari sekedar mengisi database SQL dengan sekelompok dokumen-dokumen hampir tidak dapat dicari.
</akhir>