ฉันเสร็จวัน 2 การฝึกอย่างรวดเร็วใน Needham ซันนี่, MA, และฉันเป็นชีวิตชีวา ด้วยความคิด (ซึ่งทั้งหมดฝึกอบรมดีสอนทำผม). ด้านเฉพาะหนึ่งอย่างรวดเร็วมีฉันคิด และอยากจะจดไว้ขณะยังสด และปกติประจำวัน "สิ่ง" ผลักออกจากหัวของฉัน.
เรา SharePoint WSS 3.0 / มอสสำหรับตัวใช้งานบ่อย ๆ เผชิญปัญหาโครงการ SharePoint มีขนาดค่อนข้างยาก: เราได้รับข้อมูล untagged ทั้งหมดที่โหลดใน SharePoint ที่มันใส่สถาปัตยกรรมข้อมูลออกอย่างสมบูรณ์แบบของเราได้อย่างไร?
บ่อยพอ, นี้ไม่ใช่ปัญหาหนัก เพราะเราขอบเขตตัวเองออกจากปัญหา: "เราไม่สนใจอะไรมากกว่า 3 เดือนเก่า" "เราจะจัดการกับสิ่งเก่าที่สำคัญการค้นหา และส่งต่อไปเราจะทำได้…" ฯลฯ.
แต่, เกิดอะไรขึ้นถ้าเราไม่ขอบเขตตัวเองออกจากปัญหา และเรากำลังมองหาที่ 10's พันหรือ 100's พัน (หรือแม้แต่นับล้าน) ของเอกสาร — โหลด และ ระบุป้ายซึ่งเป็นปรารถนาของเรา?
รวดเร็วอาจจะเป็นคำตอบ.
กระบวนการค้นหาอย่างรวดเร็วของมีจำนวนมากเคลื่อน แต่ดูง่ายหนึ่งนี่:
- กระบวนการ crawler การค้นหาเนื้อหา.
- ค้นหาเนื้อหา และมือออกจากการเป็นนายหน้ากระบวนการจัดการกลุ่มของตัวประมวลผลเอกสาร.
- กระบวนการนายหน้ามือก็ปิดของตัวประมวลผลเอกสาร.
- ตัวประมวลผลเอกสารวิเคราะห์เอกสารและ ผ่านขั้นตอนกระบวนการ, bejeezus จากเอกสารวิเคราะห์ และมือออกไปกระบวนการชนิดสร้างดัชนี.
บนยานอวกาศทั้งรวดเร็ว, เรามีการควบคุมขั้นตอนการประมวลผลเอกสาร. เราสามารถผสม และจับคู่เกี่ยวกับ 100 ไปป์ไลน์ประกอบ และ, เรื่องน่าสนใจมากที่สุด, เราสามารถเขียนองค์ประกอบของเราเอง. เหมือนที่ฉันพูด, อย่างรวดเร็วกำลังวิเคราะห์เอกสารทุกวิธีการ แต่วันอาทิตย์ และก็คอมไพล์จำนวนมากของข้อมูลที่เป็นประโยชน์เกี่ยวกับเอกสารเหล่านั้น. คนบ้าอย่างรวดเร็วเป็นบ้า และ obsessive เกี่ยวกับเอกสารวิเคราะห์ชัดเจนเนื่องจากมีเครื่องมือหรือกลยุทธ์ในการจัดประเภทเอกสารจริง ๆ.
ดังนั้น … ใช้ได้อย่างรวดเร็วกับไปป์ของเราเอง, เราสามารถหยิบข้อมูลบริบททั้งหมดจากอย่างรวดเร็ว และดึงกลับไปมอ. มันจะไปอะไรเช่นนี้:
- เอกสารถูกป้อนลงอย่างรวดเร็วจากมอส.
- แยกวิเคราะห์เอกสารปกติบ้า obsessive อย่างรวดเร็วและประเภทที่เกิดขึ้น.
- ส่วนประกอบไปป์ไลน์ที่กำหนดเองของเราเองหยดบางข้อมูลบริบทที่ออกไปยังฐานข้อมูล.
- กระบวนการของการออกแบบของเราเองอ่านข้อมูลบริบท, ทำให้ตัดสินใจบางอย่างเกี่ยวกับวิธีการที่เอกสารมอสส์ใน IA ของเราพอดี และทำเครื่องหมายนั้นขึ้นใช้บริการบนเว็บและแบบวัตถุ.
แน่นอน, กระบวนการดังกล่าวไม่อัตโนมัติสามารถสมบูรณ์แบบ แต่ ด้วยการ obsessive (และประชาชนอาจจะ insane-but-in-a-good-way อย่างรวดเร็ว), เราอาจมีจริงต่อสู้ยิงที่กระบวนการผลิตโดยรวมมีประสิทธิภาพอย่างแท้จริงที่กรอกฐานข้อมูล SQL มีพวงของเอกสารแทบยากมากกว่า.
</สิ้นสุด>