Я закончил вверх день 2 БЫСТРОГО обучения в Солнечный Нидхэм, МА, и я разрыва с идеями (какие все хорошие учебные классы сделать для меня). Один конкретный аспект быстро имеет меня мышление, и я хотел написать его, пока он был еще свежие и нормальной повседневной «вещи" толкаемых его из моей головы.
Мы SharePoint WSS 3.0 / Мосс исполнители часто сталкиваются с жесткой проблемой с любым проектом, разумно размера SharePoint: Как мы получим все без тегов загруженных данных в SharePoint таким образом, чтобы все это вписывается в наши прекрасно разработан информационной архитектуры?
Достаточно часто, Это не такой жесткий проблемой, потому что мы область себя от неприятностей: "Мы не заботимся о чем-нибудь более чем 3 месяцев." «Мы будем обрабатывать все, что старые вещи с поиска по ключевым словам и идя вперед мы будем делать это правильно…" И т.д..
Но, что произойдет, если мы не можем область себя от неприятностей, и мы смотрим на 100 из тысячи или десятки тысяч (или даже миллионы) документов — Загрузка и пометки из которых является набожным пожелание?
БЫСТРО могут быть ответом.
Процесс поиска быстро включает в себя много движущихся частей, но это одно упрощенное представление:
- Гусеничные процесс выполняет поиск контента.
- Он находит содержание и передает его в процесс брокера, который управляет пулом документа процессоров.
- Брокер процесс передает его покинуть один из процессоров документа.
- Документ процессора анализирует этот документ и через процесс трубопровода, анализирует bejeezus из документа и передает его к процессу типа построитель индекса.
На Звездолет быстро, у нас есть много контроля над конвейером обработки документа. Мы можем смешивать и сочетать о 100 компоненты процесса продаж и, наиболее интересно, Мы можем написать собственные компоненты. Как я говорю, БЫСТРО анализирует документы годичными, но воскресенье и он компилирует много полезной информации об этих документах. Эти сумасшедшие люди быстро явно безумным и навязчивых о анализа документов, потому что они имеют инструменты и стратегии для действительно классификации документов.
Таким образом … использование быстро в сочетании с нашей собственной пользовательские конвейер компонент, Мы можем захватить всю эту информацию контекста от быстрого и кормить его обратно в Мосс. Он может идти-то вроде этого:
- Документ подается в быстро от Мосс.
- Обычный документ быстро crazy обсессивно синтаксического анализа и классификации происходит.
- Наши собственные пользовательские конвейер компонент удаляет некоторые из этого контекста информацию покинуть в базе данных.
- Процесс нашей собственной дизайн читает информацию контекста, делает некоторые решения о том, как этот документ Мосс в рамках нашей IA и отмечает его с помощью веб-службы и объектная модель.
Конечно, нет такого автоматизированный процесс может быть совершенным, но благодаря обсессивно (и возможно insane-but-in-a-good-way быстро людей), у нас есть реальная борьба выстрел на процесс подлинно эффективной массовой загрузки, который больше, чем просто заполнить вверх в базу данных SQL с кучей едва для поиска документов.
</конец>