e化整合系列
文件自動分類
-- 擅長處理大量文件的智慧型文件分類專家
產品特色
運用文件自動分類技術,可取代大量人工處理的資料分類作業,大幅改進文件管理的效率。意藍科技延續中文語意處理的獨到技術,擅長處理斷詞斷句、關
鍵詞擷取、新詞學習,分析文件內涵格外準確;再配合分散式網路技術的專長,更能快速處理大量文件資料,經客戶實際上線證明,準確率高達80~90%以上!
產品功能
1.
內容判別與自動分類:
* 中文語意處理技術:
智慧型語意分析技術,非單純關鍵字比對分類,針對文件全文進行用字、用語、詞性、意境分析,準確率極高。支援多種資料來援(網頁、資料庫、檔案)與180
種以上文件格式(MS Office、PDF、HTML等)。
* 支援單一類別判斷及多重分類:
視使用需求設定,可判別是否歸屬某一類別,也可以提供多重分類,將一份文件分類至各相符的類別中。經客戶實際上線證明,準確率高達80~90
%以上。
2. 擴充能力與彈性:
* 支援多國語文、跨平台:
目前支援簡繁中文與英文、即將支援日文;使用100% Java Technology,支援多種平台(NT/95/98、Solaris、FreeBSD、Linux等)。
* 支援可擴充類別:
新增類別模型可直接加入,不需將整個分類模型重新訓練,擴充容易。
* 高處理效能:
採用分散式主從架構,能處理巨量資料,適合文件產量大、內容豐富的企業或網站採用。
3. 搜尋與自動關聯:
* 檢索與瀏覽:
可與全文檢索結合,提供更易使用的分類全文檢索;同時支援分類瀏覽功能,並可即時縮小查詢範圍。
* 自動提示關聯詞及相關文件:
可自動分析出各類別、各文件的熱門關鍵詞,以及熱門文件列表。
4. 專業服務配合:
* 代建分類模型服務:
意藍科技亦提供分類模型(Class Model)代建服務。
* 選購模型:
新聞類別模型:
含政治、財經、娛樂、資訊科技等12大類
網站類別模型:含影視娛樂、網路電腦、交通旅遊、理財財經、醫藥保健等百餘類、 企業通用文件模型、色情類別模型……
|