前一段時間引起舉國嘩然的魏澤西事件將國內搜索引擎龍頭百度推上了風口浪尖,輿論的強大壓力迫使百度公司不得不在競價排名這一領域做出調整。那么從技術這一塊來看,未來的搜索引擎的發展將如何發展呢?中培偉業《大數據分析及可視化技術應用實戰》培訓專家謝老師指出,web搜索引擎能為用戶提供一種查找所需資源的服務,已經成為互聯網上僅次于電子郵件的第二大服務,其對數據挖掘的發展具有重要影響。最后,謝老師預測了搜索引擎的發展方向。
搜索引擎是人們在信息海洋中漫游時的導航。它濫觴于某些軟件為方便用戶而設立的查找功能,經歷了從單機版到網絡版、從通用型向專門型、從人工型到智能型的發展,目前已經成為互聯網上最受歡迎的服務之一。搜索引擎以一定的策略在互朕網中搜集、發現信息,對其進行理解、提取、組織和處理,并為用戶提供檢索服務,從而起到信息導航的目的。
智能型搜索引擎將整個互聯網作為一個整體的、超大型的、動態的數據庫處理。智能型搜索引擎主要實現5大功能:搜索請求提交、調度策略生成、搜索引擎調度管理、搜索接口代理轉化和搜索結果處理反饋功能。其中,搜索請求提交和搜索結果處理反饋功能組成用戶接口部件,其它各功能分別由調度策略生成器、搜索引擎管理器、搜索引擎代理器4大模塊組成。
(1)用戶接口部件:用戶接口部件是系統的用戶界面,負責接收用戶請求,并將用戶對系統界面的操作轉換為系統標準請求。
(2)搜索引擎管理器:搜索引擎管理器根據包含用戶請求主題、地域情況的系統標準搜索請求,向數據挖掘管理器請求本次搜索引擎代理選擇策略。
(3)搜索引擎代理管理器:搜索引擎代理管理器是若干搜索引擎代理的綜合。它把接收到的連接請求轉化為相應搜索引擎調用的本地化連接請求,激活相關引擎工作。
(4)數據挖掘管理器:數據挖掘管理器是體現系統智能化的主要模塊。它負責實現搜索引擎知識庫的預處理功能,建立搜索引擎調用策略。對搜索引擎管理器發送的本次搜索記錄進行統計整理,根據數據挖掘的具體算法修改下一次的搜索引擎調用策略。