產品介紹
阿里雲開放搜尋服務OpenSearch (簡稱OpenSearch )基於阿里巴巴自主研發的大規模分散式搜尋引擎平台(該平台承載了阿里集團所有主要搜尋業務)搭建而成。其主要為解決用戶結構化數據搜尋需求的託管服務,支持數據結構、搜尋排序、數據處理自由定製。 開放搜尋服務主要為的網站或應用程式提供簡單、低成本、穩定、高效的搜尋解決方案。
產品優勢
1、文檔索引結構定製,以及自由修改
將搜尋引擎複雜的索引結構概念簡單化、可視化和自助定製化。開發者可以通過控制台創建搜尋套用,定製文檔欄位的結構和屬性,包括欄位名稱、類型、分詞方式、搜尋屬性等。搜尋套用在運行過程中可以自由修改,滿足了產品快速變化的需求,極大縮短了需求變更到上線的過程。
2、主流阿里雲存儲產品的自動對接,數據自動同步更新
開發者只需要在控制台中授權,數據就可以自動同步至OpenSearch中,後續數據的更新也可以自動實時同步。
3、多表數據推送,及欄位文本處理和轉換
類似於資料庫,每個搜尋套用可以創建一張或者多張表,每張表的欄位上可以內置數據處理外掛程式,對欄位內容做文本處理和轉換,例如拼音轉換、HTML標籤剔除、JSON數據解析等,多個表會Join在一起實現聯合查詢。
4、兩輪相關性排序定製,簡單靈活加速產品效果最佳化疊代
索結果相關性排序是影響用戶體驗最關鍵的一環,OpenSearch支持開發者定製兩輪相關性排序規則來準確控制搜尋結果的排序。第一輪為粗排,從命中的文檔集合裏海選出相關文檔。第二輪為精排,對粗排的結果做更精細篩選,支持任意複雜的表達式和語法。方便開發者能更準確控制排序效果,最佳化系統性能,提高搜尋回響速度。
發展歷程
開放搜尋團隊為阿里集團內部上百個產品和套用提供搜尋服務
2014年7月
•在阿里雲上雲發布,開始對外公測
2014年9月
•ODPS源自動對接OpenSearch上線;
•in_polygon、in_query_polygon等新外掛程式function發布,為O2O用戶提供更優質的搜尋效果體驗;
•API/SDK推送文檔用戶指定時間戳保序功能發布,方便多執行緒用戶更好的控制文檔更新流程
2014年10月
•分區域部署上線,支持杭州區域;
•JAVA SDK V2.1.1發布:最佳化調試信息列印、增加逾時時間設定、gzip方式支持、最大連線數設定、開放rerake_size參數等;
•PHP SDK V2.0.4發布:取消默認時區、最佳化調試信息列印、增加逾時時間設定、開放rerank_size參數等;
•配額預警功能上線,文檔即將超配額自動郵件通知,提醒用戶及時修正
2014年11月
•實時引擎發布,數據處理時效性(從數據推送到系統到能檢索到)達到10+秒級別;
•創建、修改套用結構流程最佳化:去掉多值欄位,改為新增ARRAY類型,更方便用戶理解;去掉可聚合類型,引擎對於可聚合與可過濾處理邏輯相同,勾選可過濾即可支持原可聚合的功能。
2014年12月
•附表數據自動更新功能發布,無需用戶手動觸發主表即可生效
2015年1月正式對外開放搜尋服務
•錯誤碼最佳化,方便用戶排查問題;
•RDS數據源自動對接OpenSearch發布,支持杭州區域mysql5.5、mysql5.6的自動數據同步;
•套用結構流程最佳化,數據源及索引重建功能拆分,最佳化用戶導入數據體驗
2015年2月
•QP一期重磅發布,新增提供公共詞典的糾錯、停用詞、詞權重等查詢分析功能,可以讓用戶更好的干預搜尋結果,以獲得更好的搜尋體驗;
•ODPS支持分區等功能,方便用戶做全量數據版本控制
2015年3月
•北京機房上線,支持北京區域;
•新增多粒度MWS_TEXT及用戶自定義NWS_TEXT分詞欄位類型,提供更強大的分詞功能,提高召回率。
•query子句新增query boost功能,允許用戶指定查詢詞權重,新增exact_match_boost、first_phase_score函式,二者配合使用,可以更好的控制排序效果。