公司介紹
“大數據成就大事業”( Big Data is a Big Deal)
靈玖軟體大數據搜尋與挖掘技術已經套用於全球二十餘萬家機構,包括國家統計局、中國證監會、中國郵政集團、國家氣象局、國家新聞辦公室、最高人民法院等國家單位,中國上市公司協會、中國對外承包工程商會、北京市園林局、解放軍某部等事業與機關,以及海航集團、上海電信、中國網、富基融通eFuture、四維圖新、締元信等大中型企業。
靈玖軟體作為大數據搜尋挖掘技術創新的領導者,擁有國家知識產權局頒發的著作權十餘項,是國家高新技術企業,並通過了ISO9001:2008 GB/T 19001-2008質量體系認證、北京市雙軟認證(編號為京R2010-0240),中關村高新技術企業,中國軟體行業協會會員。2011入選中小企業創新基金計畫(編號為11Z075);靈玖團隊入選浙江舟山“千人計畫”;靈玖軟體先後獲得了河北省科技支撐計畫、新疆自治區科技支撐計畫等科研攻關項目。
靈玖軟體與中國科學院、北京理工大學與新疆大學等知名科研機構建有聯合科研開發基地,匯聚了國際管理專才與技術專家,靈玖軟體高管胡博士為美籍華裔,是享譽海內外的工商管理與金融學專家,擔任美聯儲高級金融專家,是美國中央銀行的第一位華裔專家,在長江商學院擔任兼職教授。靈玖軟體大數據挖掘總監於博士來自中國科學院,有著10餘年大數據研究與開發經歷,主持開發的大數據採集挖掘系統廣泛地套用於公安部、中國移動與中國證監會等單位;大數據搜尋處理技術總監劉博士畢業於美國芝加哥大學,曾在全球TREC文本檢索大賽等多項比賽中折冠;並聯合培訓養了維哈柯等多民族語言處理方面的博士;大數據自然語言處理技術總監許博士畢業於日本北海道大學,曾在日本NEC等多家企業任職十餘年,研製的中日機器翻譯以及語音識別技術已經投入運營多年。
企業文化
從零到九,從無到有,從平凡到卓越,零缺陷,所以永久。
公司定位
定位為大數據搜尋挖掘技術服務商,提供大數據搜尋、大數據挖掘與大數據管理解決方案,成為大數據時代技術與服務的創新引領者。
公司產品
大數據搜尋引擎
JZSearch大數據搜尋引擎是靈玖軟體聯合中科院與北理工的信息檢索專家,針對大數據搜尋業務需求而打造的一套搜尋引擎,具有專業精準、高擴展性和高通用性的特點。可支持文本、數字、日期、字元串等各種數據類型的高效索引,支持鄰近搜尋、負面搜尋、語義關聯搜尋,可提供各類資料庫的實時搜尋服務,並支持少數民族語言。已經套用於中國郵政搜尋引擎、河北省標準搜尋引擎、富基融通(納斯達克上市公司:EFUT)商品搜尋以及新疆維文搜尋引擎。
區域網路文檔搜尋
EKG區域網路文檔搜尋引擎系統是一款針對政府、企業或機構區域網路內部文檔管理、搜尋與挖掘的軟體產品。隨著信息化的高速發展,社會各界、政府及企業中的電子文檔(word、excel、ppt、txt、 pdf 等)也變得越來越。大量政府和企事業單位的文檔是包含著客戶關係、產品信息、市場情報、策劃思想等軟資產的載體。文檔作為一種信息資源,作為企業生產、技 術、科研和經營等活動的真實記錄和一項基礎性工作,同時作為與企業同步發展的無形資產,在企業管理等各方面正積極地發揮應有的重要作用。 政府/企事業單位的電子文檔日益增多,文檔格式的多樣化、文檔內容分散存儲於各個不同的電腦上等問題,文檔的管理存在三大隱患:
1、文檔總量大,單篇文檔的篇幅較長,檢索與管理的效率極其低下
2、文檔分散存儲,共享困難,協同工作往往靠上級或者個人協調
3、分散存儲,缺乏必要的安全保障措施,安全隱患極大
漢語智慧型分詞
漢語詞法分析中間件能對漢語語言進行拆分處理,是中文信息處理必備的核心部件。靈玖綜合了各家所長,採用條件隨機場(Conditional Random Field,簡稱CRF)模型,分詞準確率接近99%,具備準確率高、速度快、可適應性強等優勢;特色功能包括:切分粒度可調整,融合20餘部行業專有詞典,支持用戶自定義詞典等。
詞性標註能對漢語語言進行詞性的自動標註,它能夠真正理解中文,自動根據語言環境將詞語諸如“建設”標註為“名詞”或“動詞”。靈玖採用條件隨機場(Conditional Random Field,簡稱CRF)模型,一級詞性標註準確率接近99%,具備準確率高、速度快、可適應性強等優勢。
人名地名機構名識別能夠自動挖掘出隱含在漢語中的人名、地名、機構名,所提煉出的詞語不需要在詞典庫中事先存在,是對語言規律的深入理解和預測。採用條件隨機場(Conditional Random Field,簡稱CRF)模型,識別準確率達到97%,速度達到10M/s,可在此基礎上搭建各種多樣化的統計和套用。
關鍵字提取
文章關鍵字提取中間件能夠在全面把握文章的中心思想的基礎上,提取出若干個代表文章語義內容的辭彙或短語,相關結果可用於精化閱讀、語義查詢和快速匹配等。
採用基於語義的統計語言模型,所處理的文檔不受行業領域限制,且能夠識別出最新出現的新詞語,所輸出的詞語可以配以權重。
文章關鍵字提取組件的主要特色在於:
1、速度快:可以處理海量規模的網路文本數據,平均每小時處理至少50萬篇文檔;
2、處理精準:Top N的分析結果往往能反映出該篇文章的主幹特徵;
3、精準排序:關鍵字按照影響權重排序,可以輸出權重值;
4、開放式接口:文章關鍵字提取組件作為LJParser的一部分,採用靈活的開發接口,可以方便地融入到用戶的業務系統中,可以支持各種作業系統,各類調用語言。