簡介
OutWitHub是一款用於信息收集和信息管理的軟體,由OutWitTechnologies公司研發而成。OutWitHub使用範圍很廣,可以用於網路數據抓取整理的研究課題,商務網站的線上數據抓取,或者輔助SEO分析。OutWit Hub大多功能都是免費的,能夠深入分析網站,自動收集整理組織網際網路中的各項數據,並將網站信息分割開來,然後提取有效信息,形成可用的集合。但是要自動提取精確數據就需要付費版本了,同時免費版一次提取的數據量也是有限制的,如果需要大批量的操作,可以選擇購買專業版。
版本
OutWitHub目前的版本號為2.1.4.22,可以在windows、macosx、linux等多個平台上使用,OutWitHub擁有一個firefox的附加組件,能夠在firefox4.0到15.0的不同版本中使用。包括以下版本:
StandaloneapplicationforWindows(installer)
StandaloneapplicationforWindows(zip)
StandaloneapplicationforMacOSX(Intel32bits)
StandaloneapplicationforMacOSX(Intel64bits)
StandaloneapplicationforLinux(32bits)
StandaloneapplicationforLinux(64bits)
ExtensionforMozillaFirefox(allplatforms)
軟體界面
OutWit Hub的界面非常直觀和簡潔,但能識別複雜的網頁數據結構,能夠解決各種網頁數據收集的需求。操作中無需掌握任何編程技術或者高端IT知識,用戶可以從一系列頁面中提取出頁面原始碼的文字、連結、圖像、電子郵件地址、RSS新聞、數據表等,也可以通過簡單的設定提取條件,將自己所需要的數據進行提取。提取出的數據會以數據表格的形式重新呈現,這些數據也可以直接導出到CSV,HTML,Excel或者SQL資料庫中,而圖像等檔案會直接保存到本地硬碟。
功能
OutWitHub被廣大seoer用於搜尋引擎的數據採集,具體操作如下:
第一步,打開GOOGLE或百度,輸入你要的內容;
第二步,點擊瀏覽器輸入框左邊的按鈕,打開主程式可以看到相關的功能,包括連結項,圖片,EMAIL,文本還有不同方式的排序等;
第三步,可以由軟體自動來採集識別,點擊GUESS可以自動把連結和標題分開;
第四步,手工分割scrapers,設定輸入需要顯示的內容規則;
第五步,輸入規則完後保存點EXECUTE,回到DATA下的SCRAPED將顯示你要的內容了;
第六步,查詢到內容後要把它導出來方便統計與分析;
第七步,然後全選內容,點周最上面的檔案導出檔案為EXCEL,CSV,HTML或者SQL形式;最後導出的內容就是你要查詢與採集的內容了。