1 簡介
傳統圖片驗證碼一般是由程式自動扭曲字元生成,因為圖片內容比較單一、混淆算法有限,容易被窮舉破解,而且用戶體驗較差。
而火柴手寫碼,是將海量手寫圖片資源進行碎片化處理,隨機組合、加密而成;由於源數據重複機率低、手寫文字差異大(即使同一個人多次書寫同一數字,其結果也不盡相同)、手寫字元書寫不規則等特點,使得現有OCR技術很難識別;同時我們結合大數據處理和雲計算技術,為開發者提供清晰、安全、方便的雲驗證碼服務。
2 核心產品技術優勢
海量手寫碼
我們長期致力於國人書寫習慣的識別和研究,目前已收集了近億個手寫碼,建立了龐大的個性資料庫。我們正在並將持續擴容手寫字元資料庫,從目前的純數字逐漸形成數字、英文字母、簡體中文漢字、其他特殊字元等多種手寫碼混排的格局。
我們也將努力嘗試每個手寫碼有且只用一次,以此提供破解複雜度;嘗試降低噪點,使圖片更清晰以便於用戶更容易識別;嘗試結合大數據行為分析,在不降低安全性的前提下為不同的用戶推薦不同的手寫碼,如:為喜歡數字的用戶提供數字驗證碼,為喜歡漢字的用戶提供漢字驗證碼。
手寫碼OCR識別難度高
即使是同一個人,在不同時間、不同場景下書寫同一個字元,由於書寫時的方式、筆、紙張、環境等因素的不同,都可能導致書寫結果的不一致,這在很大程度上增加了OCR識別的複雜度。下圖是同一人書寫的24個數字“8”,都不盡相同。
複雜再加工
我們對碎片化的手寫單個字元進行隨機組合、降噪等複雜技術處理後,形成6~8個字元組成的圖片驗證碼,以提供清晰、安全、方便的雲驗證服務。
快速集成
只需要3分鐘、4個步驟,開發者就可以將手寫碼輕鬆部署到網站或其他產品上。我們還在不斷完善開放平台,提供更多Demo、SDK,幫助開發者更快集成。
3 主要功能
火柴手寫碼開放平台以數據流形式傳輸驗證碼圖片,前端展示方式由開發者按需自定義,目前我們提供了下述兩種Demo。
4 開發團隊
火柴棍工作室,由一群開發經驗豐富的80/90碼農組成,在飽受驗證碼開發之苦後,致力於國人書寫習慣的識別和研究,結合手寫體特徵與驗證碼技術形成了手寫碼。我們在解放自己的同時,也希望能把更多的開發者從無聊的驗證碼開發中解放出來,所以搭建了火柴手寫碼開放平台。