簡介
黑馬校對V15是北京黑馬公司全力開發的新一代校對系統,榮獲“中國優秀軟體”終身稱號並且通過了中國版協校委會的實測鑑定。內含S2版、PS版、Word版、WPS版、小樣版、飛騰外掛程式版和PDF外掛程式版七個全新的校對界面,採用超大規模詞庫和重點詞監控等先進的校對計算技術,在校對質量、校對功能和易用性等方面都有了飛躍性的提高,達到了當前電腦校對軟體發展的最高水平,智慧型技術居於國際領先水平。黑馬校對V15的研製基於覆蓋社會科學和自然科學各領域的1000億字漢語語料的分析,採用國際計算語言先進的語法分析和語料庫統計相結合的方法,具有漢語切分技術、漢語語法分析技術、漢語依存關係分析技術等 優秀的中文智慧型技術。內嵌79個專業詞庫、4800萬條專業辭彙、450萬條錯誤核心庫,查錯準確率和校對效率已經達到一個嶄新的高度。
支持各種主流文字處理和排版系統的檔案格式,支持各種專業文稿的校對。 黑馬校對系統是目前國內市場上占有率最高、實用性最強的專業校對軟體,為各類文稿的校對提供最佳解決方案。
目前,全國已經有95%以上的出版社、近萬家的報社雜誌社、印刷企業、圖書公司和機關辦公等單位和個人使用黑馬校對系統。
版本
單機版 | 多機版 | 雜誌版 |
單機版配有一個硬體加密鎖,安裝和使用時必須插鎖。不限制固定電腦安裝,是黑馬校對用戶群最多的版本。 單機版、多機版和雜誌版在校對功能上都是完全相同的。單機版、雜誌版同時只能在一台電腦上使用,而多機版可以多機同時使用。 | 多機版是一個多用戶優惠版本,授權在一個單位內部使用,可以多人同時使用。多機版採用“母鎖+子鎖”的方式,即一個母鎖(側邊橘紅色)用於安裝,數量為授權台數的多個子鎖(側邊深藍色)用於使用。多機版在安裝時不限制安裝台數、安裝次數,使用時插上子鎖即可。 | 雜誌版是專門為期刊用戶開發的校對軟體。功能與單機版完全一樣,只不過累計校對字數限制在400萬字。字數用完後交少許費用可補充400萬字。補充字數時,若有新版,可免費升級到新版。 |
黑馬校對的主要功能和特點
具有強大的政治性錯誤校對功能
精確校對領導人姓名、職務和領導人排序錯誤。精確校對涉及台灣和其他敏感的政治性錯誤。
即時更新的、可自定義的領導人職務庫。
PDF、Word、WPS等先進的嵌入式校對外掛程式
直接嵌入在Acrobat中校對PDF檔案。可把校對標記轉換成注釋結果,便於他人查看。直接嵌入在Word中,編輯、校對完美結合。 直接嵌入在WPS中,編輯、校對完美結合。
直接嵌入在飛騰系統中,排版、校對完美結合。
支持Acrobat6.0/7.0/8.0/9.0版本;支持Office97~2007版;支持WPS 2007/2009版;支持飛騰3.1~4.1版。
依據新版《現代漢語詞典》等權威標準
首屈一指的海量詞庫 海量專業詞庫辭彙量超過4800萬條,包括物理、數學、機械、紡織、氣象、歷史、考古、文物、交通、郵電、環境、農林牧漁、化學、石化、冶金、煤炭、建築、水利、圖書、印刷、醫學、生物、心理、經濟、證券、會計、財政、審計、電腦、電子、電力、新聞、政治、哲學、教育、少兒、文學、戲曲、電影、廣電、法律、宗教、民族、軍事、航空、地理、地質等79個專業詞庫。覆蓋1000億字高質量語料。符合全國科學技術名詞審定委員會的標準。高效的重點詞、敏感詞校對技術
根據需求定製重點詞監控詞庫,能夠準確快速地校對出所有與重點詞相似的錯誤,支持大容量的重點詞監控庫。特別適合於檢查領導人姓名、單位名稱、地名以及涉及中央重要精神的詞語等。依據新版《現代漢語詞典》等權威標準
⑴ 《現代漢語詞典》第5版 (商務印書館)⑵ 全國科學技術名詞審定委員會審定的各科科技名詞全書
⑶ 《中國人名地名大辭典》
⑷ 《第一批異形詞整理表說明》 (語文出版社) 國家語委2002年3月頒布
⑸ 《辭海》1999年版 (上海辭書出版社)
⑹ 《中國成語大詞典》 (上海辭書出版社)
⑺ 《使用語言文字規範指南》 (上海辭書出版社)
⑻ 《外國地名譯名手冊》(中型本) 中國地名委員會 編 (商務印書館)
⑼ 《英語姓名譯名手冊》第四版 新華通訊譯名資料組 編 (商務印書館)
開放的用戶詞庫
自由定義用戶庫、錯誤庫、重點詞監控庫、敏感庫、建議庫、領導人職務庫和排序庫等詞庫,量身打造校對標準。可以自由掛接外來詞庫。功能強大的校對出版工具
S2版可同步校對大樣和小樣檔案,能夠直接對照大樣檔案無損修改小樣檔案。方便實用的生成勘誤表功能。
強大的批量查找功能,輔助校對和建立索引。
句庫匹配,輕鬆校對文中引語是否與原句匹配。
高效的提取生詞功能,輕鬆擴建用戶詞庫。
先進的大樣轉文本和小樣排版符號剝離工具。
嚴格審定的大型成語查詢庫和各類知識庫。
黑馬校對技術原理
1. 正向查錯依靠語言模型來進行漢語依存關係分析 ,也就是對大量分類語料中的上下文和語句關係進行量化的統計、分析、提煉,並採用高倍信息壓縮、快速檢索、漢字高精度快速切分等先進技術 來生成語言模型和依存分析算法。
目前語言模型中知識庫詞條達4800萬條之多。
為提煉不同領域的文字特徵,黑馬分析處理了涵蓋自然科學、社會科學十大分支的300億漢語語料,同時鑒於中文的複雜性,為了提高語言模版的準確性和減少信息垃圾,我們每年投入30餘名數據處理人員對計算機智慧型分析結果進行人工核查。
2. 反向查錯
黑馬公司長期堅持不懈地大量收集各種常見錯誤,包括:寫作人員似是而非錯誤、五筆字型錄入人員常見錯誤、拼音錄入常見錯誤、OCR識別有規律的錯誤、各專業廢除詞條、不規範科技計量單位、國家語委確定的非規範詞條 、各類政治性錯誤等。
3. 從實際需求出發,增強校對功能
黑馬校對軟體不僅在核心技術上保持著領先地位,而且還針對廣大用戶的實際使用地改進版本,擴大軟體的適應性,使其更具實用價值。
黑馬校對系統的早期版本可以校對各種排版格式的小樣檔案,後來為方便校對人員對稿,增加了把大樣檔案轉換成檔案檔案,保留頁碼信息的功能。後來,黑馬公司研製出軟體RIP技術,開發了可以直接顯示並校對大樣檔案的S2版和PS版。為了方便編輯、排版人員的校對和修改,開發出了嵌入到Word中校對的Word版、嵌入到WPS中的WPS版、嵌入到Acrobat中的PDF版和嵌入方正飛騰3~4.1排版系統的飛騰外掛程式版。
黑馬校對能夠校對的錯誤類型
黑馬校對V15版內含450萬條錯誤規則庫和4800萬條海量專業庫,具有強大的查錯能力,能夠精確校對政治性問題(領導人姓名、職務、排序,台灣問題,敏感詞語等)、中文(錯別字、少字、多字、詞語搭配和部分語法語義、異形詞和繁體字、“也作”和曾用詞、知識性錯誤、人名、地名等各種錯誤)、英文拼寫、標點、數字、科技計量單位、重句等各種錯誤,部分校對界面(S2版)還可以校對目錄、標題和序號等錯誤。下面列舉一些黑馬校對可以檢查的錯誤類型(括弧外為錯誤詞條):
序號 | 錯誤類型 | 錯誤樣本 |
1 | 領導人姓名、職務搭配、排序錯誤 | 國家領導人的姓名錯誤,職務姓名搭配錯誤,以及先後排序錯誤等。 |
2 | 涉及台灣等的政治性問題 | 把台灣當成國家看待,和其他有關規定不允許的政治性錯誤。 |
3 | 其他敏感的政治性問題 | 宗教問題,敏感辭彙等。 |
4 | 拼音類錯別字 | 【拼音類錯誤】: 登計費(正:登記費);的台蘚(正:的苔蘚);兩隻槍(正:兩支槍); 投名壯(正:投名狀);邁卡錫(正:麥卡錫);易拉灌(正:易拉罐); 不在心煩(正:不再心煩);調節選鈕(正:調節鏇鈕); 藍球賽場(正:籃球賽場);旅客需知(正:旅客須知); 十分煩重(正:十分繁重);無可挑替(正:無可挑剔); 形式微秒(正:形式微妙);巡行飛彈(正:巡航飛彈); 一幅楹聯(正:一副楹聯);一副油畫(正:一幅油畫); 一擊悶棍(正:一記悶棍);占了上峰(正:占了上風); 迅雷不急掩耳(正:迅雷不及掩耳);挾天子已令諸侯(正:挾天子以令諸侯); 人面桃花相應紅(正:人面桃花相映紅); |
5 | 字形類錯別字 | 【字形類錯誤】: 抱括(正:包括);笫四(正:第四); 大鹹價(正:大減價);負責表(正:負債表); 摸不者(正:摸不著);字盂德(正:字孟德); 愛菅閒事(正:愛管閒事);巴彥卓爾(正:巴彥淖爾); 瓜瓜墜地(正:呱呱墜地);卡巴斯其(正:卡巴斯基); 兩個波型(正:兩個波形);聲名遠場(正:聲名遠揚); 展觀風采(正:展現風采);大漢口文化(正:大汶口文化); 迴旋自治區(正:回族自治區);客戶瑞生成(正:客戶端生成); 有機化台物(正:有機化合物);阿爾及尼亞(正:阿爾及利亞); 莫定了基礎(正:奠定了基礎);條件效成熟(正:條件較成熟); 世界人大奇景(正:世界八大奇景);給子行政處分(正:給予行政處分); 興隆街居委公(正:興隆街居委會);走了很多地萬(正:走了很多地方); |
6 | 成語錯誤 | 【成語錯誤】: 百轉乾回(正:百轉千回); 暴斂天物(正:暴殄天物); 篳路籃縷(正:篳路藍縷); 彪炳千古(正:彪炳千古); 綺旎風光(正:旖旎風光); 千斤買鄰(正:千金買鄰); 權益之計(正:權宜之計); 神態自苦(正:神態自若); 水滴石川(正:水滴石穿); 四海生平(正:四海昇平); 他山之後(正:他山之石); 貪贓王法(正:貪贓枉法); 一蹴不振(正:一蹶不振); 一丘之豹(正:一丘之貉); 肄意妄為(正:肆意妄為); 鄭重其是(正:鄭重其事); 捉襟見紂(正:捉襟見肘); 自相茅盾(正:自相矛盾); |
7 | 少字錯誤 | 【少字】: 成本管研究(正:成本管理研究); 國家安全員會(正:國家安全委員會); 馬克列寧主義(正:馬克思列寧主義); |
8 | 多字錯誤 | 【多字】: 其實是是對(正:其實是對); 它的的功能(正:它的功能); 放射性元元素(正:放射性元素); 統計局統計局(正:統計局); |
9 | 錯位錯誤 | 【錯位】: 熱鬧場的面(正:熱鬧的場面); 讓大人跌眼鏡(正:讓人大跌眼鏡); 美國小總統布希(正:美國總統小布希); |
10 | 詞語搭配錯誤 | 【詞語搭配錯誤】: 他的丈夫(正:她的丈夫);冰雪熔化(正:冰雪融化); 記念勝利(正:紀念勝利);精減機構(正:精簡機構); 清楚毒素(正:清除毒素);心理沒底(正:心裡沒底); 危急人體健康(正:危害人體健康); 消費者想賣什麼(正:消費者想買什麼); |
11 | 的地得錯誤 | 【的、地、得相關錯誤】: 更快的找到(正:更快地找到); 全神貫注的聽著(正:全神貫注地聽著); 回家地路上(正:回家的路上); 印章得時候(正:印章的時候); 看的上眼(正:看得上眼); 急的要命(正:急得要命); 忙的天昏地暗(正:忙得天昏地暗); 妙的很(正:妙得很); |
12 | 語法錯誤 | 【語法錯誤】: 1.進一步障礙了社會的發展。(“障礙”用詞不妥,應改為動詞“阻礙”。) 2.頂不住壓迫而喪失了原則。(“壓迫”是動詞,應改為名詞“壓力”。) 3.他的白血球指數比正常值少三倍。(表示數量的減少,不能用倍數。) 4.曹雪芹的足跡走遍了香山。(“足跡”和“走遍”不搭配。) |
13 | 異形詞 | 【異形詞】: 定貨(正:訂貨); 簡煉(正:簡練); 秀外惠中(正:秀外慧中); 直接了當(正:直截了當); |
14 | 繁體字詞 | 【繁體字詞】: 什麽(正:什麼); 金庫(正:金庫); 於是按照(正:於是按照); 文王生於(正:文王生於); |
15 | “也作”錯誤 | 【“也作”】(《現代漢語詞典》中沒有條目或註解的“也作xx”的非推薦詞條): 惟一(正:唯一); 想像(正:想像); 其它(正:其他); 撤消(正:撤銷); 背不住(正:備不住); 虎踞龍蟠(正:虎踞龍盤); |
16 | 曾用名錯誤 | 【曾用名】(曾經使用過的醫學不規範名詞): 氨丁酸(正:氨酪酸); 巴金森(正:帕金森); 紅血球(正:紅細胞); 氯丙硝唑(正:奧硝唑);胸腺多肽(正:胸腺素); 乙醯水楊酸(正:阿司匹林); |
17 | 知識性錯誤 | 【知識性錯誤】: 廣州黃浦(正:廣州黃埔); 上海黃埔(正:上海黃浦); 廣東河池(正:廣西河池); 廣西雷州(正:廣東雷州); 河北省信陽(正:河南省信陽); 江西省宜興(正:江蘇省宜興); 陝西河津(正:山西河津); 廣西省(正:廣西壯族自治區); 國家林業部(正:國家林業局); 美國劍橋大學(正:英國劍橋大學); |
18 | 人名錯誤 | 【人名錯誤】: 秋少雲(正:邱少雲);張廣後(正:張廣厚);趙孟頻(正:趙孟頫); 鸝道元(正:酈道元);竺可禎(正:竺可楨);左邱明(正:左丘明); 吳主章(正:吳玉章);錢種書(正:錢鍾書); |
19 | 地名錯誤 | 【地名錯誤】: 哈蜜(正:哈密);赤蜂市(正:赤峰市);株州(正:株洲); 風翔縣(正:鳳翔縣);嘉裕關(正:嘉峪關);涿洲市(正:涿州市); 梅洲市(正:梅州市);阿賽拜疆(正:亞塞拜然); 塞浦洛斯(正:賽普勒斯);吉爾吉斯坦(正:吉爾吉斯斯坦); |
20 | 英文拼寫錯誤 | 【英文拼寫】: Shares worldwide have risen strongly after the latast signs of an econamic recovery in the US.Shares on Wall Street continiued upwards thanks to better-than-expected industrial producation data.The Dow Jones Industrial Averag closed up 107.5 points, or 1.1%, at 9,791, which was an 11-monlth high. It has now risen for eight of the past nine days. |
21 | 標點錯誤 | 【標點錯誤】: 1.看到<經濟參考報》對3萬多農民深受”高價電”之苦的報導感到震驚。 > 2.占四川省生產總值的46%左右,。 3.他笑著說::‘很好,就這么辦!” 4.雨還在悄悄地下著……。 5.老張說道:”快點,晚了就來不及了。 |
22 | 數字性錯誤 | 【數字性錯誤】: 他今年303歲(不符合現實); 在19882年22月36日(錯誤的年月日); 去年2月31日(2月沒有31日);到了99年(不規範寫法,應為1999年); 淳熙8年(正:淳熙八年); 二0年(正:20年); |