
漢語拼音輸入法是利用漢字的讀音(漢語拼音)進行輸入的一類中文輸入法。拼音輸入法有幾種輸入方案包括全拼和雙拼。市場上有許多用拼音作基礎的輸入軟體。首先,大部分的現代作業系統都跟隨著一副漢語拼音輸入法,如內建於WindowsXP的智慧型ABC和微軟拼音。其他商業拼音輸入產品有:紫光拼音、拼音加加、黑馬神拼、南極星字詞拼音、搜狗拼音輸入法、谷歌拼音輸入法等等。
發展歷史

不相信?如今即使在Windows XP里還保留著第一代拼音輸入法。不信?你把“全拼輸入法”調出來打個字試試。保證你鬱悶得要爆炸!

拼音太麻煩,五筆又難學。因此設計師們不斷進行改進。
先有詞組輸入,但是也僅能輸入少量詞組,不能自造新詞,不能動態調頻、不能以詞定字……後來又設計了聯想輸入,即打一個字以後電腦就會自動把以這個字開頭的雙字辭彙列出來(例如我打“螞”電腦立馬就問要不要再加“蟻”)。
但效果最好的還是兩種方案跟一個概念:簡拼(Jianpin, simplified pinyin)跟雙拼(Shuangpin, double pinyin),高頻字(high frequency characters)。
中國語言一直處在簡化當中。反切太麻煩就發明注音符號,後來又升級成漢語拼音;繁體字太麻煩就改成簡化字。拼音輸入法也不例外。
所謂簡拼,就是把一個漢語韻母用一個英文字母表示。比方說我用x來表示an,我要打“院”字只要敲yux就行了。確實是簡化了不少。
但yux還是太麻煩,乾脆再縮略一下,用y來表示uan,這樣敲yy就能打“院”字了。於是打一個字只要敲兩下鍵盤(當然翻頁、選字不算),這就叫“雙拼”。
有些漢字使用頻率極高,如“一”、“我”,這樣特別做一下規定,按下“y”就能打“一”,按“w”就能打“我”。這便是“高頻字”,其設計思想來源於五筆字型的“一級簡碼”(primary simplified code)。

第一代拼音輸入法使中國人具有了向計算機輸入漢字的能力,使漢字與英文等拼音文字站在了信息化的同一起跑線上,具有巨大的歷史意義。
但其缺點很明顯,重碼多使得輸入速度過慢,逐字輸入使得輸入方式死板。隨著信息技術的發展,它注定會被第二代拼音輸入法取代。
詞組搭台,智慧型唱戲——第二代拼音輸入法(1992~1997):1992年,北京希望公司(Hopesoft)推出了自己的拳頭產品——UCDOS 3.1,其集成的智慧型拼音輸入法成為了最亮的亮點。它標誌著第二代拼音輸入法的時代正式到來,是一座巨大的里程碑。

第二代完全支持詞組輸入(這不是廢話嗎)?不廢不廢,它跟第一代有本質的區別。在這裡本人以Windows內置的智慧型ABC(這個最普及了)為例。
第一代只能輸入每一個字的完整拼音,比方說“糨糊”就是“jianghu”;第二代不僅可以全拼輸入,也可以僅輸入該詞組的聲母,用“jh”輸入“糨糊”。
不僅如此,第二代還有自動調頻功能。這個功能大家很熟悉,第一次打“jianghu”時“糨糊”排第二、三位,下一次就排到了第一位,按空格就能輸入“糨糊”。要是再跟上一條功能結合起來,打“jh”,排在第一位的也是“糨糊”。是不是方便很多啊?
如果我們要打的詞沒有怎么辦?比方說專業辭彙,如“四氫呋喃”。很簡單:自己造。先打“siqingfunan”敲空格,再依次從備選字中找到“四”、“氫”、“呋”、“喃”即可。下次要打這個詞,敲“sqfn”即可。第一代拼音大多允許你自己造詞。即使造了也不能僅通過聲母輸入。
第二代拼音就這個特點,越用越快。
除此之外,第二代拼音還有許多特色功能,目的就是提高輸入效率。其中比較有影響的有南方音(South China’s pinyin)或稱模糊拼音(blur pinyin)、以詞定字(character confirming by words)、筆形輸入(strokes imputing)、符號輸入(Symbols imputing)等。
第二代拼音輸入法簡捷、高效、迅速,免去了第一代拼音重碼的困擾、五筆背字根的麻煩,只要會拼音就能快速打字,即使國語發音不準的南方用戶也能輕鬆打字,只是減少了一些準確率而已。它贏得了眾多用戶的芳心。
20世紀末全民普及計算機,電腦走進千家萬戶,第二代拼音輸入法便是最大功臣。
所以,第二代拼音不但超越了它的前輩,而且領先於五筆成為最受歡迎的輸入法,還把後生晚輩——第三代拼音、手寫、語音、OCR等輸入法壓製得毫無還手之力。曾一度叱吒風雲的五筆在第二代拼音的風頭之下開始出現頹勢。
近十年以來,第二代拼音仍然在不斷發展。詞組輸入逐漸向短語輸入過渡,能夠分析上下文,智慧型能力進一步提高,詞庫越來越大,甚至出現了依託Internet為詞庫的輸入法。
第二代拼音也有不少缺點。
一個是錯別字。不管其智慧型程度如何高,總不能完全消滅錯別字,如果用戶不加注意,那就造成錯字滿天飛的局面。更何況“的、地、得”與“再、在”如果搞錯就成了語法錯誤。偏偏這五個字每一款拼音輸入法都不能完美區分,需要用戶自己留意。
第二個是詞庫有限,僅支持現代漢語。前者導致許多專業辭彙難以輸入,需要花時間造詞,後者給需要輸入古文的用戶(如語文教師)帶來了不便。

行雲流水,一氣呵成——第三代拼音輸入法(
1997~):1997年,在中國IT史上是個風起雲湧的年份。Windows 97、Office 97、WPS 97、RichWin 97、中文之星2.97等一系列軟體相繼發布,更有微軟Office 97跟金山WPS 97的龍爭虎鬥。可能當時大家都注意到了氣勢洶洶的Office 97,卻沒留意內置的一個小軟體——微軟拼音輸入法1.0。不要小看它(歷史證明也小看不得),就是這個不起眼的微軟拼音,卻揭開了第三代拼音輸入法的序幕。
第二代還風華正茂,第三代就搶先登場。跟前輩相比,它牛在哪兒呢?
它牛在整句輸入。讓漢語跟英語一樣能夠按音打字,做到了“行雲流水,一氣呵成”。
從單字輸入到詞組輸入是本質區別,從詞組(短語)輸入到整句輸入,又是一個本質區別。
讓我們回顧一下自己聽別人講話的過程:首先耳朵接收聲音信號傳到大腦,大腦把聲音轉換成對應的漢字,字組詞,詞造句。
——問題來了:也就是說,你如何能確保你聽到的跟對方說的在字面上保持一致(也就是同一個句子)呢?
答案是:經驗、分析。大腦自動地分析聽到的聲音信號,至於什麼信號對應什麼辭彙,那就是你日常生活積累的經驗。比方說“mama”是“媽媽”而不是“抹抹”。
微軟拼音也是這么做的!
它接受的不是聲音信號,而是聲音的書面形式(拼音),把拼音轉換成漢字,再挑出正確的漢字組成合乎用戶原意的句子,後面兩步工作跟人腦沒有大區別。
小區別還是有的,除了實現原理不同(廢話)外,還有一個調號的問題。微軟拼音支持調號,但不帶調號輸入其準確率也八九不離十。
也就是說,微軟拼音是基於人工智慧(AI)技術開發的。跟基於資料庫檢索技術開發的第二代拼音相比,是不是本質的區別?

不過我們也別長他人志氣,滅自己威風。微軟拼音的
AI引擎是中國人開發的。國內還有一個更牛的第三代拼音輸入法:中文之星智慧型狂拼。準確率比微軟拼音還要高一個檔次,全面支持現代漢語、古漢語(文言文)、中國主要方言,也可以通過第二代方式輸入,外加五筆一套,方便不同要求的用戶——可謂大而全了。第三代拼音需要電腦有強大的數據處理能力,巨大的數據存儲空間。本身也極占CPU跟記憶體資源。而第二代拼音對硬體配置要求微小,準確率也很高,速度不在第三代之下,因此第三代對第二代一直搶不到優勢。即便微軟把微軟拼音捆綁在Windows/Office里,依然使用者不多,主要是一些入門用戶。
萬碼奔騰,陣營分明——結語:二十年前是個“萬碼奔騰”的時代,各種漢字編碼占山為王、你爭我斗,最後只有五筆跟拼音生存了下來。
如今又是一個“萬碼奔騰”的時代,但這些“碼”基本只能劃分為兩大陣營:五筆、拼音。拼音又能劃分為兩代產品:第二代、第三代。
第二代並不落後,第三代也未必先進。拼音輸入法如此之多,選一款適合自己的,再熟悉常見的其他產品就足夠了。
趨勢

隨著QQ輸入法的加如,目前暫時跑在前頭的SOGOU輸入法會感覺到一定的壓力(谷歌輸入法實際上沒有給sogou輸入法帶來任何壓力,反而給sogou帶來很多免費的廣告,這也許是Google上市以來,在國際媒體的眼中,sohu第一次有機會在一個領域被同Google做直接比較,並獲得決定性勝出)。QQ輸入法和谷歌不一樣,QQ在中國網際網路巨大的影響力,尤其是對於好變化,熱衷於標新立異,對新鮮事務有強烈興趣的年輕一代網際網路用戶而言,QQ輸入法的背景絕對不能讓sogou小視。如果sogou和QQ輸入法一旦走向同質化和品牌競爭的領域,sogou輸入法就在戰略上輸了一招。輸入法的競爭如果演化為品牌的競爭,對於用戶來說,並不是一個好事,畢竟用戶需要的是技術上真正能夠更快更準確的滿足輸入的要求的輸入法,而不是一個品牌。第二代輸入法的使命已經基本上結束,估計第三代輸入法在幾大豪門的競爭中將逐步成形,我估計未來的輸入法很可能在幾個領域實現改變:
1.由於輸入法同賬戶開始直接綁定,輸入法之間的遷移成本開始上升,也就是說,輸入法的某些很便利的功能將來都必須在連結上自己的賬戶後才能夠享用到;
2.對詞庫的保護開始強化,這個估計sogou已經開始著手這一方面的研究;
3.詞組輸入法還將嘗試容納整句輸入法,也就是說,現在的主流輸入法將盯上目前微軟拼音的市場份額,微軟拼音將很難在未來的輸入法市場競爭中獨善其身;
4.由於中國國情,網際網路主體用戶都是在使用im工具,輸入法套用上,詞組輸入法的便捷性一直被強化,整句輸入法目前還亟待提高,對於很多公文用戶來說,正確輸入和快捷輸入是同等重要的,很可能不少輸入法在這個領域,將兼容或者參考瘋狂拼音的整句輸入功能;
5、搜尋功能被強化;直接從輸入法開始切入搜尋將使競爭越來越激烈。

新一代的輸入法,尤其是對用戶容錯性能的技術,都需強大的資料庫分析、分詞等技術。這些強大的技術不在是2~3人的開發隊伍所能夠承擔,豪門的介入,將大大強化輸入法領域的技術投入和創新,所以作為用戶,我們更希望更多有技術資源和背景的技術隊伍加入,網際網路本來就沒有哪個領域天然就規定好是誰的份額,只有更多競爭者介入,才能夠形成競爭,才能夠更好的為用戶服務。從這一點上來說,不要冷言冷語對待谷歌和QQ介入輸入法領域,用戶作為競爭選擇的最後裁決者,要歡迎他們的努力和嘗試,如果將來還有百度輸入法、sina輸入法,對輸入法用戶來說,難道不是好事么
各輸入法
紫光拼音輸入法:簡稱紫光拼音,又稱紫光華宇拼音輸入法,是一種拼音類的中文輸入法,對詞、短語的輸入智慧型化程度高。紫光拼音易於使用,整體輸入速度較高,用戶量較大且反映良好。
紫光華宇拼音輸入法是紫光華宇自主開發、具有自主智慧財產權、對最終用戶完全免費、基於漢語拼音的中文字、詞及短語輸入法。
紫光華宇拼音輸入法適用於Windows。紅旗Linux曾經在其自帶輸入法中使用了紫光拼音輸入法,並可以通過設定後在其它Linux發行版使用。但在紅旗Linux5.0中,這一功能被去除。
拼音加加:是一種拼音類的中文輸入法,與整句輸入風格的智慧型狂拼不同的是對詞語的處理特性較好。在2.204版本推出之後,拼音加加一度停止更新有4年時間。2004年底推出新版,稱為拼音加加2004,版本號從3.0開始計算。

近幾年,隨著搜狐旗下的搜狗拼音輸入法和Google中國公司旗下的谷歌拼音輸入法的問世以及紫光拼音輸入法的重新開發,拼音加加的很多優秀功能也被其他的輸入法普遍借鑑並在其他的輸入法身上得到了提高,使得拼音加加輸入法逐漸淡出了人們的視野,原拼音加加的用戶也大量地流失,另外輸入法開發氣氛的浮躁也影響了使用者對該輸入法的評價。而該輸入法默認修改主頁等不良性能也在很大程度上影響了其在使用者心目中的形象。但這個輸入法在中國漢字輸入改革中所起到的歷史作用是不容否定的。它為後來興起的新的拼音輸入法提供了寶貴的借鑑。
黑馬神拼:是一種拼音類的中文輸入法,是早期語句輸入法中質量較高的軟體。黑馬神拼由北京黑馬飛騰科技有限公司製作,最新版本為“黑馬神拼2001”。
由於商業原因,黑馬神拼已經停止更新;官方網站曾經聲稱有速記專業版正在開發之中,但後來有否認了這種說法。黑馬神拼已經徹底走向了終點,該輸入法的智慧型算法語料資料庫已經出售給了由周志農掌管的自然碼輸入系統。但有用戶反映,自然碼在使用了黑馬的智慧型識別庫以後自然碼的反應變慢。在2001年黑馬神拼問世後,曾流傳一種說法,稱當時中文之星的智慧型狂拼的語料也購買於黑馬飛騰公司,但這個說法後來被證實為謠言,有人曾對兩個輸入法的語料做過對比,認定兩個輸入法的語料相互獨立。黑馬神拼雖然停止開發,但是他倡導的整句輸入模式已經日益成為當今中文輸入的主流趨勢。黑馬神拼和智慧型狂拼都贏得了長期的好評。目前智慧型狂拼仍然在維護當中,天索智慧型狂拼2008已經於2008年6月6日正式結束內測,開始公測。
谷歌拼音輸入法:是由Google中國實驗室開發,於2007年4月2日發布。10月25日成為Google的正式產品之一。

隨後,Google在其部落格網誌“Google黑板報”上發布有兩份聲明,第一份是對盜用詞庫表示致歉明白卡,第二份則稱輸入法中包含Google工程師申請的專利。
智慧型ABC輸入法:是運行於MicrosoftWindows之下的漢語拼音輸入法軟體,因捆綁於MicrosoftWindows簡體中文版操作軟體而一舉成名,也是現在中文輸入法使用人數最多的輸入法軟體。此軟體是北京大學教授朱守濤發明的,開發於北京大學科技開發部。智慧型ABC的最新版本為5.22A。
非簡體中文版的MicrosoftWindows用戶可以從官方網站下載註冊版或購買此軟體。不過,所有MicrosoftWindows2000後的視窗作業系統都含有微軟和哈爾濱工業大學開發的微軟拼音輸入法。
微軟拼音輸入法(MicrosoftPinyinIME):是微軟公司和哈爾濱工業大學聯合開發的智慧型化漢語拼音輸入法,是一種以語句輸入為特徵的第三代輸入法。

智慧型狂拼:智慧型狂拼是一種基於CLM(中文語言模型)技術的整句輸入法,是目前唯一款擔當中的開發者保留著整句技術的整句輸入法軟體,他的第一個版本智慧型狂拼Ⅰ是在2000年推出,在這之前,整句輸入法的模式已經有人提出,這種模式在當時受到了廣大中國用戶的歡迎和追捧,對於後來其他的輸入法開發也產生了深遠的影響。
之後中文之星又推出了智慧型狂拼Ⅱ,這個版本安裝包體積相比於第一個版本已經有了很大的壓縮,也使得智慧型狂拼的受歡迎度達到了頂點,但是因為智慧型狂拼開發投入了大量的資金,所以中文之星當時將智慧型狂拼定位為收費軟體模式,在軟體收費不被多數中國民眾肯定的大背景下,該輸入法的盜版問題始終困擾著中文之星,最終隨著中文之星開發重心的轉移,智慧型狂拼Ⅲ的開發工作半途而廢,中止開發的智慧型狂拼Ⅲ被命名為智慧型狂拼Ⅲ共享版,免費地向中國網際網路民提供下載。並在中文之星的官方論壇發表了一個智慧型狂拼終止開發的聲明(由於中文之星的官方網頁已經關閉,這個聲明目前只能通過其他網站的轉貼得到證實)。無疑,中文之星的這個舉動為智慧型狂拼日後的重新開發造成了十分消極的影響。
智慧型狂拼Ⅲ終止開發以後,一部分中文之星的成員從該公司出走成立了新的名叫天索的公司,並在經過中文之星同意後重新扛起了智慧型狂拼開發的招牌,重新開發的智慧型狂拼最初被命名為智慧型狂拼Ⅲ.3,後來該輸入法開始按年號計算版本號,比如2007賀歲版、2008公測版。Ⅲ.3版本及其之後的狂拼和先前的智慧型狂拼Ⅲ在編程思想上沒有銜接關係,是一次徹底的推倒重來.智慧型狂拼Ⅲ.3大膽地借鑑自然碼輔助碼模式提出了一套相比於自然碼更加寬泛的輔助碼模式,2007賀歲版借鑑了網友提出的下標定位思想,2008公測版又推出了聲母定位思想,在很大程度上解決了整句輸入模式下修改的不足。
搜狗拼音輸入法:搜狗拼音輸入法(簡稱搜狗輸入法、搜狗拼音),是2006年6月由搜狐Sohu(NASDAQ:SOHU)公司推出的一款Windows平台下的漢字拼音輸入法,至2007年3月,已推出多個版本。與整句輸入風格的智慧型狂拼不同的是它偏向於詞語輸入特性,為中國國內現今主流漢字拼音輸入法之一,奉行永久免費的原則。
主要特色:
網羅新詞:搜狐公司將此作為搜狗拼音最大優勢之一。鑒於搜狐公司同時開發搜尋引擎的優勢,搜狐聲稱在軟體開發過程中分析了40億網頁,將字,詞組按照使用頻率重新排列。在官方首頁上還有搜狐製作的同類產品首選字準確率對比。用戶使用表明,搜狗拼音的這一設計的確在一定程度上提高了打字的速度。
快速更新:不同於許多輸入法依靠升級來更新詞庫的辦法,搜狗拼音採用不定時線上更新的辦法。這減少了用戶自己造詞的時間。
整合符號:這一項同類產品中也有做到,如拼音加加。但搜狗拼音將許多符號表情也整合進詞庫,如輸入“haha”得到“^_^”。另外還有提供一些用戶自定義的縮寫,如輸入“QQ”,則顯示“我的QQ號是XXXXXX”等。
輸入統計:搜狗拼音提供一個統計用戶輸入字數,打字速度的功能。但每次更新都會清零。
分類

全拼輸入法,輸入要打的字的全拼中所有字母,如:中(zhong)、國(guo)
首字母輸入法,輸入要打的字的全拼中的第一個字母,如中(z)、國(g)
由於中文字型檔數量龐大,同音字有很多,當採用拼音輸入法(尤其是採用首字母輸入法)輸入中文時,會出現大量同音字,當你要輸入的字不在第一位時,按下相對應的數字即可輸入該字。如果在第一位則敲下空格鍵即可輸入該字。
兩字詞拼音輸入方法
A+B全拼輸入法,輸入要打的兩字詞的全拼中所有字母,如中國(zhongguo)、美麗(meili)
A+B首字母輸入法,輸入要打的兩字詞的每個字全拼中的首字母,如中國(zg)
A首字母+B全拼輸入法,當採用A+B首字母輸入的兩字詞並沒有出現在輸入框首頁上,這時採用翻頁鍵查找功能雖然也能找到你要打的字,但沒有直接輸入B全拼來得快,如命令(ml),當輸入ml時並沒有出現這個詞,這時只要在補充輸入ing即成為mling,也就是A首字母+B全拼形式,命令出現在第一位上,比翻頁查找要快的多。
三字詞和四字詞拼音輸入方法
A+B+C首字母,如計算機(jsj)
A+B+C+D首字母,如欣欣向榮(xxxr)