j[Jin(Ji)Ji(Ji)Jin(Ji)Ji(Ji)Ji(Ji)Ji(Ji)Ji K[Zi]Li(Jiao)Li()Z[Zhu(?6?8)]停止()爪()行走(??6?4)X[Xin(扌)] Xi(斏)Xi()蕭()丙[咪(扌)]寸車()Bug V( )[魚(魚)]雨B [Bu ()]八6?8)她()貝()白爵N[女] 20(?)牛(?6?4)M【木】(門)Ma(馬)序(第4項)*說明:[]是鍵名部首,()是變文和繁體。
從上表可以看出,這些英文鍵盤的26個鍵名中,V沒有對應的音標拼音,O也沒有對應的偏旁部首,所以保留為功能鍵。筆畫還包括彎、按、鉤,按橫、豎、點、左、彎、提、按、鉤的順序排列,其中所有帶鉤的筆畫都是鉤,筆畫順序還包括先留後壓、先封外後封內,再橫縱、先留後壓、先外後內、先封中後封內。使用上述100偏旁部首的漢字全息編碼,全部采用英文鍵盤四位碼輸入法。這種漢字編碼輸入技術簡稱全息碼。
與以往的漢字信息檢索輸入碼相比,本發明的漢字全息碼計算機通用鍵盤輸入技術具有易學、操作方便、輸入速度快、復制率低、易於推廣等優點,因為它優先選用常用的100傳統偏旁部首和簡單的筆畫規則,符合人們的常識和習慣,容易記憶。
與以往的輸入編碼相比,本發明只需掌握100個常識偏旁部首的拼音首字母,配合相應外文(英語、俄語、德語、法語、意大利語、日語、拉丁語、國際音標等)的鍵盤,),並將65,438+000個偏旁部首的拼音首字母標在壹個電腦通用鍵盤的26個英文字母鍵上,讓全世界都能學會。發明的獨到之處還在於它的簡潔,讓壹切變得簡單易行,摒棄了壹切人為的公式和主觀確定角度、高度、位置的繁瑣死記硬背;本發明還將字母編碼和數字編碼靈活和諧地結合在壹起,使各種用戶和機器部件都能通用。
本發明可廣泛應用於通用鍵盤電子計算機和各種中文工具書,實現計算機、詞典、資料、電信之間編碼的壹致性。
采用本發明,在計算機上編碼只需半天或壹天左右,具有無需專門培訓、軟硬件成本低、適用於小型鍵盤的常用部件、平均擊鍵次數少(平均每個單詞約1.33次)、重復率低(小於千分之壹)等優點。
此外,本發明至少可應用於以下十個方面:1,中文電腦打字、編輯、排版;2.電報碼和電傳碼統壹用拉丁字母,可以由機器自動翻譯成中文;3.國家郵政編碼;4.中外機器輔助翻譯;5.古文和白話文的機器輔助翻譯;6、速記;7、縮寫;8.圖書編目和詞典索引用的全息編碼:9.快速復制和縮小;10,醫學自我咨詢,農林牧副漁,工商,金融,文學,軍政管理咨詢。
本發明把復雜的方形漢字變成了比任何其他西方語言都要多的全息編碼,發掘了漢字的內在美,使漢字成為科學、規範、精煉、工整、美觀的集約型編碼,成為東西方文明大交流的宏偉橋梁。
在下文中,將通過實施例更詳細地描述本發明。
例1按100部首漢語拼音的首字母順序排列。26個字母中,用V代替,O沒有對應的部首,所以留給功能鍵。100部首字常用,拼音首字母為用戶熟知。基本筆畫源自唐宋以來研究了壹千多年的“雍子八法”,讀音為:橫、豎、撇、點、握、挑、彎、鉤。所有帶掛鉤的都要檢查。用八筆顯然比五六筆更符合漢字的實際,而且大大增加了區分重碼的分散性。
2、筆順七法則:五萬多個漢字,其形體千變萬化,但書寫的筆順只有以下七條簡單的法則。(用“齊”等代碼將筆順規則增加到10以上是不合理的。)受過初級教育的用戶應該從童年到老年遵守這些規則,這已經成為幾千年來的習慣。無論從習慣上還是從視覺上,起始部首、延續部首和結尾部首都是最容易識別的。漢字80%以上是形聲字,由形聲字和音字根兩部分組成。取部首、續部首、接尾部首、收部首,左右部首或上下部首完全兼顧,不集中在壹個部首,充分發揮了增散、消重碼的作用。
按照筆順的七大習慣規則(先橫後豎、先左後右、先上後下、先外後內、後封、先中後兩邊),將漢字分解為偏旁部首(包括筆畫)。分解部首,取筆畫最多。
漢字的筆順規則舉例如下:(1)先橫後豎“十”是“壹筆”,“幹”是“壹筆”(2)先左後按“人”是“壹筆”(大的是“壹筆”)“11”和“勺”是“咦?丶丶(6)先外後內封“天”。“四”是“壹”的意思
(7)中間然後兩邊的“小”字是“丠丠”而“山”在上面是為了說明筆順規則,把樣本字分解成筆畫,而本發明的編碼表是按照筆順分解部首,每壹步都是以筆畫最多的部首為原則。比如“鞘”字分解成“二十口十小月”而不是“壹……壹”等等。漢字中極少數字需要用倒寫紙書寫,如“或”,部首仍按實際書寫順序分解。
3.編碼示例:(1)部首詞:100的部首表中的部首,既是最常用的部首,也是獨立的常識詞。我反對把部首拆分成碎片化的“根”或“字”,因為除了專門的編碼者,沒有人知道它們。部首按聲音分類,可分為壹部部首、關鍵部首和構詞能力強的壹般部首。這種區分的目的是在對復合詞進行編碼時減少重復的碼字。采用上述100字根計算機通用鍵盤中文全息碼輸入技術,所有編碼步驟均采用四種編碼輸入法。搜索時不需要區分單個部首字,都是用部首的語音聲母、元音的第壹個字母、第壹筆、第二筆、最後壹筆碼按的鍵,正體字、異體字、簡體字、繁體字都是這樣編碼的,不可能用單獨的筆畫按O鍵。
因為壹個拼音字母下有幾個偏旁部首,用上面三個筆畫,離散度為8× 8× 8 = 512,不會有重碼。比如:壹:HHOO二:EHHO三:shhh:: mdgo門:MDSG金:JPNH馬:MWGH木:MHSN項:MSWH在同壹個音標下,因為離散度大,所以部首基本不重復。
(2)兩個偏旁的合成詞:也用四個拼音字母碼,按四次鍵。
本發明編碼不以字體區分,這與王永明發明的“五筆字型”不同。王永明將字體分為左右字型、上下字型和雜字型。其實中文字體的種類遠不止三種,有左中右型、上中下型、對角線型、十字型、半包容型、全包容型,有時候很難區分。信息利用的價值在於信息的確定性。對於邊界模糊、不可分辨的信息,使用時容易出錯。因此,本發明的全息編碼不包括字體識別。
兩個偏旁的合成詞代碼如下:×××××從最後壹筆開始第壹筆第壹筆第壹筆第壹筆第壹筆第壹筆第壹筆第壹筆第壹筆第二筆第壹筆第壹筆第壹筆第壹筆第壹筆第壹筆第壹筆第二筆第壹筆第壹筆第壹筆第二筆第壹筆第二筆第壹筆第二筆第二筆第二筆第二筆第二筆第三筆第二筆第三筆第三筆第三筆第三筆第三筆第三筆第三筆第三筆第三筆第三筆第三筆第三筆第三筆第三筆第三筆第三筆第三筆第三筆第三筆第三筆第三這樣就有8× 8 = 64種離散性,比王永明三種字體五筆區分的3× 5 = 15種離散性大4倍多,所以有
如果首末部首是鍵名部首,可以特殊處理,都改成O,不加筆畫區分。通過移動O,還可以調整重碼的單詞,使其不重碼。二部式合成詞舉例:兵:江:Carry:多哥潤:MGWO廢:MOWO件:MOWN(3)三部式合成詞:四碼分別是:始部首、始部首、終部首、續部首、收部首。當起始部首是鍵名部首時,雙擊O鍵,最後壹個筆畫碼不會被打中。比如物種:HDKS Gui: MOTT花:CORB Wish: QDKE恭喜妳:LPKB You:ROBX Together:ROHK Huan:YDBR Tree:MOYC如果重復詞少,可以插入O來重復。0鍵對消除重碼的作用很大,因為使用26個字母比使用25個字母增加了264-254 = 66,351的離差,大大減少了重碼。
(4)四部首以上的合成詞:壹般來說,取開頭部首、開頭部首和結尾筆畫、結尾部首和結尾部首。如果起始部首是關鍵部首,則第二代碼被改變為延續部首。
本發明充分利用了26個字母,總離散度為26×26×26 = 456976,足以分辨6萬個漢字。例:民:家:TBRQ齊:阿韋布林:醇:XHLH(5) word文檔快碼:本發明全息碼的色散為456976,可輸入5萬多個漢字和40萬個單詞。輸入單詞的時候也是用四個拼音字母,按四次鍵,意味著輸入單詞的速度可以大大提高。漢字由2、3、4、5…等字組成。平均40萬字,大概是654.38+0.2萬字,以前是654.38+0.2萬×4 = 480萬次擊鍵。現在只要擊鍵654.38+0.60萬,平均每個方塊字符的擊鍵次數就是654.38+0.33。漢字有以下特點。
1).兩個字的字編碼:兩個字分別取開頭部首和結尾部首(部首改為最後壹筆),是四個字母的等長碼。如果其中壹個字是帶鍵名的偏旁部首,會被當作特殊的壹個,然後加壹個O碼,以區分最後壹筆相同的偏旁部首。比如:海洋:SDSY國家:MHDB乙炔:GGHR人:ROGG幸福:TSQT勤奮:LSNL2)三個單詞的單詞編碼:第壹個單詞取前兩個部首,然後是第二個和第三個單詞的前兩個部首;如果第壹個字是偏旁,取其首偏旁和末筆;如果第壹個字是鍵名部首,取其部首代碼加o .例如:globe:TGWR;金字塔:JODT大世界:QNNT不夜城:DBTT;遊樂場:SHPT。
3)四個字以上的字:以第壹、二、三、四個字為聲母。如:統戰:YHBY,胸有成竹:YSAZ心中有計劃;AZSY中華人民共和國:KRRM諾貝爾獎:YBBJ馬列主義:MDTD馬克思列寧主義。MSTD;魯迅全集:VGRZ二十四史:ESMK達爾文理論:QBWY高能物理學:TSNW;萬裏長城:DLPT長征;DLPE .
當然,專有名詞也可以分為詞性代碼。比如“中華人民共和國”是“KSRS羅格NBHK MWDH”,翻譯成方形漢字有“中華人民共和國(KRRM)”。
在上述編碼輸入技術的基礎上,為了充分利用公知的電腦鍵盤,又選用了100個偏旁部首,用兩位數編碼代替拼音字母,排列在同壹電腦鍵盤英文鍵上部的0-9***10數字鍵上。其結構如下:號碼鍵部首部分號碼鍵部首部分號碼鍵部首部分號碼鍵部首部分號碼鍵部首部分01-(1) 02 0008 (03) () 04 06 07?( ) 08 ?6?5()09 er()10 x()11 factory()12d()13 bu(bu)14 wa 15 ba(wa÷)17÷()18÷(÷)19)56木
57狗(大狗)58壞59車()60站()61天62貝(貝類)63牛()64爪(蟑螂)65月(天)66 67文(蟑螂)68火(蟑螂)階(階4) 75田76何77白78李79分80耳(81西(西)82蟲83竹(?6?8) 84迫擊炮83 86衣服87羊(?6?2)走88英裏,89個女巫()90英裏()91英尺(?6?4) 92體,93字,94面,95面,96金,97魚,98骨,99食,00食。這種輸入技術簡稱為“全息三碼”,其編碼步驟除偏旁部首外都是唯壹的,不需要使用最後壹筆。編碼步驟均采用六種編碼輸入法。
整體來看,“全息ⅱ碼”和“全息ⅰ碼”是壹致的,都符合群眾對偏旁部首、筆順、筆畫的常識和習慣,很少使用拼音,完全適合不懂西文和拼音字母的用戶,但可以用於只有65,438+00數字鍵的較小鍵盤,也可以用於數字碼的電報碼。它的另壹個特點是色散更大,為100×100×100 = 100萬,是“全息I碼”46萬左右色散的2.2倍,可以容納更多的字,更少的重碼。
2.編碼示例:
“全息ⅲ碼”的規則與“全息ⅰ碼”基本相同,但考慮到ⅲ碼是針對壹個部首字的兩個數字碼,在同壹個拼音字中不需要用首筆畫和尾筆畫來選擇,所以用*來填空,重復的碼字也可以用*和移動來區分;括號中的變體添加了起始筆畫和連續筆畫。
(1)壹部分首字母:在6位數的第壹位和第二位打數字,然後雙擊空格鍵填空;括號中的變體添加了起始筆畫和連續筆畫。
1:01 * * * 2:09 * * * 3:30 * * * * *:23 * * * *門:42 * * * *馬:49 * * *木:56 * * *眼:74 * * *。反復敲擊空格鍵後,用冰填空:2271 * *江:7133 * *肩:3633 * *躍:4253 * *杠:5633 * *件:5667 * * (3)三個以上偏旁部首的復合詞:第壹至第六位六位數。例種:763702桂:56323華:341620朱:723718何:293762尤:161750何:160137桓:266557。438+008家庭:211657齊:410910702酒精:812701(5)字和文檔快速碼:(65438)改為第二個字的開頭)和第二個字的結尾,例如海洋:765438示例:
地球儀:370414金字塔:960137世界:571709不夜城:120504遊樂園:715009統壹戰線:480104深思熟慮:656583 * * *中華民國:371001諾貝爾獎調整部首,刪除重復代碼和功能鍵(1)調整部首。為了統壹“全息ⅰ碼”和“全息ⅱ碼”,統壹使用“100部首”的名稱。“I碼”和“II碼”可能不統壹,“I碼”可以加減部首,甚至康熙字典的214個部首,王竹溪的56個新部首,或者更少,但100個左右的部首是合適的。“II碼”的個數可以減少到100以內,保留兩位數;反之,部首和上百個常用部首可以編碼成三位數,兩個部首和部首可以編碼成六位數,三個部首和部首可以編碼成九位數。只要方便查碼,有足夠的色散就行。
如果三是071,劉是271,那麽劉就是071271(六位碼)或者071 * * 271(九位碼)。諸如此類。
(2)去重碼:無論重碼率多低,總會有壹些重字或詞。“I代碼”可以通過按0鍵並移動其位置或按1,2,3的數字鍵來復制...8,9和0。“ⅱ碼”可以用*鍵復制,復制的碼按詞頻順序排列。
(3)功能鍵:提示、糾錯,包括簡繁體、正字、異體字、不正體、中西體等。,所有這些都可以使用冗余鍵。
綜上所述,本發明具有易於推廣和壹物多用的優點。至少可以開發應用以下幾項:1。中文電腦打字、編輯、排版;
2.電報碼和電傳碼統壹為拉丁明碼,且比西方語言簡單,可由機器自動解碼成中文,可大大節省人力和成本;
3.全國郵政編碼是統壹的,每個人都可以編輯,地址的字母化與郵政編碼壹致。全國幾百個省市幾千個縣基本不重碼。省、自治區、市、縣、鄉、鎮等行政區劃:北京:SBTX上海:BHSD天津:ERSG廣州:AODS廣東:AOHX廣西:AOXH雲南:ESSS浙江:SDSG江西:SGXH江蘇:SGCB福建:QTJZ湖北:SYSB湖南:SYSS青海:FYSD河南:S. KSS海南:SDSS新疆:LDGH西藏:XHCD貴州:KBDS寧夏:DDDX臺灣省:SKSG四川:MHPS遼寧:LZDD吉林:SKMM河北:SGSB山東:SSHX山西:SSXH中外機器輔助翻譯。中國學外語,外國人學漢語,主要的困難不在於語法,而在於記憶大量的單詞。全息碼把漢字和中文單詞做成四個拉丁字母,比存儲西文更容易。有了全息碼,中國人和外國人只要在短時間內學會語法、音標規則和編碼方法,就可以在機器詞匯翻譯的幫助下進行對話交流。壹個人掌握幾種外語是很容易的。翻譯專業人士也可以省去很多查字典的功夫。
5.古代漢語和白話文的機器輔助翻譯。原理同上
6.速記。全息碼速記統壹、規範、快捷,速記排序和翻譯也可以借助機器完成,節省大量時間。
7.縮寫。使用全息編碼,1.33個拉丁字母可以代替壹個正方形漢字,可以節省大量的空間和時間。
8.圖書編目和詞典標引的全息碼規範、簡單、不重碼,可以消除難詞。
9.快速復制和縮小。原理和速記、縮寫壹樣。
10.醫藥自助咨詢,農村地區農牧漁業、商業、文化、軍政管理咨詢。比如輸入①感冒②年齡③性別④脂肪⑤體溫⑤痰液濃度和清度⑤咳嗽與否等信息,就可以輸出名醫的藥方。全息碼可用作各種咨詢漢字卡。
上述10項都與本發明將復雜的方形漢字轉換成比任何西文全息碼都多的事實有關。本發明發掘了漢字的內在美,使漢字成為科學、規範、精煉、美觀的密集碼,從而成為東西方文明大交流的宏偉橋梁。