精品欧美无遮挡一区二区三区在线观看,中文字幕一区二区日韩欧美,久久久久国色αv免费观看,亚洲熟女乱综合一区二区三区

        ? 首頁 ? 理論教育 ?漢字信息的輸入

        漢字信息的輸入

        時(shí)間:2023-03-05 理論教育 版權(quán)反饋
        【摘要】:(一)漢字的鍵盤輸入漢字的鍵盤輸入是目前應(yīng)用最廣泛的輸入方式,相應(yīng)的軟件處理技術(shù)也最為成熟。漢字編碼方案的優(yōu)劣成為影響漢字編碼輸入方式最重要的因素。根據(jù)抽取漢字信息特征的不同,漢字編碼方案可分為音碼、形碼、音形結(jié)合碼三類。形碼著眼于漢字形體,有效地避免了同音字的問題,因此輸入速度大大提高。根據(jù)上述要求優(yōu)選制訂出最佳方案推廣試用,在試用中進(jìn)一步完善,從而形成漢字輸入編碼方案的國(guó)家標(biāo)準(zhǔn)。
        漢字信息的輸入_現(xiàn)代漢語通論 第三版 上冊(cè)

        (一)漢字的鍵盤輸入

        漢字的鍵盤輸入是目前應(yīng)用最廣泛的輸入方式,相應(yīng)的軟件處理技術(shù)也最為成熟。

        漢字鍵盤輸入方式大體上經(jīng)歷了三個(gè)發(fā)展階段:整字輸入法、漢字編碼輸入法、漢語拼音輸入法。

        1.整字輸入法是把整個(gè)漢字作為輸入符號(hào)。一般是把幾千個(gè)漢字按照一定的順序排列在一個(gè)大鍵盤上,使用者用鍵盤擊打或電筆點(diǎn)觸輸入。這種大鍵盤輸入方式的優(yōu)點(diǎn)是一字一鍵,無重碼,直觀性好,操作簡(jiǎn)單;缺點(diǎn)是需要特制鍵盤,速度較慢,設(shè)備笨重,成本昂貴,難以普及。

        2.漢字編碼輸入法是把每個(gè)漢字編成一個(gè)代碼,然后利用國(guó)際通用小鍵盤把代碼輸入計(jì)算機(jī)。這種輸入法需要進(jìn)行專門的學(xué)習(xí)和訓(xùn)練,優(yōu)點(diǎn)是速度快、重碼少,但是對(duì)于用計(jì)算機(jī)進(jìn)行寫作的人來說,由于加上了思考編碼的負(fù)擔(dān),寫作過程不斷受到干擾,使用起來十分不便。

        漢字編碼方案的優(yōu)劣成為影響漢字編碼輸入方式最重要的因素。根據(jù)抽取漢字信息特征的不同,漢字編碼方案可分為音碼、形碼、音形結(jié)合碼三類。

        (1)音碼

        音碼是按照漢字字音編碼輸入的設(shè)計(jì)。音碼輸入實(shí)際上是一種拼音轉(zhuǎn)換法,即利用現(xiàn)行的漢語拼音方案輸入拼音,把漢字轉(zhuǎn)換成國(guó)際通用的拼音編碼輸入計(jì)算機(jī),再由計(jì)算機(jī)自動(dòng)轉(zhuǎn)換為漢字。拼音編碼輸入法在具體實(shí)施中有兩種不同的方案:一種是全拼式,一種是雙拼式。全拼式依漢語拼音字母的順序編排,以字母為單位逐個(gè)輸入。這種方案的擊鍵次數(shù)較多,包括輔助標(biāo)識(shí)符在內(nèi),最多時(shí)一個(gè)漢字要擊鍵7—8次,平均約4—5次。雙拼式依聲母、韻母的順序編排,以聲母和韻母為單位逐個(gè)輸入。為此鍵盤上的鍵位必須按聲母、韻母重新設(shè)計(jì)。這種方案的擊鍵次數(shù)較少,包括輔助標(biāo)識(shí)在內(nèi),最多一個(gè)漢字擊鍵3—4次,平均不超過3次。全拼式符合規(guī)范的漢語拼音書寫方法,雙拼式則根據(jù)編碼設(shè)計(jì)者的設(shè)計(jì)確定。

        音碼的優(yōu)點(diǎn)在于它可以使用計(jì)算機(jī)上的通用鍵盤,并且只要使用者基本掌握漢語拼音方案和普通話語音即可進(jìn)行操作,不需要專門培訓(xùn)。缺點(diǎn)在于同音字需要二次選擇,影響輸入速度。目前已有多種音碼實(shí)現(xiàn)“字為基礎(chǔ),詞為主導(dǎo)”,以詞定字,在一個(gè)有限的范圍內(nèi)解決了同音字的問題。

        (2)形碼

        形碼是按照漢字字形編碼輸入的設(shè)計(jì)。它將漢字的形體分解為若干字元(例如筆畫、部件、偏旁、部首),再利用字元代碼表和字元排列順序規(guī)則得到漢字編碼,然后在鍵盤上輸入。影響較大的有五筆字型輸入法、筆形編碼法等。形碼著眼于漢字形體,有效地避免了同音字的問題,因此輸入速度大大提高。其缺點(diǎn)在于掌握字形編碼方案需要專門訓(xùn)練;并且大部分形碼輸入設(shè)計(jì)對(duì)漢字字形的拆分規(guī)則和編碼規(guī)則與人們對(duì)漢字原有的認(rèn)知結(jié)構(gòu)不相吻合,即犧牲了輸入設(shè)計(jì)的“易學(xué)性”。常見的字形編碼方案有筆形編碼、部件編碼、部首編碼和四角編碼等四種。

        1)筆形編碼以李金鎧的八筆編碼為代表,采用漢字的基本筆畫作為輸入單位,即把筆形分成若干種,并分別給以確定的代碼。問題是遇到筆畫多的字,碼字較長(zhǎng),相應(yīng)的擊鍵次數(shù)就多,不太實(shí)用。

        2)部件編碼以王永民的五筆字型碼為代表,即把每個(gè)漢字分解成部件序列,再把這些部件轉(zhuǎn)換成對(duì)應(yīng)的數(shù)字或拉丁字母,得出代碼序列。優(yōu)點(diǎn)是碼元少,重碼率低,熟練后輸入速度快;缺點(diǎn)是記憶負(fù)擔(dān)重,部件切分不合常用規(guī)范,詞庫比較小。

        3)部首編碼以王安三角編碼為代表,優(yōu)點(diǎn)是規(guī)則較簡(jiǎn)單,重碼較少,但基本字元代碼數(shù)較多,不便記憶。此外還有臺(tái)灣的天龍倉頡編碼方案,該方案規(guī)則較復(fù)雜,使用不太方便,輸入速度較慢,而且重碼也較多。

        4)四角編碼就是直接用王云五的四角號(hào)碼作為漢字編碼,優(yōu)點(diǎn)是碼長(zhǎng)較短,但數(shù)碼不易一次認(rèn)準(zhǔn),重碼也較多,必須附加一定標(biāo)識(shí)符來區(qū)分重碼字。

        (3)音形結(jié)合碼

        為了克服形碼和音碼各自的缺點(diǎn),形音結(jié)合的輸入法應(yīng)運(yùn)而生。這類編碼方案又可分為兩種:一種是以字形為主字音為輔的形音碼,一種是以字音為主字形為輔的音形碼。形音碼與純形碼的不同在于還要利用某些字音信息,即在形碼上附加音碼。其中最有代表性的是支秉彝的“見字識(shí)碼”方案。形碼大都采用部件、偏旁、部首的信息,也有采用起筆、末筆信息或語義類別信息的。在實(shí)際操作過程中,音形信息的轉(zhuǎn)換往往影響使用者思想的連貫性。

        上述各種編碼方案,各具優(yōu)點(diǎn),也各有不足。形碼的優(yōu)點(diǎn)是按形取碼,不涉及字音,因此不認(rèn)識(shí)的字也同樣可以編碼輸入,輸入速度較快;但漢字形體結(jié)構(gòu)復(fù)雜,分解標(biāo)準(zhǔn)不一,主觀隨意性太強(qiáng),因而不少方案規(guī)則較多,難于掌握。音碼的優(yōu)點(diǎn)是簡(jiǎn)單易學(xué),可以盲打,缺點(diǎn)是不認(rèn)識(shí)的字輸入較困難,同音字較難處理。從目前的應(yīng)用情況看,會(huì)說普通話、懂漢語拼音的人愛用音碼,操方言者多根據(jù)自己的興趣愛好選用某種形碼。

        (4)漢字編碼方案的標(biāo)準(zhǔn)化

        漢字編碼方案的標(biāo)準(zhǔn)化,即一般所說的選優(yōu)工作。目前國(guó)內(nèi)各計(jì)算機(jī)使用部門采用的輸入編碼方案各不相同。內(nèi)地多用GB碼,臺(tái)灣多用BIG碼,香港、澳門情況不一,各種碼都在使用。關(guān)于選優(yōu)的評(píng)定標(biāo)準(zhǔn)主要有四條:1)基本符號(hào)少,能實(shí)現(xiàn)盲打;2)規(guī)則簡(jiǎn)單易記,操作方便易學(xué);3)一字一碼,沒有重碼;4)輸入和處理效率高,設(shè)備經(jīng)濟(jì)實(shí)用。根據(jù)上述要求優(yōu)選制訂出最佳方案推廣試用,在試用中進(jìn)一步完善,從而形成漢字輸入編碼方案的國(guó)家標(biāo)準(zhǔn)。

        3.漢語拼音輸入法的優(yōu)越性。漢語拼音輸入是以漢語拼音連續(xù)輸入為手段,而由計(jì)算機(jī)自動(dòng)轉(zhuǎn)換為漢字的一種計(jì)算機(jī)漢字處理技術(shù)。

        (1)不需要編碼規(guī)則。漢語拼音輸入法是一種無編碼方案,使用者無須記憶編碼規(guī)則,只要掌握漢語拼音和普通話,就能應(yīng)用自如。

        (2)體現(xiàn)語言中以詞為單位的特點(diǎn)。它的詞庫里貯存大量現(xiàn)代漢語的詞匯,詞匯之間可以自動(dòng)切換,這樣就在很大程度上彌補(bǔ)了同音字多的不足。

        (3)輸入與思維同步進(jìn)行。漢語拼音輸入法要求人們向計(jì)算機(jī)輸入規(guī)范的漢語拼音,實(shí)質(zhì)上是要求人們?cè)阪I盤上使用漢語拼音來書寫普通話,把寫作者的思想直接表達(dá)出來。這一點(diǎn)對(duì)使用電腦寫作的人來說,具有特別意義。

        (4)有利于學(xué)習(xí)普通話和漢語拼音。應(yīng)用漢語拼音輸入法一般不需要經(jīng)過特別培訓(xùn),相反地還可以進(jìn)一步幫助人們學(xué)好普通話和漢語拼音。

        (5)有利于國(guó)際的信息交流。漢語拼音已經(jīng)成為國(guó)際標(biāo)準(zhǔn),因此,外國(guó)人同樣可以使用漢語拼音輸入法來操作計(jì)算機(jī),在信息網(wǎng)絡(luò)上獲取他們所需要的漢語漢字信息。任何漢字字形編碼都無法取代漢語拼音這一重要作用。

        漢語拼音輸入法符合我國(guó)國(guó)策,是發(fā)展方向,但在實(shí)際應(yīng)用中還存在一些問題,需要逐步解決,使之日趨完善。其中減少同音選擇是完善漢語拼音輸入法的關(guān)鍵。實(shí)踐經(jīng)驗(yàn)告訴我們,“以詞定字”“高頻先見”和“用過提前”是根據(jù)漢語內(nèi)在規(guī)律總結(jié)出來的減少同音選擇的好方法。

        (二)漢字的字形識(shí)別輸入

        采用鍵盤輸入方式,要靠操作人員擊鍵輸入,速度較慢,工作量也大。如果能讓計(jì)算機(jī)自動(dòng)識(shí)別漢字,將會(huì)極大地提高整個(gè)計(jì)算機(jī)系統(tǒng)的效率。

        漢字的字形識(shí)別輸入就是通過特定的文圖掃描裝置,對(duì)印刷在紙上或?qū)懺诩埳希ɑ蚱渌牧仙希┑臐h字字符進(jìn)行分類判別。它用光學(xué)字符識(shí)別器“掃描儀”抽取漢字字形特征,將紙面上的漢字信息轉(zhuǎn)換成離散的電信號(hào),然后再送入計(jì)算機(jī)識(shí)別,形成漢字內(nèi)部碼。漢字識(shí)別在學(xué)科上屬于模式識(shí)別和人工智能范疇,在應(yīng)用上屬于漢字信息處理系統(tǒng)的一種高速輸入方式。

        目前比較成熟的識(shí)別方法有圖形匹配法和結(jié)構(gòu)分析法兩種。圖形匹配法就是將輸入的待識(shí)別的漢字圖形跟存儲(chǔ)在計(jì)算機(jī)內(nèi)的標(biāo)準(zhǔn)漢字圖形直接進(jìn)行配比,求出它們的相似度。跟待識(shí)別字相似度最大的標(biāo)準(zhǔn)漢字就是機(jī)器尋求的答案。結(jié)構(gòu)分析法首先要通過對(duì)漢字圖形結(jié)構(gòu)的分析提取漢字的特征量,然后根據(jù)待識(shí)別字的特征量跟存儲(chǔ)在機(jī)器內(nèi)的標(biāo)準(zhǔn)漢字的相應(yīng)特征量之間的距離來判定漢字字種的歸屬。

        漢字字形識(shí)別可以分為印刷體漢字自動(dòng)識(shí)別和手寫體漢字自動(dòng)識(shí)別兩類。印刷體漢字自動(dòng)識(shí)別是國(guó)內(nèi)漢字識(shí)別研究的主流,手寫體漢字識(shí)別又可分為聯(lián)機(jī)和脫機(jī)兩種。

        (三)漢字的語音識(shí)別輸入

        漢字的語音識(shí)別輸入就是通過與計(jì)算機(jī)連接的傳聲裝置,利用語音分析技術(shù),抽取語音特征參數(shù),由計(jì)算機(jī)進(jìn)行辨識(shí)并形成漢字內(nèi)部碼。語音識(shí)別的原理是把語音先根據(jù)語法規(guī)則切詞,根據(jù)語音規(guī)則切音段,再根據(jù)語境、語用和語義規(guī)則辨別詞句。語音識(shí)別在學(xué)科上屬于模式識(shí)別和人工智能范疇,在應(yīng)用上屬于漢字信息處理系統(tǒng)的一種人機(jī)交互自動(dòng)輸入方式。

        根據(jù)輸入者的身份,語音識(shí)別可以分為特定人的語音識(shí)別和非特定人的語音識(shí)別兩類。根據(jù)輸入者的發(fā)音方式,語音識(shí)別又可分為孤立詞語音識(shí)別和連續(xù)語音識(shí)別兩類。

        漢字語音識(shí)別輸入,不需要事先進(jìn)行復(fù)雜的專門訓(xùn)練,不需要記憶大量的編碼規(guī)則,也不需要進(jìn)行鍵指法練習(xí),只要會(huì)說普通話或不太標(biāo)準(zhǔn)的普通話,就可以輸入漢字,使?jié)h字輸入工作能以普及化的方式進(jìn)行。

        免責(zé)聲明:以上內(nèi)容源自網(wǎng)絡(luò),版權(quán)歸原作者所有,如有侵犯您的原創(chuàng)版權(quán)請(qǐng)告知,我們將盡快刪除相關(guān)內(nèi)容。

        我要反饋