導航:首頁 > 電腦系統 > 電腦字體編碼用哪個

電腦字體編碼用哪個

發布時間:2022-10-24 11:01:54

㈠ 漢字在電腦上是怎麼編碼的

所謂編碼,是以固定的順序排列字元,並以此做為記錄、存貯、傳遞、交換的統一 內部特徵,這個字元排列順序被稱為「編碼」。 字型檔的編碼是字型檔組織的依據,也是文字處理的基礎。不同國家和地區有不同的編 碼標准,和中文字型檔有關的常見編碼有:單位元組編碼、GB2312-80、GB12345-90、GBK、U nicode編碼、ISO10646 / Unicode字元集、GB18030-2000、BIG5編碼,下面簡要介紹一 下: 單位元組編碼 MS Windows:Windows Latin 1(ANSI) MS-DOS:MS-DOS Latin US Macintosh:Macintosh Roman GB2312-80 全稱是GB2312-80《信息交換用漢字編碼字元集 基本集》,1980年發布,是中文信 息處理的國家標准,在大陸及海外使用簡體中文的地區(如新加坡等)是強制使用的唯 一中文編碼。P-Windows3.2和蘋果OS就是以GB2312為基本漢字編碼, Windows 95/98則 以GBK為基本漢字編碼、但兼容支持GB2312。 雙位元組編碼 范圍:A1A1~FEFE A1-A9:符號區,包含682個符號 B0-F7:漢字區,包含6763個漢字 GB碼共收錄6763個簡體漢字、682個符號,其中漢字部分:一級字3755,以拼音排 序,二級字3008,以偏旁排序。該標準的制定和應用為規范、推動中文信息化進程起了 很大作用。 GB12345-90 1990年制定了繁體字的編碼標准GB12345-90《信息交換用漢字編碼字元集 第一輔助 集》,目的在於規范必須使用繁體字的各種場合,以及古籍整理等。該標准共收錄6866 個漢字(比GB2312多103個字,其它廠商的字型檔大多不包括這些字),純繁體的字大概有 2200餘個。 雙位元組編碼 范圍:A1A1~FEFE A1-A9:符號區,增加豎排符號 B0-F9:漢字區,包含6866個漢字 Unicode編碼(Universal Multiple Octet Coded Character Set) 國際標准組織於1984年4月成立ISO/IEC JTC1/SC2/WG2工作組,針對各國文字、符號 進行統一性編碼。1991年美國跨國公司成立Unicode Consortium,並於1991年10月與WG2 達成協議,採用同一編碼字集。目前Unicode是採用16位編碼體系,其字元集內容與ISO1 0646的BMP(Basic Multilingual Plane)相同。Unicode於1992年6月通過DIS(Draf International Standard),目前版本V2.0於1996公布,內容包含符號6811個,漢字209 02個,韓文拼音11172個,造字區6400個,保留20249個,共計65534個。 ISO10646 / Unicode字元集 全球可以共享的編碼字元集。 UCS-4:組八位 平面八位 行八位 字位八位 UCS-2:00組中的00平面是基本多文種平面(BMP),4E00~9FFF 中日韓文字 Ext A(CJK):3400~4DB7,共6584字 Ext B(CJK):42,807個漢字,在第2平面的0100~A836 GBK編碼(Chinese Internal Code Specification) GBK編碼是中國大陸制訂的、等同於UCS的新的中文編碼擴展國家標准。GBK工作小組 於1995年10月,同年12月完成GBK規范。該編碼標准兼容GB2312,共收錄漢字21003個、 符號883個,並提供1894個造字碼位,簡、繁體字融於一庫。 Windows95/98簡體中文版的字型檔表層編碼就採用的是GBK,通過GBK與UCS之間一一對應的 碼表與底層字型檔聯系。 英文名:Chinese Internal Code Specification 中文名:漢字內碼擴展規范1.0版 雙位元組編碼,GB2312-80的擴充,在碼位上和GB2312-80兼容 范圍:8140~FEFE(剔除xx7F)共23940個碼位 包含21003個漢字,包含了ISO/IEC 10646-1中的全部中日韓漢字 GB18030-2000 英文名:Chinese Internal Code Specification 中文名:信息技術 信息交換用漢字編碼字元集 基本集的擴充( 2000-03-17發布和實施) 單位元組、雙位元組、四位元組編碼 向下與國家標准GB 2312信息處理交換碼所對應的事實上的內碼標准兼容。 在字匯上支持GB 13000.1的全部中、日、韓(CJK)統一漢字字元和全部CJK統一漢字擴 充A的字元。 BIG5編碼 是目前台灣、香港地區普遍使用的一種繁體漢字的編碼標准,包括440個符號,一級 漢字5401個、二級漢字7652個,共計13060個漢字。

㈡ 在計算機中,漢字採用什麼碼存放。

機內碼。計算機只識別由0、1組成的代碼,ASCII碼是英文信息處理的標准編碼,漢字信息處理也必須有一個統一的標准編碼。 漢字交換碼(國標碼)主要用於漢字信息交換,《信息交換用漢字編碼字元集——基本集》,代號為GB2312-80,共對6763個漢字和682個圖形字元進行了編碼。

國標碼是漢字信息交換的標准編碼,但因其前後位元組的最高位為0,與ASCII碼發生沖突,國標碼是不可能在計算機內部直接採用的,於是,漢字的機內碼採用變形國標碼,其變換方法為:將國標碼的每個位元組都加上128,即將兩個位元組的最高位由0改1,其餘7位不變。

(2)電腦字體編碼用哪個擴展閱讀

漢字用兩個位元組表示,原則上,兩個位元組可以表示 256×256=65536 種不同的符號,作為漢字編碼表示的基礎是可行的。但考慮到漢字編碼與其它國際通用編碼,如ASCII 西文字元編碼的關系,我國國家標准局採用了加以修正的兩位元組漢字編碼方案,只用了兩個位元組的低7位。

這個方案可以容納 128×128=16384 種不同的漢字,但為了與標准ASCII碼兼容,每個位元組中都不能再用32個控制功能碼和碼值為32的空格以及127的操作碼。所以每個位元組只能有94個編碼。這樣,雙七位實際能夠表示的字數是:94×94=8836個。

㈢ 在計算機內部處理漢字時,都是使用___ 碼進行的

在電腦內部對漢字進行傳輸處理和存儲時使用漢字的機內碼。
電腦內部漢字信息的存儲運算的代碼有四種:輸入碼、國標碼、內碼和字型碼。
輸入碼:包括拼音編碼和字型編碼。微軟拼音ABC就是拼音編碼,五筆字型輸入法就是字型編碼。
國標碼:又稱為漢字交換碼,在計算機之間交換信息用。用兩個位元組來表示,每個位元組的最高位均為0,因此可以表示的漢字數為2的14次冪,就是16384個。將漢字區位碼的高位位元組、低位位元組各加十進制數32(即十六進制數的20),便得到國標碼。例如「中」字的國標碼為8680(十進制)或7468(十六進制)。
內碼:漢字內碼是在設備和信息處理系統內部存儲、處理、傳輸漢字用的代碼。無論使用何種輸入碼,進入計算機後就立即被轉換為機內碼。規則是將國標碼的高位位元組、低位位元組各自加上128(十進制)或80(十六進制)。例如,「中」字的內碼以十六進製表示時應為F4E8。這樣做的目的是使漢字內碼區別於西文的ASCII,因為每個西文字母的ASCII的高位均為0,而漢字內碼的每個位元組的高位均為1。
字型碼:表示漢字字形的字模數據,因此也稱為字模碼,是漢字的輸出形式。通常用點陣、矢量函數等表示。用點陣表示時,字形碼指的就是這個漢字字形點陣的代碼。根據輸出漢字的要求不同,點陣的多少也不同。簡易型漢字為16′16點陣、提高型漢字為24′24點陣、48′48點陣等。如果是24′24點陣,每行24個點就是24個二進制位,存儲一行代碼需要3個位元組。那麼,24行共佔用3′24=72個位元組。計算公式:每行點數/8′行數。依此,對於48′48的點陣,一個漢字字形需要佔用的存儲空間為48/8′48=6′48=288個位元組。

㈣ 在計算機系統內部使用的漢字編碼是_____

機內碼。

漢字機內碼,又稱「漢字ASCII碼」,簡稱「內碼」,指計算機內部存儲,處理加工和傳輸漢字時所用的由0和1符號組成的代碼。輸入碼被接受後就由漢字操作系統的「輸入碼轉換模塊」轉換為機內碼,與所採用的鍵盤輸入法無關。

機內碼是漢字最基本的編碼,不管是什麼漢字系統和漢字輸入方法,輸入的漢字外碼到機器內部都要轉換成機內碼,才能被存儲和進行各種處理。

(4)電腦字體編碼用哪個擴展閱讀

漢字進入計算機的三種途徑分別為:

1、機器自動識別漢字

計算機通過「視覺」裝置(光學字元閱讀器或其他),用光電掃描等方法識別漢字。

2、通過語音識別輸入

計算機利用人們給它配備的「聽覺器官」,自動辨別漢語語音要素,從不同的音節中找出不同的漢字,或從相同音節中判斷出不同漢字。

3、通過漢字編碼輸入

根據一定的編碼方法,由人藉助輸入設備將漢字輸入計算機。

機器自動識別漢字和漢語語音識別,國內外都在研究,雖然取得了不少進展,但由於難度大,預計還要經過相當一段時間才能得到解決。在現階段,比較現實的就是通過漢字編碼方法使漢字進入計算機。

㈤ 辦公軟體中的字體在操作系統中有對應的字體文件字體文件中存放的漢字編碼是什麼

以簡體中文來講,不管使用哪種字體,都不會改變字本身,只是改變字形,就是說,比如文字「漢」,不管使用哪種簡體中文字體,它還是「漢」,只是字形(字體)不同,它不會變成「文」、「化」等其他字。這就意味著這些字體採用了相同的漢字編碼,使輸入的代碼與唯一的漢字對應,不同的只是這個漢字的字形。

目前使用比較廣泛的漢字編碼標準是GB2312,基於此編碼標准,有著多種字體庫,如宋體_GB2312、仿宋_GB2312。現行的GB2312是中國國家標准總局於1980年發布的漢字字元集國家標准編碼,GB是國標的意思,相應的編碼稱為國標碼,或GB碼。目前使用的GB2312標准號為GB 2312-1980。GB2312編碼通行於我國內地;新加坡等地也採用此編碼。幾乎所有的中文系統和國際化的軟體都支持GB 2312。

GB2312 字元編碼分布表

當然不同國家和地區、不同語言系統使用的編碼會有不同,具體根據相應的字元集而定。比如英語字元比較少,可以使用ASCII編碼,國內漢字使用GB2312編碼,台灣省、香港特別行政區與澳門特別行政區使用繁體的Big5編碼,還有世界多語言通用的Unicode編碼和UTF-8編碼等。

以上,希望能幫上忙!

㈥ 為什麼公文都要用「仿宋GB2312」的字體

公文都要用“仿宋GB2312”的原因是:2012年國家發布公文要求的時候電腦內置的仿宋字體就是仿宋GB2312 。

㈦ windows操作系統unicode文本編碼格式是UTF-8還是UTF-16現在的系統

什麼是 Unicode? 歷史上, 有兩個獨立的, 創立單一字元集的嘗試. 一個是國際標准化組織(ISO)的 ISO 10646 項目, 另一個是由(一開始大多是美國的)多語言軟體製造商組成的協會組織的 Unicode 項目. 幸運的是, 1991年前後, 兩個項目的參與者都認識到, 世界不需要兩個不同的單一字元集. 它們合並雙方的工作成果, 並為創立一個單一編碼表而協同工作. 兩個項目仍都存在並獨立地公布各自的標准, 但 Unicode 協會和 ISO/IEC JTC1/SC2 都同意保持 Unicode 和 ISO 10646 標準的碼表兼容, 並緊密地共同調整任何未來的擴展. Unicode vs ISO 10646 Unicode 協會公布的 Unicode 標准 嚴密地包含了 ISO 10646-1 實現級別3的基本多語言面. 在兩個標准里所有的字元都在相同的位置並且有相同的名字. Unicode 標准額外定義了許多與字元有關的語義符號學, 一般而言是對於實現高質量的印刷出版系統的更好的參考. Unicode 詳細說明了繪制某些語言(比如阿拉伯語)表達形式的演算法, 處理雙向文字(比如拉丁與希伯來文混合文字)的演算法和 排序與字元串比較 所需的演算法, 以及其他許多東西. 另一方面, ISO 10646 標准, 就象廣為人知的 ISO 8859 標准一樣, 只不過是一個簡單的字元集表. 它指定了一些與標准有關的術語, 定義了一些編碼的別名, 並包括了規范說明, 指定了怎樣使用 UCS 連接其他 ISO 標準的實現, 比如 ISO 6429 和 ISO 2022. 還有一些與 ISO 緊密相關的, 比如 ISO 14651 是關於 UCS 字元串排序的. 考慮到 Unicode 標准有一個易記的名字, 且在任何好的書店裡的 Addison-Wesley 里有, 只花費 ISO 版本的一小部分, 且包括更多的輔助信息, 因而它成為使用廣泛得多的參考也就不足為奇了. 然而, 一般認為, 用於列印 ISO 10646-1 標準的字體在某些方面的質量要高於用於列印 Unicode 2.0的. 專業字體設計者總是被建議說要兩個標准都實現, 但一些提供的樣例字形有顯著的區別. ISO 10646-1 標准同樣使用四種不同的風格變體來顯示表意文字如中文, 日文和韓文 (CJK), 而 Unicode 2.0 的表裡只有中文的變體. 這導致了普遍的認為 Unicode 對日本用戶來說是不可接收的傳說, 盡管是錯誤的. UTF-8 首先 UCS 和 Unicode 只是分配整數給字元的編碼表. 現在存在好幾種將一串字元表示為一串位元組的方法. 最顯而易見的兩種方法是將 Unicode 文本存儲為 2 個 或 4 個位元組序列的串. 這兩種方法的正式名稱分別為 UCS-2 和 UCS-4. 除非另外指定, 否則大多數的位元組都是這樣的(Bigendian convention). 將一個 ASCII 或 Latin-1 的文件轉換成 UCS-2 只需簡單地在每個 ASCII 位元組前插入 0x00. 如果要轉換成 UCS-4, 則必須在每個 ASCII 位元組前插入三個 0x00. 在 Unix 下使用 UCS-2 (或 UCS-4) 會導致非常嚴重的問題. 用這些編碼的字元串會包含一些特殊的字元, 比如 '\0' 或 '/', 它們在 文件名和其他 C 庫函數參數里都有特別的含義. 另外, 大多數使用 ASCII 文件的 UNIX 下的工具, 如果不進行重大修改是無法讀取 16 位的字元的. 基於這些原因, 在文件名, 文本文件, 環境變數等地方, UCS-2 不適合作為 Unicode 的外部編碼. 在 ISO 10646-1 Annex R 和 RFC 2279 里定義的 UTF-8 編碼沒有這些問題. 它是在 Unix 風格的操作系統下使用 Unicode 的明顯的方法. UTF-8 有一下特性: UCS 字元 U+0000 到 U+007F (ASCII) 被編碼為位元組 0x00 到 0x7F (ASCII 兼容). 這意味著只包含 7 位 ASCII 字元的文件在 ASCII 和 UTF-8 兩種編碼方式下是一樣的. 所有 >U+007F 的 UCS 字元被編碼為一個多個位元組的串, 每個位元組都有標記位集. 因此, ASCII 位元組 (0x00-0x7F) 不可能作為任何其他字元的一部分. 表示非 ASCII 字元的多位元組串的第一個位元組總是在 0xC0 到 0xFD 的范圍里, 並指出這個字元包含多少個位元組. 多位元組串的其餘位元組都在 0x80 到 0xBF 范圍里. 這使得重新同步非常容易, 並使編碼無國界, 且很少受丟失位元組的影響. 可以編入所有可能的 231個 UCS 代碼 UTF-8 編碼字元理論上可以最多到 6 個位元組長, 然而 16 位 BMP 字元最多隻用到 3 位元組長. Bigendian UCS-4 位元組串的排列順序是預定的. 位元組 0xFE 和 0xFF 在 UTF-8 編碼中從未用到. 下列位元組串用來表示一個字元. 用到哪個串取決於該字元在 Unicode 中的序號. U-00000000 - U-0000007F: 0xxxxxxx U-00000080 - U-000007FF: 110xxxxx 10xxxxxx U-00000800 - U-0000FFFF: 1110xxxx 10xxxxxx 10xxxxxx U-00010000 - U-001FFFFF: 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx U-00200000 - U-03FFFFFF: 111110xx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx U-04000000 - U-7FFFFFFF: 1111110x 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx xxx 的位置由字元編碼數的二進製表示的位填入. 越靠右的 x 具有越少的特殊意義. 只用最短的那個足夠表達一個字元編碼數的多位元組串. 注意在多位元組串中, 第一個位元組的開頭"1"的數目就是整個串中位元組的數目. 例如: Unicode 字元 U+00A9 = 1010 1001 (版權符號) 在 UTF-8 里的編碼為: 11000010 10101001 = 0xC2 0xA9 而字元 U+2260 = 0010 0010 0110 0000 (不等於) 編碼為: 11100010 10001001 10100000 = 0xE2 0x89 0xA0 這種編碼的官方名字拼寫為 UTF-8, 其中 UTF 代表 UCS Transformation Format. 請勿在任何文檔中用其他名字 (比如 utf8 或 UTF_8) 來表示 UTF-8, 當然除非你指的是一個變數名而不是這種編碼本身.

㈧ 字體那麼多,為何公文一定要採用GB2312字體

公文使用仿宋GB2312的是正文,這個規定來自於國家標准《黨政機關公文格式》。按照標准來說的話,不符合這個公文的格式,就是不合格的。在這種情況下,不用也不行。不過這個字體,並不是特別好,是早期的規定。很多系統中,已經不自帶仿宋GB2312,屬於過時代的字體。裡面的字少、字體不夠正規,在經過加粗或者其他操作後,還有可能會變得模糊。

3、字體的問題

其實不僅僅是公文,還有很多東西都是這樣。比如給印刷廠的文件,版本過高的格式他們就會告訴你打不開。相應的標准應該進行升級,推出新的字體規定。電腦系統自帶的字體中,有很多已經不存在仿宋3號字,可見它真的跟不上時代。早期的漢字編碼字元集是1980,只有六千多個漢字,而2000標准已經包含27000左右的漢字,差距明顯。

㈨ 計算機中應用最普遍的字元編碼是

微型計算機中使用最普遍的字元編碼是ASCII碼,用於微型機。

使用7 位二進制數(剩下的1位二進制為0)來表示所有的大寫和小寫字母,數字0 到9、標點符號,以及在美式英語中使用的特殊控制字元 。

ASCII(American Standard Code for Information Interchange,美國標准信息交換代碼)是基於拉丁字母的一套電腦編碼系統,主要用於顯示現代英語和其他西歐語言。

常見ASCII碼的大小規則:

0~9<A~Z<a~z。

1)數字比字母要小。如 「7」<「F」。

2)數字0比數字9要小,並按0到9順序遞增。如 「3」<「8」。

3)字母A比字母Z要小,並按A到Z順序遞增。如「A」<「Z」。

與電腦字體編碼用哪個相關的資料

熱點內容
學習機可以當平板電腦用嗎 瀏覽:732
2手電筒腦主機玩wow多少錢 瀏覽:599
電腦出現正在安裝新鍵盤怎麼辦 瀏覽:626
電腦總是開機之後過幾分鍾就重啟 瀏覽:899
電腦黑屏小鳥壁紙 瀏覽:674
電腦w10系統怎麼收費的 瀏覽:7
手機圖片傳到電腦需要用哪個軟體 瀏覽:504
電腦c盤亂碼文件怎麼刪除 瀏覽:805
電腦上隱藏文件夾的方法有哪些 瀏覽:53
電腦復制用鍵盤按哪個鍵復制 瀏覽:644
長虹手機平板電腦 瀏覽:121
怎麼打斷電腦恢復出廠設置 瀏覽:528
電腦上如何下載建行 瀏覽:92
廣場舞舞曲免費網站 瀏覽:393
電腦端剪映怎樣設置視頻尺寸 瀏覽:957
蘋果電腦寄的郵件怎麼用 瀏覽:859
安裝電腦會卡死嗎 瀏覽:613
用指令查詢電腦操作系統 瀏覽:476
華碩同步燈效電腦配置 瀏覽:641
電腦開機自動生成網頁 瀏覽:609