`
output
  • 浏览: 16503 次
  • 性别: Icon_minigender_1
  • 来自: 海口
社区版块
存档分类
最新评论

打印常见字符集的字符和对应的十进制、二进制编码

阅读更多

打印常见字符集( 'ASCII', 'GB2312', 'GBK', 'UTF-8','SHIFT-JIS' ) 的

十进制--字符--二进制对照表   (使用Groovy批处理)

 

package li.kang.wang.charset

def charsets = [
    'ASCII', 'GB2312', 'GBK', 'UTF-8','SHIFT-JIS'
] as String[];

print("开始执行\n\n");

for(charset in charsets){
    long beginTime;
    String tempStr = "";
    
    File fileOutput = new File("D:\\Charset" + charset + ".txt");
    
    if(fileOutput.exists()){
        fileOutput.delete();
    }            
    fileOutput.createNewFile();
    
    beginTime = System.currentTimeMillis();
    
    tempStr += "Decimal \t-> Char     -> Binary\n";
    for(int i=0; i <= 20000;i++){
        tempStr += ( i + " \t-> " + ((char)i) + "    " + " -> " + Integer.toBinaryString(i) + "\n");
    }            
    fileOutput.write(tempStr , charset);
    
    println("================\t" + charset + "\t\t================");
    println("消耗时间(秒):" + ( System.currentTimeMillis()  - beginTime)/ 1000);
    println "文件大小(KB): " +  (fileOutput.size()/1024);
}

print("\n执行完毕");

 Console:

开始执行

================	ASCII		================
消耗时间(秒):92.651
文件大小(KB): 640.810546875
================	GB2312		================
消耗时间(秒):56.251
文件大小(KB): 641.404296875
================	GBK		================
消耗时间(秒):54.602
文件大小(KB): 641.5419921875
================	UTF-8		================
消耗时间(秒):55.853
文件大小(KB): 677.75
================	SHIFT-JIS		================
消耗时间(秒):55.27
文件大小(KB): 641.25

执行完毕

 输出文件:


  

 

到19965后才有汉字编码, 各种字符集对照:

 

1.ASCII

 

2.GB2312

 

3.GBK

 

4.UTF-8

 

5.SHIFT-JIS

  • 大小: 25.1 KB
  • 大小: 59.4 KB
  • 大小: 123.3 KB
  • 大小: 111.1 KB
  • 大小: 127.2 KB
  • 大小: 131.4 KB
  • 大小: 136 KB
13
15
分享到:
评论

相关推荐

    进制和ASCII码转换

    十进制、十六进制、二进制和ASCII码相互转换。编译环境VS2008,项目属性字符集为“未设置”。

    数据库服务器字符集更改步骤

    看第二和第三个字节组成的十六进制数是多少可判断导出文件的字符集。 示例如下 #cat example.dmp | od -x | head 0000000 0303 5445 5850 4f52 543a 5630 392e 3032 。。。 0000220 646d 7000 0000 0000 0000 0000 ...

    Unicode字符集

    Unicode字符集,Unicode(统一码、万国码、单一码)是一种在计算机上使用的字符编码。它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。1990年开始研发,...

    字符转换包

    二进制转十六进制,十六转十进制,字符转换。

    010 Editor(十六进制编辑器) v3.13

    它还可用来比较一切可视的二进制文件,支持六种常用的字符集以及十几中国家字符集(包括简体和繁体中文),支持模板和脚本,可以编辑磁盘和进程,具有强大的编辑功能,查找和替换功能特别出色,可以查找十几种数据...

    计算机网络安全技术:文本文件是如何用二进制表示的.pdf

    GB2312 汉字编码字符集对照表 (部分) 一、文字编码 几种不同的汉字编码标准,圈越大表示包含的汉字越多。 一、文字编码 2.ANSI编码: 在windows 自带的记事本程序写 几个字 “锦瑟无端五十弦”,以默 认的编码方式...

    信息技术习题(答案).doc

    十进制小数转换成二进制小数,可以采取"乘以2取整法" 2.在下列有关汉字编码字符集的叙述中,错误的是 ___________。 A.GB2312-80是我国颁布最早的汉字编码字符集标准,它包含6000多个汉字 B.UCS- 2(Unicode)...

    详解Python当中的字符串和编码

    最早的计算机在设计时采用8个比特(bit)作为一个字节(byte),所以,一个字节能表示的最大的整数就是255(二进制11111111=十进制255),如果要表示更大的整数,就必须用更多的字节。比如两个字节可以表示的最大...

    Java核心技术II(第8版)

    1.3 读入和写出二进制数据 1.3.1 随机访问文件 1.4 ZIP文档 1.5 对象流与序列化 1.5.1 理解对象序列化的文件格式 1.5.2 修改缺省的序列化机制 1.5.3 序列化单例和类型安全的枚举 1.5.4 版本管理 1.5.5 为克隆使用...

    crypto_utils:与加密,编码,解码等有关的我的小工具集

    十进制,二进制)表示的字节,并将其转换为原始二进制dexor.py:具有给定键的XOR文件内容(从给定偏移量开始) quick_aes:一个用于对字符串和文件进行快速AES加密的小工具(专用于加密消息-提供输出的随机IV和Base...

    javascript parseInt() 函数的进制转换注意细节

    parseInt(string, radix) 有2个参数,第一个string 是传入的数值,第二个radix是 传入数值的进制,参数radix 可以忽略,默认为 10,各种进制的数转换为 十进制整数(如果不是整数,向下取整)。 radix 的取值范围是 ...

    随机数字生成器简体中文免费版.rar

    软件介绍: 欢迎使用Multi Random Data Generator随机数字生成器,它是一款免费的WINDOWS随机数据生成工具。...生成二进制数字、十进制数字、八进制数字、十六进制数字。支持生成随机IP以及随机MAC地址。

    ProcessLook2.0 for 9x/2000/XP

    同的类型显示(十进制、十六进制、二进制、小数等等)只要轻点鼠标,小敲键 盘就可以方便地查寻、修改特定的内存数据。快速的内存查找是任何游戏修改软件无法比拟的,经过反复测试 证明PL的速度是最快的,因为核心...

    计算机等级考试辅导三级网络技术

    二、字符串左右排序和比较 三、正整数排序求平均值(包括将数拆散、求最大最小值) 四、产品五个因素的比较排列,是结构体操作问题 五、素数 六、数字排序 七、其他数学计算 八、数字或字符移位后的...

    Python百例源码集 含新老的.rar

    Python百例源码集 含新老的,包括了21猴子吃桃、54取4-7二进制位、103鸡兔同笼、67最大最先最小最后、22乒乓比赛、36求100内素数、5三数排序、37十数排序、53按位异或、18列表求和、40逆序输出列表、82八进制转十...

    C语言程序设计标准教程

    在C语言中,使用的整常数有八进制、十六进制和十进制三种。 整型常量 1.八进制整常数八进制整常数必须以0开头,即以0作为八进制数的前缀。数码取值为0~7。八进制数通常是无符号数。 以下各数是合法的八进制数: ...

    ACM 算法经典代码 数据结构经典代码

    2.返回x的二进制表示中从低到高的第i位 3.模取幂运算 4.求解模线性方程 5.求解模线性方程组(中国余数定理) 6.筛法素数产生器 7.判断一个数是否素数 图论: 1.Prim算法求最小生成树 2.Dijkstra算法求单源...

    30个C#小程序学习C#的基

    30个C#小程序: ...十进制转换成二进制 实时获取CPU使用率 实现关机-危险勿试 实现一个数的N次方 输出素数 输出随机数 输出图形 宿舍值日 验证概率 一到一百之间的素数 以二进制读取文本文件 朦胧诗

    计算机基础简答题答案.doc

    数字编码就是用数字串代表一个汉字的输入 ,常用的是国标区位码,也有用电报码 使用区 位码输入汉字时,必须根据国标GB3212《信息交换用汉字编码字符集一一基本集》,先查出 汉 字对应的代码 , 然后才能输入 ....

Global site tag (gtag.js) - Google Analytics