Java Unicode转义字符的小小研究

2016-02-19 14:30 7 1 收藏

下面图老师小编跟大家分享一个简单易学的Java Unicode转义字符的小小研究教程,get新技能是需要行动的,喜欢的朋友赶紧收藏起来学习下吧!

【 tulaoshi.com - 编程语言 】

  转义字符
    所有的转义字符都是由 '' 打头的
    第二个字符
        0-9  :八进制
        u    :是Unicode转意,长度固定为6位
        Other:则为以下字母中的一个 b,t,n,f,r,",
              都不满足,则产生一个编译错误。

  
    当然了,提供八进制也是为了和C语言兼容.

    b,t,n,f,r 则是为控制字符.书上的意思为:描述数据流的发送者希望那些信息如何被格式化或者被表示.

(本文来源于图老师网站,更多请访问http://www.tulaoshi.com/bianchengyuyan/)

    Unicode转义字符非常有趣
    它可以写在代码的任意位置,只要转义后是合法的.
    例如:

    int c=0u003b
    上面的代码可以编译通过,等同于int c=0; u003b也就是';'的Unicode代码

    上面的例子不能让人很信服,所以特地写了下面这一段代码用来将字符串转换成为unicode字符
    然后你可以将打印出来的代码放置在EggHello.Java中,然后运行它,结果是让人激动的。

  
  /*
   * author:鸡蛋 date:2004/11/10 字符串转换为Unicode
   */
  public class Asc2Unicode {
   private StringBuffer ch;

   private StringBuffer tch;

   Asc2Unicode(StringBuffer s) {
    ch = s;
    if (ch.length() 0)
     tch = new StringBuffer(1000);
   }

   void transform() {
    if (ch.length() 1)
     return;
    for (int i = 0; i ch.length(); i++) {
     (new Integer((int) ch.charAt(0))).toString();
     tch.append(new StringBuffer("u00"));
     tch.append(new StringBuffer(new String(Integer.toHexString((int) ch
       .charAt(i)))));
    }
   }

   StringBuffer getStr() {
    return tch;
   }

(本文来源于图老师网站,更多请访问http://www.tulaoshi.com/bianchengyuyan/)

   public static void main(String[] argv) {
    Asc2Unicode au = new Asc2Unicode(new StringBuffer(new String(
      "public class EggHello{"
        + "   public static void main(String[] argv){"
        + "System.out.println("Hello,World");" + "}" + "}"
    )
    ));
    au.transform();
    System.out.println(au.getStr());
   }
  }

  
  打印如下:
  u0070u0075u0062u006cu0069u0063u0020u0063u006cu0061u0073u0073u0020u0045u0067u0067u0048u0065u006cu006cu006fu007bu0020u0020u0020u0070u0075u0062u006cu0069u0063u0020u0073u0074u0061u0074u0069u0063u0020u0076u006fu0069u0064u0020u006du0061u0069u006eu0028u0053u0074u0072u0069u006eu0067u005bu005du0020u0061u0072u0067u0076u0029u007bu0053u0079u0073u0074u0065u006du002eu006fu0075u0074u002eu0070u0072u0069u006eu0074u006cu006eu0028u0022u0048u0065u006cu006cu006fu002cu0057u006fu0072u006cu0064u0022u0029u003bu007du007d
  

  
    感觉有点像加密的代码一样! 当然那都是掩耳盗铃。。。
    不过初看起来还是比较让人头晕的。

    Unicode转义就先研究到这里,喝点水,打会游戏。。。
  

来源:http://www.tulaoshi.com/n/20160219/1607085.html

延伸阅读
类似 MSN 带转义字符的信息发送框的制作(下) 作者:北方工业大学 阙荣文 (querw) 下载源代码 一、实现了上回说到的多功能文本框之后,接下去的任务就是做一个表情符号选择器。CIconPicker。 说明:本来是想实现图标选择的,但是后来有需要改成了位图选择器,但是...
答:import java.util.*; class test { public static void main(String[] args) { String str1="001,002,003,004,006",str2 = "001,002,005"; String str=""; TreeSet ts = new TreeSet(); StringTokenizer st = new StringTokenizer(str1,","); while (st.hasMoreTokens()) { ts.add(st.nextToken()); } st = new StringToken...
最近对程序占用内存方面做了一些优化,取得了不错的效果,总结了一些经验。 简要说一下,相信会对大家写出优质的程序有所帮助。 下面的论述针对32位系统,对64位系统不适用,后叙经常你写了一个程序,一测试,功能没问题,一看内存占用也不多,就不去考虑其它的东西了。但可能程序使用了一个什么数据结构,会当数据规模变大时,内存占用激增...
标签: 服务器
Linux Shell 通配符、元字符、转义符使用实例介绍   下面是一个实例: 代码如下: [chengmo@localhost ~/shell]$ ls a.txt b.txt c.old #2 [chengmo@localhost ~/shell]$ ls *.txt a.txt b.txt #3 [chengmo@localhost ~/shell]$ ls d*.txt ls: 无法访问 d*.txt: 没有那个文件或目录 ...
1,什么是字符编码?     字符(Character)是文字与符号的总称,包括文字、图形符号、数学符号等。一组抽象字符的集合就是字符集(Charset)。字符集的出现是为了信息进行传播储存提供方便。目前常用到字符集有:ASCII,ISO 8859-1,Unicode,GB2312 2,各种编码集有哪些特点? ASCII:     ASCII(Ameri...

经验教程

948

收藏

78
微博分享 QQ分享 QQ空间 手机页面 收藏网站 回到头部