分享 解密喷射字符“ส้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้”,教你DIY自己的喷射符

作者: ldsea 分类: 程序生活 发布时间: 2011-09-13 10:17

关于这个符号。。ส้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้。。估 计大家也没少见,第一次见的可能也猛一下不知所以然。其实我也是今天才后知后觉地注意到这个东西,然后就顺便把它解剖了。另外考虑到最初试图用各种关键字 组合向谷歌度娘求教都未果,所以把个人研究过程和成果码出来供大家交流学习。

(注:文中为防止涉及编码被浏览器自动转换为符号,全部采用了全角字符,自行实验时需要用半角。)

 

        1、收到这个字符后我先保存成了Unicode编码的txt文档,无意间瞥见这货大小居然是118字节,瞎了;

        2、直接拷去问谷哥,谷哥表示这货尺寸太长了他受不了,再拿去问度娘,度娘表示她也没那么深不可测;

 

 

 

 

        3、把&#3657写入txt保存成html后用浏览器打开,是一个这个符号:้,当时觉得很纳闷;

        4、换搜搜,有重大发现,那个符号被转成了ส和一连串的้

 

 

 

 

        5、取一个ส和两个้组成字串写入txt,保存成html后打开,即出现了一个“ส”头上喷射出两层“波”的符 号:ส้้,删掉一个&#3657,波变成一层了:ส้,后实验表明,ส是ส的编码,ส后面跟几 个&#3657,它就能喷几层波;

        6、接着问谷哥&#3626是神马,谷歌表示这好像是泰文符号,于是真相大体清楚了:ส等是泰文符号,估计是在泰文中会根据种种基于语法等方面的 需求,在这类符号上面加一些东西(可能类似我们的汉语拼音声调),因此采用这种编码识别方式。之于它喷得太远了这个问题,猜是因设计者没考虑限定符号头 上”戴帽子“的数量而延续下来的Bug吧。

 

 

 

 

 

 

 

        7、发散思维,知道了这个原理,通过在txt文本中修改编码和后缀数,也可以DIY中各种各样的喷射符:ส็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็

 

ส้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้้                      

             อ๊๊๊๊๊๊๊๊๊๊๊๊๊๊๊๊๊

 

 

转自:http://blog.renren.com/blog/246707530/752191204

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注