博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
(C++)UrlEncode的标准实现
阅读量:6524 次
发布时间:2019-06-24

本文共 2699 字,大约阅读时间需要 8 分钟。

http://blog.163.com/xiaopengyan_109/blog/static/149832173201072685539394/

地址栏传中文参数后是什么编码格式

 

网页中的表单使用POST方法提交时,数据内容的类型是 application/x-www-form-urlencoded,这种类型会:

  1.字符"a"-"z","A"-"Z","0"-"9",".","-","*",和"_" 都不会被编码;

  2.将空格转换为加号 (+) ;

  3.将非文本内容转换成"%xy"的形式,xy是两位16进制的数值;

  4.在每个 name=value 对之间放置 & 符号。

  */

  URLEncoder类包含将字符串转换为application/x-www-form-urlencoded MIME 格式的静态方法。

   web设计者面临的众多难题之一便是怎样处理不同操作系统间的差异性。这些差异性能引起URL方面的问题:例如,一些操作系统允许文件名中含有空格符, 有些又不允许。大多数操作系统不会认为文件名中含有符号“#”会有什么特殊含义;但是在一个URL中,符号“#”表示该文件名已经结束,后面会紧跟一个 fragment(部分)标识符。其他的特殊字符,非字母数字字符集,它们在URL或另一个操作系统上都有其特殊的含义,表述着相似的问题。为了解决这些 问题,我们在URL中使用的字符就必须是一个ASCII字符集的固定字集中的元素,具体如下:

  1.大写字母A-Z

  2.小写字母a-z

  3.数字 0-9

  4.标点符 - _ . ! ~ * ' (和 ,)

  诸如字符: / & ? @ # ; $ + = 和 %也可以被使用,但是它们各有其特殊的用途,如果一个文件名包括了这些字符( / & ? @ # ; $ + = %),这些字符和所有其他字符就应该被编码。

   编码过程非常简单,任何字符只要不是ASCII码数字,字母,或者前面提到的标点符,它们都将被转换成字节形式,每个字节都写成这种形式:一个“%”后 面跟着两位16进制的数值。空格是一个特殊情况,因为它们太平常了。它除了被编码成“%20”以外,还能编码为一个“+”。加号(+)本身被编码 为%2B。当/ # = & 和?作为名字的一部分来使用时,而不是作为URL部分之间的分隔符来使用时,它们都应该被编码。

 

 

 

 

 

 

http://m.blog.csdn.net/blog/gemo/8468311

  关于UrlEncode的实现(C++),网上有很多不同的版本,对需要编码的字符集的选取并不统一。那么到底有没有标准呢?答案是有的,参见

    绝对不编码的,只有字母、数字、短横线(-)、下划线(_)、点(.)和波浪号(~),其他字符要视情况而定,所以一般性的urlencode只需保留上述字符不进行编码。

    下面给出实现:

unsigned char ToHex(unsigned char x) {     return  x > 9 ? x + 55 : x + 48; }unsigned char FromHex(unsigned char x) {     unsigned char y;    if (x >= 'A' && x <= 'Z') y = x - 'A' + 10;    else if (x >= 'a' && x <= 'z') y = x - 'a' + 10;    else if (x >= '0' && x <= '9') y = x - '0';    else assert(0);    return y;}std::string UrlEncode(const std::string& str){    std::string strTemp = "";    size_t length = str.length();    for (size_t i = 0; i < length; i++)    {        if (isalnum((unsigned char)str[i]) ||             (str[i] == '-') ||            (str[i] == '_') ||             (str[i] == '.') ||             (str[i] == '~'))            strTemp += str[i];        else if (str[i] == ' ')            strTemp += "+";        else        {            strTemp += '%';            strTemp += ToHex((unsigned char)str[i] >> 4);            strTemp += ToHex((unsigned char)str[i] % 16);        }    }    return strTemp;}std::string UrlDecode(const std::string& str){    std::string strTemp = "";    size_t length = str.length();    for (size_t i = 0; i < length; i++)    {        if (str[i] == '+') strTemp += ' ';        else if (str[i] == '%')        {            assert(i + 2 < length);            unsigned char high = FromHex((unsigned char)str[++i]);            unsigned char low = FromHex((unsigned char)str[++i]);            strTemp += high*16 + low;        }        else strTemp += str[i];    }    return strTemp;} http://www.cnblogs.com/hoodlum1980/archive/2012/05/28/2521500.html
你可能感兴趣的文章
minGW, cygwin, GnuWin32【C++的跨平台交叉编译问题】
查看>>
我的Dll(动态链接库)学习笔记(转)
查看>>
应用程序域
查看>>
有向图的拓扑排序算法JAVA实现
查看>>
HTML页面跳转的5种方法
查看>>
ArcGIS Engine开发之旅02--ArcGIS Engine中的类库
查看>>
李洪强-C语言5-函数
查看>>
开源监控利器grafana
查看>>
Android获取当前时间与星期几
查看>>
jenkins2 multibranch
查看>>
Css定位-定位
查看>>
sort,uniq命令
查看>>
am335x 电容屏驱动添加。
查看>>
JavaScript Unicode字符操作
查看>>
rhel-server-7.2-x86_64无法联网(VMware环境)
查看>>
Nginx配置中的log_format用法梳理(设置详细的日志格式)
查看>>
Atitit 软件工程概览attilax总结
查看>>
优化LibreOffice如此简单
查看>>
【Oracle 数据迁移】环境oracle 11gR2,exp无法导出空表的表结构【转载】
查看>>
秒杀系统设计方案
查看>>