好吧,您链接到的文档是针对iis6 Server.UrlEncode的,但是您的标题似乎是关于.NET的
System.Web.HttpUtility.UrlEncode
. 使用类似Reflector的工具,我们可以看到后者的实现,并确定它是否符合W3C规范。
下面是最终被调用的编码例程(注意,它是为字节数组定义的,而其他采用字符串的重载最终会将这些字符串转换为字节数组并调用此方法)。您可以为每个控件名称和值调用此函数(以避免转义保留字符)
= &
protected internal virtual byte[] UrlEncode(byte[] bytes, int offset, int count)
{
if (!ValidateUrlEncodingParameters(bytes, offset, count))
{
return null;
}
int num = 0;
int num2 = 0;
for (int i = 0; i < count; i++)
{
char ch = (char) bytes[offset + i];
if (ch == ' ')
{
num++;
}
else if (!HttpEncoderUtility.IsUrlSafeChar(ch))
{
num2++;
}
}
if ((num == 0) && (num2 == 0))
{
return bytes;
}
byte[] buffer = new byte[count + (num2 * 2)];
int num4 = 0;
for (int j = 0; j < count; j++)
{
byte num6 = bytes[offset + j];
char ch2 = (char) num6;
if (HttpEncoderUtility.IsUrlSafeChar(ch2))
{
buffer[num4++] = num6;
}
else if (ch2 == ' ')
{
buffer[num4++] = 0x2b;
}
else
{
buffer[num4++] = 0x25;
buffer[num4++] = (byte) HttpEncoderUtility.IntToHex((num6 >> 4) & 15);
buffer[num4++] = (byte) HttpEncoderUtility.IntToHex(num6 & 15);
}
}
return buffer;
}
public static bool IsUrlSafeChar(char ch)
{
if ((((ch >= 'a') && (ch <= 'z')) || ((ch >= 'A') && (ch <= 'Z'))) || ((ch >= '0') && (ch <= '9')))
{
return true;
}
switch (ch)
{
case '(':
case ')':
case '*':
case '-':
case '.':
case '_':
case '!':
return true;
}
return false;
}
例程的第一部分统计需要替换的字符数(空格和非url安全字符)。例程的第二部分分配新缓冲区并执行替换:
-
Url安全字符保持原样:
a-z A-Z 0-9 ()*-._!
-
空格转换为加号
-
所有其他字符都转换为
%HH
因此,只有字母数字,特殊字符“$-\+!*'(),”,和
用于保留目的的保留字符
被使用
在URL中未编码。
(包括字母数字)可在特定方案内编码
URL的一部分,只要它们不用于保留
目的。
UrlEncode
是RFC1738中定义的特殊字符的子集。即人物
$,
缺少,将由进行编码
即使说明书上说它们是安全的。因为他们
可以
未编码使用(且
必须
),它仍然满足编码它们的规范(第二段明确指出)。
关于换行符,如果输入有
CR LF
%0D%0A
. 但是,如果输入只有
LF
那就逃走了
%0A
(因此在这个例程中没有换行符的标准化)。
在额外编码的同时满足规范要求
,调用者负责在输入中提供适当的标准化换行符。