首页 / HTTP协议深入了解 / HTTP基础知识 / HTTP协议基础知识:统一资源定位符 URL详解

HTTP协议基础知识:统一资源定位符 URL详解

URL统一资源定位符是URI统一资源标识符的子集。

URI只是一个概念,对URL和URN的统称。暂且不论URI,先对URL进行一个详细的学习记录。

URL的组成

URL共分为三个部分。例如http://www.example.com/images/a.jpg。

第一部分:scheme 方案。方案即为使用什么样的协议服务器资源进行访问。例如HTTP协议,FTP协议(比HTTP协议产生的更早),rtsp协议,https协议,file协议等。

第二部分:服务器的位置。例如www.example.com。告诉所请求的资源处于什么位置。

第三部分:资源路径。例如:/images/a.jpg,路径说明的了服务器上的特定资源。

URL语法:URL的包含的通用组件

以下URL中包含的组件,所有的HTTP协议中,只包含三个部分,分别为:方案、主机、资源路径

例如http://www.example.com/images/a.jpg。如果是完整的URL应该是http://www.example.com:80/images/a.jpg。或者http://IP地址:80/images/a.jpg。HTTP协议中默认的端口80通常都会省略。

FTP协议的语法

在FTP协议中,该URL可能会包含用户名和密码。例如:

ftp://username@example.com/images/a.jpg

ftp://username:password@example.com/images/a.jpg

这两个例子中,第一个例子:首先包含的是用户名,然后使用@分隔开。

第二个例子:首先包含的是用户名,然后使用:把密码分开,@后面的是主机名,资源路径。

FTP协议比HTTP协议更早的出现。在HTTP协议出现之前,人们上网获取资源都是通过输入已知的用户名和密码来获取资源。直到HTTP协议的出现,使得获取资源更加的方便。

URL中的资源路径

URL中的资源路径和Linux或者Unix中的路径资源基本一样。路径一般使用绝对路径和相对路径。例如:../images/a.jpg和././images/a.jpg。不管使用的是相对路径和绝对路径,浏览器都会根据访问网址进行绝对路径的请求。

编码机制

在HTTP协议的URL中一些特殊的字符会不安全,鼻祖们设计了一种编码机制就是转义特殊不安全的字符,但并不是所有的协议方案都会转义。相反,在一些协议中,对URL中的特殊字符进行限制。例如SMTP (Simple Mail Transfer Protocol)简单邮件传输协议。

例如在URL中的空格会转义成%20。其中%为转移字符的标志,20为16进制的ASCII码。示例如下:

一般情况下,URL中的中文都会被转义。

保留和受限制的字符 常见的方案格式

常见的方案有http,https,mailto,ftp,rtsp,rtspu,file,news,telnet方案。具体每个方案的具体含义可以查看W3C的URI schemes列表。IANA互联网数字分配机构维护的URI方案列表:http://www.iana.org/assignments/uri-schemes

声明:转载请注明原文地址及作者姓名。 作者:Glary Joker 文章地址://glaryjoker.com/article/6.html

评论

登录后评论.