CGI跟我学

带有参数的脚本

　　为了传递一个参数给脚本，可以在URL中使用 (?) 插入脚本名词和参数之间, 用加号(+) 表示每个单一的参数, 如:

<A HREF="/cgi-bin/myscript?arg1+arg2+arg3">run my script</A>

　　当服务器接收到这个请求，它传递 arg1, arg2, 和 arg3 参数给脚本. 你然后能在脚本中使用这些参数. 这个方法有时叫查询, 因为早期它用在搜索功能中.

练习2: 检查是否有人登陆.

　　既然你知道怎样使用参数，让我们继续上面的例子pinglaura，通过修改这个例子我们得到下面这个脚本pinggeneric.

　　我们取个不同标题:

#!/bin/sh

echo "Content-type: text/html"
echo
echo "<HTML><HEAD>"
echo "<TITLE>Are You There?</TITLE>"
echo "</HEAD><BODY>"

　　在上面的例子中, 下一步应该是测试我是否登陆，在这里我们用参数${1}代替我的名字lemay, ${1}作为第一个参数, ${2}作为第二个, ${3}作为第三个.

ison='who | grep "${1}"'

　　剩下的所有修改如下:

if [ ! -z "$ison" ]; then

        echo "<P>$1 is logged in"

else
        echo "<P>$1 isn't logged in"

fi

echo "</BODY></HTML>"

　　好了，让我们修改HTML页中的连接吧！原来是这样:

<A HREF="http://www.lne.com/cgi-bin/pinglaura">Is Laura Logged in?</A>

　　修改为通用查询功能后是这样，比如查询名字叫john的人是否登陆:

<A HREF="http://www.lne.com/cgi-bin/pinggeneric?john">Is John Logged in?</A>

　　在你的服务器上试试，看是否有结果。

传递其他信息给脚本

　　除了上面介绍的方法传递数据给脚本以外，还有第二种方法传递信息给CGI脚本. 它叫作路径信息path information，在上面例子的问号后面的参数是因用户表单的输入而改变的. 路径信息Path info用作其他信息传递给脚本，实际上，你可以用它作任何事情.

　　路径信息Path information是一种不象通常参数脚本那样频繁传递信息的方法. 路径Path information通常是指Web服务器上的那些比如配置文件、临时文件或者被脚本因问题调用的文件等等此类文件.

　　看下面一个路径信息path information例子, :

http://myhost/cgi-bin/myscript/remaining_path_info?arg1+arg2

　　当脚本运行时，在路径中的信息"myscript"将被放置于环境参数PATH_INFO. 你能在你的脚本内容中使用这些信息.

　　比如说, 让我们假设你在多页上已有多个连接到同一个脚本. 你能用这个路径信息显示那个有链接的HTML文件名，这样, 在你完成处理你的脚本之后, 当你发回一个HTML文件时, 你能在这个文件里包含一个链接，发回给用户其刚开始访问的那个起始页。

　　你会在下一章节学到更多路径信息：有用的表单和脚本.

创建一个特殊的脚本输出

　　现在你已经学习了诸如输出数据如HTML数据发给浏览器解释显示的数据. 但是如果你不想把脚本结果作为一个数据流形式发回浏览器，而是想把一个存在的页发回，怎么办? 如果你只是要脚本做一些事而不让任何结果回答给浏览器，怎么办? 不用担心, 这里开始解释这些情况.

用调用另一个文本作为响应

　　CGI输出不是非得一个数据流，有时可以响应告诉浏览器的是在服务器上的一个页面文件，为了发出这个信息，看下面的例子:

Location: ../docs/final.html

　　这个Location行用作通常的输出文件定位，也就是说，如果你用了Location, 你就不必再用象Content-type这样的数据输出(实际上，你也不能). 正如Content-type, 你也必须在这一行后面跟一个空行.

　　指向这个文件的路径可以是一个URL或相对路径. 所有相对路径是指相对于脚本所在的位置. 例子中的final.html文本是在当前上一个目录下docs的目录下:

echo Location: ../docs/final.html

echo

　　你不能同时使用Content-type 和 Location两个输出. 比如, 如果你想输出一个标准页，但是想在这个页尾加上客户的内容, 你就得用Content-type自行组建这两个部分. 注意：你可以用脚本命令打开一个当地文件作为数据直接将之输出.

No Response

　　有时对于一个CGI脚本也许一点没有输出. 有时你只是要从用户那儿收集点信息. 你就不用再调用一个新文本, 也不用输出结果或打开一个存在的文件. 在浏览器上的屏幕还是那个样子.

　　很幸运, 这一切很容易. 你只要输出下面这个命令即可(后面跟一个空行):

echo Status: 204 No Response
echo

　这个Status头部提供状态码给服务器(并且也给浏览器). 特别的204将传递给浏览器，如果能识别它，它将什么也不做.

　　尽管无响应是一个官方HTTP规定的一部分，但也并不是适合所有的浏览器，也许会产生奇怪的结果，那你要多试验试试看啦.

处理表单的脚本

　　今天，大多数CGI脚本是用来处理表单输入的. 这个过程大致象上面说阐述的一样，但还是有些不同，比如CGI脚本只要被调用；数据怎样从服务器被发向浏览器.

　　记住, 大多数表单有两个部分: HTML的表单格式；处理表单数据的CGI脚本。这个CGI脚本是使用Html标签<FORM action=..>属性调用的.

表单形式和表单脚本

　　正如上面所说，由于表单有两个部分. Action属性包含着处理表单的脚本:

<FORM ACTION="http://www.popchina.com/cgi-bin/processorscript">

　在这个表单中, 每个输入区都有一个NAME的属性, 用来称呼表单元素. 当这个表单数据被递交，你在ACTION中定义的CGI脚本, 这样这些name和输入内容被作为一个数字或字符传递给脚本.

GET 和 POST

　　表单从浏览器发给服务器有两种方法. GET 和 POST.

　　我们上面谈论的方法，实际是GET，它将数据打包放置在环境变量QUERY_STRING中作为URL整体的一部分传递给服务器。

　　POST做很多类似GET同样的事情, 不同的地方就是它是分离地传递数据给脚本. 你的脚本通过标准输入获取这些数据. (有些Web服务器是存储在临时文件中.) 这个QUERY_STRING环境变量将不再设置.

　　那你用那个方法呢? POST是个安全的方法, 尤其如果你的表单中有很多数据的话. 当你用GET, 这个服务器就分配变量QUERY_STRING给所有的表单数据, 但是这个变量可存储量是有限的. 换句话说，如果你有很多数据但是你又用GET，你会丢失很多数据.

如果你用POST, 你可以尽可能多地使用数据, 因为这些数据从来也不分配到一个变量里.

URL 编码

　　URL 编码是一种浏览器用来打包表单输入的格式. 浏览器从表单中获取所有的name和其中的值，将他们作为name/value参数编码, 移去那些不能传送的字符, 将数据排行等等，这些还取决于你用GET还是POST?是作为URL的一部分或者分离地发给服务器？不管哪种情况, 在服务器端的表单输入格式样子象这样:

theName=Ichabod+Crane&gender=male&status=missing&headless=yes

　　URL编码遵循下列规则:

每对name/value由&符分开.
每对来自表单的name/value由=符分开. 如果用户没有输入值给这个name,那么这个name还是出现，只是无值(象这样 "name=").
任何特殊的字符(就是那些不是简单的七位ASCII，如汉字) 将以百分符%用十六进制编码. 当然也包括象 =, &, 和 % 这些特殊的字符.
在输入区中的空格将以加号+显示.

　　因为表单输入是用这个URL编码传递给你的脚本的，在你用这些参数之前必须解码，因为解码是个很普遍的工作，可以有很多工具做这个工作 . 你没有必要自己写这个解码程序.

　　这里介绍一个叫uncgi的解码程序, 你可以从http://www.hyperion.com/~koreth/uncgi.html. 得到原码，安装在你自己的cgi-bin目录下.

CGI变量

　　表2 总结了环境变量. 如下

*环境变量*	意义
SERVER_NAME	CGI脚本运行时的主机名和IP地址.
SERVER_SOFTWARE	你的服务器的类型如： CERN/3.0 或 NCSA/1.3.
GATEWAY_INTERFACE	运行的CGI版本. 对于UNIX服务器, 这是CGI/1.1.
SERVER_PROTOCOL	服务器运行的HTTP协议. 这里当是HTTP/1.0.
SERVER_PORT	服务器运行的TCP口，通常Web服务器是80.
REQUEST_METHOD	POST 或 GET, 取决于你的表单是怎样递交的.
HTTP_ACCEPT	浏览器能直接接收的Content-types, 可以有HTTP Accept header定义.
HTTP_USER_AGENT	递交表单的浏览器的名称、版本和其他平台性的附加信息。
HTTP_REFERER	递交表单的文本的 URL，不是所有的浏览器都发出这个信息，不要依赖它
PATH_INFO	附加的路径信息, 由浏览器通过GET方法发出.
PATH_TRANSLATED	在PATH_INFO中系统规定的路径信息.
SCRIPT_NAME	指向这个CGI脚本的路径, 是在URL中显示的(如, /cgi-bin/thescript).
QUERY_STRING	脚本参数或者表单输入项(如果是用GET递交). QUERY_STRING 包含URL中问号后面的参数.
REMOTE_HOST	递交脚本的主机名，这个值不能被设置.
REMOTE_ADDR	递交脚本的主机IP地址.
REMOTE_USER	递交脚本的用户名. 如果服务器的authentication被激活，这个值可以设置。
REMOTE_IDENT	如果Web服务器是在ident (一种确认用户连接你的协议)运行, 递交表单的系统也在运行ident, 这个变量就含有ident返回值.
CONTENT_TYPE	如果表单是用POST递交, 这个值将是 application/x-www-form-urlencoded. 在上载文件的表单中, content-type 是个 multipart/form-data.
CONTENT_LENGTH	对于用POST递交的表单, 标准输入口的字节数.

表单输入的解码程序

　　目前有两个程序: 通用目的的uncgi, 和cgi-lib.pl, 这是个Perl库，用于perl编写的CGI脚本.当然也有表单上载时可以解码的程序，不过很少。

uncgi

　　说明原码可以从 http://www.hyperion.com/~koreth/uncgi.html获得。

cgi-lib.pl

　　这是由Steve Brenner编写的, 帮助你管理输入. 他能从GET和POST获取输入并且放置在一个Perl列表或阵列中. 更新的版本也能处理来自表单的文件上传. 从这儿可以得到信息与原码 http://www.bio.cam.ac.uk/cgi-lib. 如果你决定用Perl语言处理你的表单输入，cgi-lib是个很好的库.

　　为了使用cgi-lib.pl，你通常要这样写:
＃！/usr/lib/perl

require 'cgi-lib.pl';

　　cgi-lib中尽管有很多子程序, 最重要的是ReadParse子程. ReadParse 读取输入方便地将name/value储存在一个Perl阵列中. 在你的Perl脚本中通常是这样调用的:

&ReadParse(*in);

　　此例中，阵列名是in, 可以随便取名的. 在表单输入解码后, 你能读取和处理这个name/value，方法是象下面这样:

print $in{'theName'};

　　这个将显示名字name是theName的值value.

　　如果你有多个用同样名字的name对, cgi-lib.pl用(\0)分隔多个名字. 这样可以正常处理你的脚本.

解码上传的文件输入

　　基于表单的文件上传需要不同的表单输入，有一些程序可以对其进行解码。cgi-lib.pl 后来版本可以很好支持这个功能.

自己做

　　找专门书籍学习吧： ftp://ds.internic.net/rfc/rfc1867.txt.

非解剖的脚本头部

　　按照本书阐述，大多数情况可以正常操作，在一些情况下不是这样的，你可以翻阅说明书了解。

<ISINDEX> 脚本

　　为了在CGI中完成讨论组, 我们看看叫<ISINDEX>的搜索. 这是早期在浏览器中用来向服务器发出搜索关键字的办法，参看以前的资料。

总结

　　CGI脚本, 有时叫服务器端脚本或网关脚本。在internet上有很多免费资源，你可以搜索下载读懂他们，当然都是英文的，如果你下决心翻译他们（可能更加强理解). 这样一举两得啊.

　　注意：上述程序可以用ultra edit来编辑，注意转换UNIX格式，必须采用UNIX格式存盘，再上载，用telnet登陆，在命令行键入perl sample.pl，看有无bug,再在浏览器中调用。CGI程序包括放置CGI的目录一定要改属性为777, 要写入的HTML文件也要改属性为777.

CGI跟我学

带有参数的脚本

练习2: 检查是否有人登陆.

传递其他信息给脚本

创建一个特殊的脚本输出

用调用另一个文本作为响应

No Response

处理表单的脚本

表单形式和表单脚本

GET 和 POST

URL 编码

CGI变量

表单输入的解码程序

uncgi

cgi-lib.pl

解码上传的文件输入

自己做

非解剖的脚本头部

<ISINDEX> 脚本

总结

服务器后端性能大比拼

Java NIO原理和使用

Netty原理和使用

Java实用系统开发指南

语言平台专题

后端性能专题

JavaEE教程

Node.js教程

什么是Context上下文？

抽象两种方法：上下文与类型

Content与Context一字之差暗藏逆天极道

语境崩塌：你的注意力正被劫持

Context逻辑之道