PERL CGI模块应用

我在想着写个函数来做网页HTML的特殊字符的转换,如转为<html>
转换的字符有“’ ” & < > ”,发现CGI模块其实已经内置这样的函数了。
escapeHTML和unescapeHTML。
例:
use CGI ();
my $query = new CGI;
print $query->escapeHTML(‘<div>中国</div>’);
print $query->unescapeHTML(‘&lt;div&gt;中国&lt;div&gt;);

perl 字符串处理函数

三、字符串处理函数

函数名 index
调用语法 position = index (string, substring, position);
解说 返回子串substring在字符串string中的位置,如果不存在则返回-1。参数position是可选项,表示匹配之前跳过的字符数,或者说从该位置开始匹配。

 

函数名 rindex
调用语法 position = rindex (string, substring, position);
解说 与index类似,区别是从右端匹配。

 

函数名 length
调用语法 num = length (string);
解说 返回字符串长度,或者说含有字符的数目。

 

函数名 pos
调用语法 offset = pos(string);
解说 返回最后一次模式匹配的位置。

 

函数名 substr
调用语法 substr (expr, skipchars, length)
解说 抽取字符串(或表达式生成的字符串)expr中的子串,跳过skipchars个字符,或者说从位置skipchars开始抽取子串(第一个字符位置为0),子串长度为length,此参数可忽略,意味着取剩下的全部字符。
当此函数出现在等式左边时,expr必须为变量或数组元素,此时其中部分子串被等式右边的值替换。

 

函数名 study
调用语法 study (scalar);
解说 用一种内部格式提高变量的访问速度,同一时刻只对一个变量起作用。

 

函数名 lc
uc
调用语法 retval = lc(string);
retval = uc(string);
解说 将字符串全部转换成小/大写字母。

 

函数名 lcfirst
ucfirst
调用语法 retval = lcfirst(string);
retval = ucfirst(string);
解说 将第一个字母转换成小/大写。

 

函数名 quotameta
调用语法 newstring = quotemeta(oldstring);
解说 将非单词的字母前面加上反斜线(\)。
语句 : $string = quotemeta($string);
等效于:$string =~ s/(\W)/\\$1/g;
常用于模式匹配操作中,确保字符串中没有字符被看作匹配操作符。

 

函数名 join
调用语法 join (joinstr, list);
解说 把字符串列表(数组)组合成一个长的字符串,在每两个列表元素间插入串joinstr。

 

函数名 sprintf
调用语法 sprintf (string, fields);
解说 与printf类似,区别是结果不输出到文件,而作为返回值赋给变量。
例子 $num = 26;
$outstr = sprintf(“%d = %x hexadecimal or %o octal\n”,$num, $num, $num);
print ($outstr);
结果输出 26 = 1a hexadecimal or 32 octal

perl 标量转换函数

四、标量转换函数

函数名 chop
调用语法 $lastchar = chop (var);
解说 var可为变量或数组,当var为变量时,最后一个字符被删除并赋给$lastchar,当var为数组/列表时,所有元素的最后一个字符被删除,最后一个元素的最后一个字母赋给$lastchar。

 

函数名 chomp
调用语法 result = chomp(var);
解说 检查字符串或字符串列表中元素的最后一个字符是否为由系统变量$/定义的行分隔符,如果是就删除。返回值为实际删除的字符个数。

 

函数名 crypt
调用语法 result = crypt (original, salt);
解说 用DES算法加密字符串,original是将要加密的字符串,salt是两个字符的字符串,定义如何改变DES算法,以使更难解码。返回值为加密后的串。

 

函数名 hex
调用语法 decnum = hex (hexnum);
解说 将十六进制数(字符串形式)转化为十进制数。

 

函数名 int
调用语法 intnum = int (floatnum);
解说 将浮点数舍去小数部分转化为整型数。

 

函数名 oct
调用语法 decnum = oct (octnum);
解说 将八进制数(字符串形式)或十六进制数(“0x..”形式)转化为十进制数。

 

函数名 ord
调用语法 asciival = ord (char);
解说 返回单个字符的ASCII值,与PASCAL中同名函数类似。

 

函数名 chr
调用语法 $char = chr (asciival);
解说 返回ASCII值的相应字符,与PASCAL中同名函数类似。

 

函数名 pack
调用语法 formatstr = pack(packformat, list);
解说 把一个列表或数组以在实际机器存贮格式或C等编程语言使用的格式转化(包装)到一个简单变量中。参数packformat包含一个或多个格式字符,列表中每个元素对应一个,各格式字符间可用空格或tab隔开,因为pack忽略空格。
   除了格式a、A和@外,重复使用一种格式多次可在其后加个整数,如:
   $twoints = pack (“i2”, 103, 241);
   把同一格式应用于所有的元素则加个*号,如:
   $manyints = pack (“i*”, 14, 26, 11, 83);
   对于a和A而言,其后的整数表示要创建的字符串长度,重复方法如下:
   $strings = pack (“a6” x 2, “test1”, “test2”);
   格式@的情况比较特殊,其后必须加个整数,该数表示字符串必须的长度,如果长度不够,则用空字符(null)补足,如:
   $output = pack (“a @6 a”, “test”, “test2”);
   pack函数最常见的用途是创建可与C程序交互的数据,例如C语言中字符串均以空字符(null)结尾,创建这样的数据可以这样做:
   $Cstring = pack (“ax”, $mystring);
   下表是一些格式字符与C中数据类型的等价关系:

字符 等价C数据类型
C char
d double
f float
i int
I unsigned int (or unsigned)
l long
L unsigned long
s short
S unsigned short

   完整的格式字符见下表。

 

格式字符 描述
a 用空字符(null)补足的字符串
A 用空格补足的字符串
b 位串,低位在前
B 位串,高位在前
c 带符号字符(通常-128~127)
C 无符号字符(通常8位)
d 双精度浮点数
f 单精度浮点数
h 十六进制数串,低位在前
H 十六进制数串,高位在前
i 带符号整数
I 无符号整数
l 带符号长整数
L 无符号长整数
n 网络序短整数
N 网络序长整数
p 字符串指针
s 带符号短整数
S 无符号短整数
u 转化成uuencode格式
v VAX序短整数
V VAX序长整数
x 一个空字节
X 回退一个字节
@ 以空字节(null)填充

 

函数名 unpack
调用语法 @list = unpack (packformat, formatstr);
解说 unpack与pack功能相反,将以机器格式存贮的值转化成Perl中值的列表。其格式字符与pack基本相同(即上表),不同的有:A格式将机器格式字符串转化为Perl字符串并去掉尾部所有空格或空字符;x为跳过一个字节;@为跳过一些字节到指定的位置,如@4为跳过4个字节。下面看一个@和X合同的例子:    $longrightint = unpack (“@* X4 L”, $packstring);
   此语句将最后四个字节看作无符号长整数进行转化。下面看一个对uuencode文件解码的例子:

1 : #!/usr/local/bin/perl
2 :
3 : open (CODEDFILE, “/u/janedoe/codefile”) ||
4 : die (“Can’t open input file”);
5 : open (OUTFILE, “>outfile”) ||
6 : die (“Can’t open output file”);
7 : while ($line = <CODEDFILE>) {
8 : $decoded = unpack(“u”, $line);
9 : print OUTFILE ($decoded);
10: }
11: close (OUTFILE);
12: close (CODEDFILE);

   当将pack和unpack用于uuencode时,要记住,虽然它们与UNIX中的uuencode、uudecode工具算法相同,但并不提供首行和末行,如果想用uudecode对由pack的输出创建的文件进行解码,必须也把首行和末行输出(详见UNIX中uuencode帮助)。

 

函数名 vec
调用语法 retval = vec (vector, index, bits);
解说 顾名思义,vec即矢量(vector)函数,它把简单变量vector的值看作多块(维)数据,每块含一定数目的位,合起来即一个矢量数据。每次的调用访问其中一块数据,可以读取,也可以写入。参数index就象数组下标一样,提出访问哪一块,0为第一块,依次类推,要注意的是访问次序是从右到左的,即第一块在最右边。参数bits指定每块中的位数,可以为1,2,4,8,16或32。
例子 1 : #!/usr/local/bin/perl
2 :
3 : $vector = pack (“B*”, “11010011”);
4 : $val1 = vec ($vector, 0, 4);
5 : $val2 = vec ($vector, 1, 4);
6 : print (“high-to-low order values: $val1 and $val2\n”);
7 : $vector = pack (“b*”, “11010011”);
8 : $val1 = vec ($vector, 0, 4);
9 : $val2 = vec ($vector, 1, 4);
10: print (“low-to-high order values: $val1 and $val2\n”);
结果 high-to-low order values: 3 and 13
low-to-high order values: 11 and 12

 

函数名 defined
调用语法 retval = defined (expr);
解说 判断一个变量、数组或数组的一个元素是否已经被赋值。expr为变量名、数组名或一个数组元素。
如果已定义,返回真,否则返回假。

 

函数名 undef
调用语法 retval = undef (expr);
解说 取消变量、数组或数组元素甚至子程序的定义,回收其空间。返回值始终为未定义值,此值与空串等效。

perl的for循环又一写法

我们一般写的for循环是沿用C语言里的写法。如:

for ($i = 0; $i<=10; $i++) {
    …
}

在perl语言中还可以这样写,如:

for(0..10) {
    …
}

my $str = ‘jeftom’;
for (0..length($str)-1) {
    print $_, “\n”;
}

length只能用字符串变量,数组和哈希的长度用scalar,length返回字符串的长度。

xml的nodeType属性

因为一直很少用xml,也不是很熟,今天用perl的xml::dom模块时有一个getNodeType()方法。

下面我们先来看看xml的nodeType属性。

作用:辨识节点的DOM 型态。

基本语法:numNodeType = xmlDocNode.nodeType ;

说   明:
此属性只读且传回一个数值。
有效的数值符合以下的型别:
1-ELEMENT
2-ATTRIBUTE
3-TEXT
4-CDATA
5-ENTITY REFERENCE
6-ENTITY
7-PI (processing instruction)
8-COMMENT
9-DOCUMENT
10-DOCUMENT TYPE
11-DOCUMENT FRAGMENT
12-NOTATION

范   例:numNodeType = xmlDoc.documentElement.nodeType;
                alert(numNodeType);