在PHP中发送MIME邮件

80酷酷网    80kuku.com

  

  综述:编写邮件系统或邮件列表程序是PHP应用的一个大的分支,既管PHP提供了简单的用于发email的函数,但在实际应用中,会涉及到发送带附件的邮件、测试用户输入的email地址的有效性,尤有必要用专门的章节来讲述。

  MIME是什么?

  MIME表示多用途Internet邮件扩允协议。MIME扩允了基本的面向文本的Internet邮件系统,以便可以在消息中包含二进制附件。

  RFC822在消息体的内容中做了一点限制:就是只能使用简单的ASCII文本。所以,MIME信息由正常的Internet文本邮件组成,文本邮件拥有一些特别的符合RFC822的信息头和格式化过的信息体(用ASCII的子集来表示的附件)。这些MIME头给出了一种在邮件中表示附件的特别的方法。

  MIME信息包含了哪些东西?

  一个普通的文本邮件的信息包含一个头部分(To: From: Subject: 等等)和一个体部分(Hello Mr.,等等)。在一个符合MIME的信息中,邮件的各个部分叫做MIME段,每段前也缀以一个特别的头。MIME邮件只是基于RFC 822邮件的一个扩展。然而它有着自已的RFC规范集。

  头字段

  MIME头根据在邮件包中的位置,大体上分为MIME信息头和MIME段头,MIME信息头指整个邮件的头,而MIME段头只每个MIME段的头。

  MIME信息头有:

  MIME-Version:
  这个头提供了所用MIME的版本号。这个值习惯上为1.0。

  Content-Type:
  它定义了数据的类型,以便数据能被适当的处理。有效的类型有:text,image, audio,video,applications,multipart和message。注意任何一个二进制附件都应该被叫做application/octet-stream。这个头的一些用例为:image/jpg, application/mswork,multipart/mixed 。

  Content-Transfer-Encoding:
  它说明了对数据所执行的编码方式,客户/MUA将用它对附件进行解码。对于每个附件,可以使用7bit,8bit,binary ,quoted-printable,base64和custom中的一种编码方式。7bit编码是用在US ASCII字符集上的常用的一种编码方式。8bit 和binary编码一般不用。对可读的标准文本,如果传输要经过对格式有影响的网关时对其进行保护,可以使用quoted printable 。Base64是一种通用方法,在需要决定使用哪一种编码方法时,它提供了一个不用费脑子的选择;它通常用在二进制,非文本数据上。注意,任何非7bit 数据必须用一种模式编码,这样它就可以通过Internet邮件网关。

  Content-ID:
  如果Content-Type是message/external-body或multipart/alternative时,这个头就有用了。

  Content-Description:
  这是一个可选的头。它是任何信息段内容的自由文本描述。描述必须使用us-ascii码。

  Content-Disposition:
  这是一个试验性的头,它用于给客户程序/MUA提供提示,来决定是否在行内显示附件或作为单独的附件。
  MIME段头(出现在实际的MIME附件部分的头),除了MIME-Version头,可以拥有以上任何头字段。如果一个MIME头是信息块的一部分,它将作用于整个信息体。例如,如果Content-Transfer-Encoding显示在信息(整个信息)头中,它应用于整个信息体,但是如果它显示在一个MIME段里,它"只能"用于那个段中。

  如何创建符合MIME的信息?

  最简单的MIME信息

  这个信息没有任何段,即没有附件。但是它有必要的头。

  From:
  To: 'Alex (the Great)' <>
  Subject: Bucephalus
  MIME-Version: 1.0
  Hello Alexander,
  How's Bucephalus doing? 

  这只是一个简单的拥有MIME头的符合RFC-822 的信息(文本邮件)。需要注意的是Content-Type头默认为Content-Type: text/plain;charset='us-ascii'。

  下面是一个更为复杂的例子:

  From: 'Alex (the Great)' <>
  To:
  Subject: re: Bucephalus
  MIME-Version: 1.0
  Content-Type: image/jpg;
  name='buce.jpg'
  Content-Transfer-Encoding: base64
  Content-Description: Take a look at him yourself

<……base64 encoded jpg image of Bucephalus……> 

  如果想发送多个附件,并且类型也不统一,怎么办?这就是我们将要讨论的"多部分信息"。

  多部分信息(Multipart Messages)

  这个概念允许在一封邮件中发送多条项目。例如,假设Alexander想要给发送一封他的马的照片的邮件,同时还附带有马的家族图谱及精彩的说明。这样一个简单的要求没有多部分消息的概念是无法被满足的。在这种情况下,我们创建了一个使用Content-Type的信息头的封装来支持邮件的不同部分,以便收信人得到图片,家族图谱和精彩的说明。

  Content-Type 头现在拥有一个"multipart"的值,它表示这是一个完整的邮件信息并且这个头只封装了信息。而且它还有一个"mixed"的子类型(例如图片和文本文件是不同的类型)。

  让我们看一下:

  From: 'Alex (the Great)' <>
  To:
  Subject: re: Bucephalus
  MIME-Version: 1.0
  Content-Type: multipart/mixed;
  boundary="XX-1234DED00099A";
  Content-Transfer-Encoding: 7bit

  This is a MIME Encoded Message

  --XX-1234DED00099A
  Content-Type: text/plain; charset=us-ascii
  Content-Transfer-Encoding: 7bit

  Hi PHP,

  Attached you will find my horse, Bucephalus', pedigree chart and photo

  Alex

  --XX-1234DED00099A
  Content-Type: image/jpg;
  name="buce.jpg";
  Content-Transfer-Encoding: base64
  Content-Description: "A photo of Bucephalus"

  <.....base64 encoded jpg image of Bucephalus...>

  --XX-1234DED00099A
  Content-Type: application/octet-stream;
  name="pedigree.doc"
  Content-Transfer-Encoding: base64
  Content-Description: "Pedigree Chart of the great horse"

  <.....base64 encoded doc (pedigree.doc) of Bucephalus...>
--XX-1234DED00099A-- 
 让我们来看一下其中各个部分的含义:
  1)、在MIME信息头中的Content-Transfer-Encoding,为"7bit"。因为Content-Type为multipart/mixed,编码应该是7bit,8bit或二进制中的一种, 7bit是一种广泛使用的格式。
  2)、象这样一条信息包含了多种信息。客户程序是如何知道JPG图片,文档和普通文本之间的区别呢?在Content-Type后面有一个boundary="XX-1234DED00099A"参数。这个值用来分离邮件中的不同部分。它叫做MIME边界标记。边界标记的值必须尽可能的唯一,以免在超出邮件范围时发生混乱。
  3)、"警告"信息("This is a MIME Encoded Message")在那里是为了让不符合MIME的客户程序能够把它显示给用户,否则他们就不理解一个空白邮件是什么意思。
  4)、现在,回到边界标记。如果你观察这个简单的邮件,会发现边界标记(XX-1234DED00099A在每一个分都出现了,也就是,在每部分之间都使用了一个边界标记,然而,每个边界标记都以两个连接符开始。很重要的一点需要注意的就是在最后一个MIME段的后面,边界标记不仅仅以那两个边接符作为开始,同时也以它俩作为结束。这一点一定不能忘记,因为它定义了邮件的范围。
  5)、让我们看一下前两个MIME段:
  第一段是普通文本信息,因此Content-Type为text/plain,并且编码为7bit(我们也可以省略它,因为如果不指明它也会默认为如此)。
  第二个就是JPEG图片。相应的表示为Content-Type: image/jpg。name="buce.jpg"(出现在Content-Type的后面,称之为参数),指出了文件的名字;它就是可以在客户程序中看到的附件的名字。如果不给出name="buce.jpg" ,描述字段(如果给出)将作为附件的名字显示出来 。
  6)、注意JPEG 图片可以在邮件件中被显示出来,如果客户程序可以显示行内附件。或者,你可以向客户程指明你想如何显示附件。例如,如果存在Content-Disposition: attachment头,JPEG图片将被显示为一个附件图标。

  如何创建和实现MIME邮件类?

  现在让我们用PHP创建和实现一个MIME邮件类。这个MIME类必须能够:
  1、增加附件
  2、对每一个独立的请求,对所附的数据进行编码
  3、创建MIME段/头
  4、生成一个包含MIME段/头的完整的邮件
  5、将整个邮件作为字符串返回
  6、用本地的邮件处理程序进行发送(或选择调用一个SMTP邮件处理程序)

  这个类叫做MIME_mail。

<?php
class MIME_mail {
var $to;
var $from;
var $subject;
var $body;
var $headers = "";
var $errstr="";

var $base64_func= ''; // 如果未指定使用PHP的base64函数
var $qp_func = ''; // 此时为空
var $mailer = ""; // 将其设为有效的邮件对象的名字
?> 

  这里有一些公共处理的变量(也就是,可以在脚本中直接操纵的变量)。这些变量中的大部分都是自说明的。$headers包含了可选的想要发送给邮件处理程序的头信息。$errstr 是一个包含可读错误字符串的变量,它可以用在调用脚本中。

  $base64_func和$qp_func是"函数处理器",用户可以进行定制。缺省地,它们被设为空串。对于$base64_func,一个空串意味着我们将使用PHP内置的base64_encode()函数 。Quoted Printable可以通过$qp_func被处理。在PHP中没有内置的quoted-printable 编码函数(然而,安装了imap则可以使用imap_qprint())。在这篇文章中我们将不再讨论quoted_printable方法。

<?php
//私有:
var $mimeparts = array();
?>

  $mimeparts是一个内部数组,包含了邮件信息中各自独立的符合MIME段。请不要在这个类(或派生类)之外操纵它和其它的私有方法/变量。

<?php
// 构造函数
function MIME_mail($from="", $to="", $subject="", $body="", $headers = "")
{
$this->to = $to;
$this->from = $from;
$this->subject = $subject;
$this->body = $body;
if (is_array($headers)) {
if (sizeof($headers)>1) $headers=join(CRLF, $headers);
else $headers=$headers[0];
}
if ($from) {
$headers = preg_replace("!(from: ?.+?[ ]? )!i", '', $headers);
}
$this->headers = chop($headers);
$this->mimeparts[] = "" ; //增加位置0
return;
}
?> 

  我们拥有对象的构造函数,它使用"from"和"to"邮件地址,主题和邮件体和头作为参数。对于邮件体部分,可以给出你将可能输入的正常邮件。最后一个参数是可选的(用户自定义)头。例如,X-Mailer: MyMailer_1.0。请注意$headers可以是一个数组,包含了将要发给邮件发送程序的不同的头,或者只是某个特别头的容器。你不能在$headers参数中发送From: 头,如果它被找到,这部分将自动被去掉。你可以象下面使用多个头:array("X-Mailer: MYMailer_1.0", "X-Organization: PHPBuilder.com")。

  $mimeparts用一个空项(索引0)创建,在后面我们将看到这样用的道理。

  我们将MIME信息头的生成,MIME段头的生成和最终的邮件消息的生成分成几个模块。方法的实现是直接从我们前面遇到的MIME基础而来的。

<?php
function attach($data, $description = "", $contenttype = OCTET, $encoding = BASE64, $disp = '') {
if (empty($data)) return 0;
if (trim($contenttype) == '') $contenttype = OCTET ;
if (trim($encoding) == '') $encoding = BASE64;
if ($encoding == BIT7) $emsg = $data;
elseif ($encoding == QP) $emsg = $$this->qp_func($data);
elseif ($encoding == BASE64) {
if (!$this->base64_func) $emsg = base64_encode($data);
else $emsg = $$this->base64_func($data);
}
$emsg = chunk_split($emsg);
//检查是否content-type是text/plain并且如果没有指定charset,追加缺省的CHARSET
if (preg_match("!^".TEXT."!i", $contenttype) && !preg_match("!;charset=!i", $contenttype)) $contenttype .= ";
charset=".CHARSET ;
$msg = sprintf("Content-Type: %sContent-Transfer-Encoding: %s%s%s%s",
$contenttype.CRLF, $encoding.CRLF,
((($description) && (BODY != $description))?"Content-Description: $description".CRLF:""),
($disp?"Content-Disposition: $disp".CRLF:""),
CRLF.$emsg.CRLF);
BODY==$description? $this->mimeparts[0] = $msg: $this->mimeparts[]= $msg ;
return sizeof($this->mimeparts);
}
?> 

??我们来仔细地分析一下这个方法:

  1、这个方法使用的参数有:

  所附的实际数据($data)
  与Content-Description头相应的数据描述($description)
  将用在Content-Type头中的数据content-type值($contentype)
  用在Content-Transfer-Encoding中的编码值($encoding)
  用在Content-Disposition头$disp中的布局值,可以是INLINE或ATTACH,两个都是常量
  2、如BASE64,TEXT这样的值等等,作为常量被定义在附加的.def文件中。
  3、使用$encoding值来决定需要用哪种编码方式对数据进行编码。有效的值是BIT7(或7bit),QP或BASE64。这个函数同时也检查了是否用户要使用他/她自已的BASE64或QP函数。在写这篇文章时,在我们的类中只有BIT7和BASE64被实现了,然而,你可以传递你自已的quoted-printable 函数来使用,通过在前面讨论的$qp_func类变量。
  4、在编码处理之后,可以注意到对编码的信息使用了chunk_split()。这个函数根据可选长度将字符串分割成小段。因为我们没有指出长度,缺省长度使用76。
  5、接着,如果$contenttype参数包含text/plain,则必须给出"charset=" 参数的值。它的缺省值被定义在常量CHARSET中,值为us-ascii。注意当头使用参数值传递时,在头与参数之间必须有一个分号";"。
例如,Content-Type: text/plain; charset=us-ascii
  6、如果其它MIME段头各自的值被传递给这个方法,这些段头被创建。毕竟我们不想拥有一个没有描述的Content-Description头。在创建这些头之后,我们追加上经过编码的数据部分信息。(检查一下方法中的sprintf()语句)。同样,注意我们使用了一个叫BODY(又是一个常量)的特别描述字段。这就是我们用在类实现中的东西。如果描述字段与BODY一样,我们将其赋给$mimeheaders数组中的第一个元素。对于这个请多读几遍。
  7、attach() 返回$mimeparts数组的当前大小,用在调用脚本的引用中。通过这种方法就可以知道一个附件"X"存在哪一个索引中(实际返回的值要比在数组中的索引小1)
  8、注意所有的头必须用一个CRLF()序列结束。

  接着,我们看一下fattach()方法,fattach()与attach()相似,但是它使用一个文件名作为它的第一个参数(作为attach()中$data的替换)。这个方法只是一个封装,以便调用者可以用一个文件来调用fattach。fattach()然后将文件读出,接着调用attach()来追加数据。这个方法在失败时返回0,可以在$errstr 变量中找到解释或者当成功时,返回文件附件在$mimeparts数组中的索引号。

 我们现在已经开发了附加数据的功能,对它们进行编码并且将单独的MIME段放在私有数组中。还需要完成的工作是:

??*.完成MIME的各个段

??*.创建包含MIME信息头的邮件信息头,邮件原始的信息头(如To:, From:等等)并且包括任何用户定义的头。在头后面追加完整的MIME段,这样一个完整的邮件包就生成了。

  我们将考查的下一个方法是,build_message(),它是通过一个gen_email()的方法来调用的。请注意build_message()是一个私有方法。

<?php
function build_message() {
……
//情况1:存在附件列表,所以MIME信息头必须是multipart/mixed
if (is_array($this->mimeparts) && ($nparts > 1)) {
……
// 如果存在MIMIE段,则邮件体也要变成附件
if (!empty($this->body)) {
$this->attach($this->body, BODY, TEXT, BIT7);
}

// 现在创建邮件的各个MIME段
for ($i=0 ; $i < $nparts; $i++) {
if (!empty($this->mimeparts[$i]))
$msg .= CRLF.'--'.$boundary.CRLF.$this->mimeparts[$i]. CRLF;
}
$msg .= '--'.$boundary.'--'.CRLF;
$msg = $c_ver.$c_type.$c_enc.$c_desc.$warning.$msg;
} else {
……
}
return $msg;
}
?> 

  1、我们知道了每一个MIME段都有一个边界标记,这个标记有一个唯一的id。边界标记被用在:

  MIME信息头中,用来指示附件必须从哪进行划分

  MIME段中;实际用在每一段的前面和后面来划分附件的边界(记住:最后一个边界标记要以两个连接符(--)结束,用于指示范围结束)。 $boundary包含了边界标记,并且它是通过一个随机数进行了唯一化再做MD5哈希生成的。另外,我们给$boundary冠以一个"PM?"的前缀,这里"?"是一个随机字母。举一个boundary的例子就是"PMK------2345ee5de0052eba4daf47287953d37e"(PM表示PHP MIME,所以你可以将其改为你的可能的初始值)。

  2、在生成MIME头的处理中我们必须考虑两种情况。这些情况影响了邮件的原始邮件体($body在构造函数中)以哪种方式被看待和MIME信息头的特别表示。情况1就是:可以有许多的附件被包含。在这种情况下,请注意作为信息的部分被放上了警告字符串"This is a MIME encoding message"。因此,真正的消息体本身也必须以附件形式加到信息中!邮件的文本通常是附件列表中的第一个附件,在我们的例子中就是$mimeparts。这个正好就是为什么我们要占用一个$mimeparts索引的原因,以便让第一个索引(是0)可以用于邮件文本部分。邮件体必须以7bit编码进行附加。

<?php
if (!empty($this->body)) {
$this->attach($this->body, BODY, TEXT, BIT7);
}
?> 

  上面的一小段代码完成附加邮件文本部分作为一个MIME附件的工作。注意,我们使用了'BODY'常量来指示attach()要将附件加到何处。

  第二种情况就是当不存在附件时,在这种情况下,如果提供了邮件文本,它将是包含在局部变量$msg中的唯一信息;在这种情况下不需要MIME头。(然而,在这种情况下我们还应该只把MIME-Version头指定出来)

  3、MIME信息头(MIME-Version,Content-Type, 等等。)在有附件的时候被创建。为了用MIME消息头来创建消息体,首先MIME信息头要被创建。然后各个有效的MIME段通过$mimeheaders数组被反复处理。这就是边界标识被实际使用的地点。根据规则的一致性,对一个MIME段被前缀上两个连接符('--'.$BOUNDARY.crlf)并且在最后一个MIME段的后面,在边界标识后追加两个连接符表示邮件范围结束。

  4、在变量$msg中的完整的信息作为这个方法的值被返回。

  下一个方法,get_email()通过build_message()方法完成MIME消息的生成。因为build_message()是一个内部方法,get_email()在调用完build_message()之后,创建RFC 822的信息头并且追加上MIME信息。

<?php
function gen_email($force=false) {
if (!empty($this->email) && !$force) return $this->email ; // saves processing
$email = "";
if (empty($this->subject)) $this->subject = NOSUBJECT;
if (!empty($this->from)) $email .= 'From: '.$this->from.CRLF;
if (!empty($this->headers)) $email .= $this->headers.CRLF;
$email .= $this->build_message();
$this->email = $email;
return $this->email;
}
?> 

  对于我们的类的一个实例来说,类的成员$email拥有生成的整个邮件信息。为了避免信息被无必要的重新生成,这个方法继续创建邮件头,并且只有当$mail为空时才调用build_message()。然而,你可以通过调用gen_email()来强制重新处理。(如果"To"信息被改变或加入了一个新的附件,调用者显示想这么做)。

  gen_email()创建了更熟悉的From头。另外,如果没有指定主题,它将主题设为缺省值(No Subject)。我们直到后面才将To和Subject 的内含保存起来。这个方法返回完整的邮件信息,这样就结束了创建MIME信息的任务。

??值得说明的其它两个方法是print_mail()和send_mail(),两个都使用了$force参数。print_mail()输出整个邮件信息,send_mail()使用PHP的mail()函数发送信息。可选的,send_mail()使用了一个SMTP对象和它的发送方法(由用户指定)来发送邮件。

  如何测试email的有效性?

??一般我们常希望拜访自己网站的朋友能留下Email,但是很多人都会随便打,造成管理员的困扰,以下这个类可以在线检查Email是否有效(存不存在)

……
Function VerifyRule($email) ;
Function VerifyOnline($email) ;

function Verify($email,$type=0) {
if($type==0) return $this->VerifyRule($email) ; //为0只检查Email语法
else return $this->VerifyOnline($email) ; //否则在线检查
}
…… 

  基本思想是:

  首先检查是否符合Email语法标准,如果符合,取得用户输入的Email的主机信息,用getmxrr()函数取得改主机dns中的MX字段,然后进一步检查输入的Email是否存在。

  用法:

$input=new CEmail;
/检查语法
if($input->Verify(")) echo "有效";
else echo "无效";

//在线检查是否真的有该邮件
if($m->Verify(")) echo "有效";
else echo "无效"; 



分享到
  • 微信分享
  • 新浪微博
  • QQ好友
  • QQ空间
点击: