后台遍历一个HTML页面

80酷酷网    80kuku.com

  遍历|后台|页面前几天写一个程序,需要后台遍历一个动态生成的页面,找寻特定节点

于是写了以下代码:

public class HtmlReader
{
public HtmlReader()
{
}
///
/// 搜索特定标记的节点
///
///
///
/// 返回属性值数组
public static ArrayList SearchAttributes(string inMarkup, string KeyWord, string AttrName)
{
IHTMLDocument2 doc = new HTMLDocumentClass ();
doc.write (new object [] {inMarkup});
doc.close ();
ArrayList searchList = new ArrayList();

foreach(IHTMLElement el in (IHTMLElementCollection)doc.body.all)
{
if(el.tagName.ToLower() ==KeyWord)
{
string src=el.getAttribute(AttrName,0).ToString();
//src=src.Remove(0,src.LastIndexOf("/")+1);
searchList.Add(src);
}
}
return searchList;
}

}



分享到
  • 微信分享
  • 新浪微博
  • QQ好友
  • QQ空间
点击: