现在位置:站长资讯->首页->软件编程
用VB将Html转换为文本文件
时间:2006-9-3 21:13:13 来源: 作者: 编辑: 【关闭

p align="center">  如何将一个" 超文本文件Html文件格式转换为" Txt文本文件呢?这就是本文所要讨论的内容了。我们都知道,超文本文件有很多的标记,如$#@60;Html$#@62;、$#@60;Head$#@62;、$#@60;Body$#@62;等等,在文本文件中,这些都是没用的,我们要把它们都删去,而且超文本文件还有很多不可见的内容,如用“$#@60;!--”、“--$#@62;”括起来的内容、Java脚本程序,这些在文本文件中也是不可用的,我们也要把它们都删去。因此,我们可以得出这么一个结论:
  一个简单的" Html转换Txt程序的基本原理就是--将超文本文件不可视部分去掉,将超文本文件可视部分的内容写到文本文件中去。
好了,有了理论就应该有些实际的东西了。转换的步骤可以简单地归纳为:

1、 去掉$#@60;head$#@62;部分的内容
2、 去掉$#@60;script$#@62;部分的Java脚本程序
3、 转换$#@60;br为换行符
4、 转换$#@60;/p$#@62;为换行符
5、 转换和去掉其它所有的" 超文本标记
6、 转换“$#@60;”为“<”符号
7、 转换“$#@62;”为“>”符号
8、 转换“&”为“&”符号
9、 转换“ ”为空格符号
10、转换“"”为引号
11、去掉转换后开头和结尾出现的所有空格符号
12、转换完成

转换的步骤可用VB的函数IsStr来实现,如下面的代码可以去掉文本框Text3中超文本文件开头到$#@60;/Head$#@62;标记部分的内容:

Do While " InStr(1, LCase(Text3.Text), "$#@60;/head$#@62;") <> 0

Text3.SelStart = 0
Text3.SelLength = InStr(1, LCase(Text3.Text), "$#@60;/head$#@62;") + 6
Text3.SelText = ""

Loop

  详细的程序代码请参看程序清单或htmtotxt.zip">源程序。这个转换程序设计时考虑的是转换规范的超文本文件,当要转换的文件不够标准(如:有$#@60;/head$#@62;而没有$#@60;head$#@62;与之配对)的时候,转换就不能完成。而且,这个例子只转换了部分的超文本标记,还有许多的标记,如表单标记“FORM”并没有被转换,更多、更详尽的功能就有待你完成了。
共2页。 1 2 8 :


发表评论 相关信息
用户:
查看评论
留言:
验证码:
* 请各位网友遵纪守法并注意语言文明。
*《互联网电子公告服务管理规定》
*《全国人大常委会关于维护互联网安全的规定》
 行业新闻
 服务器
 数据库
版权 © 佰网 www.hb666.com 所有 综合门户站点    未经许可不得复制或镜像  
招商热线:0710 -3851666  3858555  售后服务:0710-3422031  传真:0710- 3452881
  佰网数据:0710-3178666   合作 Email:admin@hb666.com   销售Email:666@hb666.com
CEO信箱  客户留言  我要投诉  诚聘英才