可以这样试一下:

把每个自然段用<p><'p>包起来.

<p>a bc<'p>
<p>b de<'p>

不要把<p>处理成TEXT, 而是看成一个XML的tag. 用JDOM可以很容易做到.

至于空格, 因为在tag内, 就会照原样保留.

连包住p的大于小于号都会被转换!

<text><![CDATA[ AA<BB>CC&DD ]]></text>
竟然可用,可惜我用HTML编辑器,总是要手工转换一次。

关于“网页自动生成”,我又碰到一个新问题,想和大家讨论一下。
问题为:生成的HTML文件的编码方式都是“UTF-8”的,即 <META http-equiv="Content-Type" content="text/html; charset=UTF-8">。“UTF-8”编码的缺点就是对有些汉字支持不够好而且不能把网页原貌显示出来。
另附有一个自动生成好的HTML文件,大家用IE打开它,再用IE中的“查看源代码”查看一下文件的源代码就清楚了。HTML文件的原内容为:“    十分”“    士大夫”。(前面都有四个空格)。

不知大家有解决的办法否?
谢了!!!lijinlinlin3eO11Y4EQr.htm