把中国博客日志同步到JavaEye上需要解决的几个问题

1. 由于通过 RSS 方式,只能读取最新的 20 条记录,JavaEye 至今未支持从中国博客网的 HTML 方式导入,所以需要认为生成一个包含所有日志的 RSS 格式的 XML 文件。
2. 生成的 XML 文件要让 JavaEye 的导入工具能读取到,所以需要发布到公网上,这个问题已解决,用路由器的端口映射到我的电脑上即可。
3. 由于本地的日志有许多 <textarea name=code>.... 包含的源代码,在本地显示是能通过 syntaxhighlighter 转换显示,如果直接导到 JavaEye 上显示就会走样,更主要的是没法编辑--编辑时内容会跳出编辑框,所以应事先用 syntaxhighlighter 工具转换好代码存到 XML 文件中。
4. 中国博客网发布日志时,每次回车会产生 <!----> 空注释,生成 XML 文件时需要去除掉。
5. 中国博客网日志中的美元符号会被无端的转换成全角的,因此在生成 XML 文件时需要还原回来。
6. 适时参考 JavaEye 的 RSS 格式的 XML 文件,看是否可以导日志时提供更多的信息,如日志创建时间,标签,分类信息等
7. 可能生成单个的 XML 文件体积会过大,视具体情况要否切分成多个 XML 文件。

其他还未想到,想到后再补上。

类别: Uncategorized. 阅读(51). 订阅评论. TrackBack.

Leave a Reply

Be the First to Comment!

avatar