怎样提取出一段文本中的目录结构?

怎样提取出一段文本中的目录结构?

By ivanilla at 2017-02-19
0人收藏 • 2651人看过

比如:

标题1

摘要

标题2

简介

标题3

详细内容

标题4

提取出:

- 1 标题1
-- 1.1 标题2
--- 1.1.1 标题3
- 2 标题4

类似维基百科这样的,而且带书签链接。

如果有相应的扩展包就更好了

6 个回复 | 最后更新于 2017-02-22
ivanilla
2017-02-20
#1

@lincanbin 你有什么好的思路吗?我目前只想到正则匹配(但文本是以markdown格式存储在数据库中的)

lincanbin
2017-02-20
#2

这种无疑是正则匹配,不然就是直接解析DOM树。

ivanilla
2017-02-20
#3

回复#2 @lincanbin :

哪种方法比较好

lincanbin
2017-02-20
#4

回复#3 @ivanilla :

后者,不会遗漏。

ivanilla
2017-02-20
#5

回复#4 @lincanbin :

OK。

后宫学长
2017-02-22
#6

所以大哥你的项目呢?还没有做好呀。


登 录


现在注册

QQ  登 录    Weibo  登 录    GitHub  登 录