找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 49|回复: 5

Python正文提取算法

[复制链接]

714

主题

5158

回帖

1万

积分

论坛元老

积分
12506
发表于 2011-4-6 22:58:52 | 显示全部楼层 |阅读模式
太阳 就一个

回复

使用道具 举报

714

主题

5158

回帖

1万

积分

论坛元老

积分
12506
 楼主| 发表于 2011-4-6 23:03:04 | 显示全部楼层
niu
回复

使用道具 举报

714

主题

5158

回帖

1万

积分

论坛元老

积分
12506
 楼主| 发表于 2011-4-6 23:03:30 | 显示全部楼层
好牛逼
回复

使用道具 举报

54

主题

4395

回帖

9006

积分

论坛元老

积分
9006
发表于 2011-4-6 23:18:07 | 显示全部楼层
原帖由 xspoco 于 2011-4-6 23:44 发表


好牛逼
回复

使用道具 举报

37

主题

242

回帖

625

积分

高级会员

积分
625
发表于 2011-4-6 23:24:43 | 显示全部楼层
这语言真累,,,,
回复

使用道具 举报

148

主题

1803

回帖

4084

积分

论坛元老

积分
4084
发表于 2011-4-6 23:36:28 | 显示全部楼层
[ol]
  •         for div in divs:
  •                 div_html = div.__str__()
  •                 chinese_utf8 = re_chinese.findall(div_html)
  •                 chinese_number = len(chinese_utf8) / 3
  •                 if chinese_number 复制代码这段要改下,迭代里删东西会出问题的



      python 很好...
  • 回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    Archiver|手机版|小黑屋|Discuz! X

    GMT+8, 2025-1-14 01:02 , Processed in 0.019432 second(s), 5 queries , Gzip On, Redis On.

    Powered by Discuz! X3.5

    © 2001-2024 Discuz! Team.

    快速回复 返回顶部 返回列表