找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 59|回复: 5

Python正文提取算法

[复制链接]

716

主题

5176

回帖

1万

积分

论坛元老

积分
12556
发表于 2011-4-6 22:58:52 | 显示全部楼层 |阅读模式
太阳 就一个

回复

使用道具 举报

716

主题

5176

回帖

1万

积分

论坛元老

积分
12556
 楼主| 发表于 2011-4-6 23:03:04 | 显示全部楼层
niu
回复

使用道具 举报

716

主题

5176

回帖

1万

积分

论坛元老

积分
12556
 楼主| 发表于 2011-4-6 23:03:30 | 显示全部楼层
好牛逼
回复

使用道具 举报

60

主题

4504

回帖

9258

积分

论坛元老

积分
9258
发表于 2011-4-6 23:18:07 | 显示全部楼层
原帖由 xspoco 于 2011-4-6 23:44 发表


好牛逼
回复

使用道具 举报

38

主题

244

回帖

636

积分

高级会员

积分
636
发表于 2011-4-6 23:24:43 | 显示全部楼层
这语言真累,,,,
回复

使用道具 举报

151

主题

1826

回帖

4147

积分

论坛元老

积分
4147
发表于 2011-4-6 23:36:28 | 显示全部楼层
[ol]
  •         for div in divs:
  •                 div_html = div.__str__()
  •                 chinese_utf8 = re_chinese.findall(div_html)
  •                 chinese_number = len(chinese_utf8) / 3
  •                 if chinese_number 复制代码这段要改下,迭代里删东西会出问题的



      python 很好...
  • 回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    Archiver|手机版|小黑屋|Discuz! X

    GMT+8, 2025-4-25 12:54 , Processed in 0.017737 second(s), 4 queries , Gzip On, Redis On.

    Powered by Discuz! X3.5

    © 2001-2024 Discuz! Team.

    快速回复 返回顶部 返回列表