找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 21|回复: 2

请教采集侠们一个问题

[复制链接]

7

主题

34

回帖

97

积分

注册会员

积分
97
发表于 2015-12-29 10:28:30 | 显示全部楼层 |阅读模式
本帖最后由 talaon 于 2015-12-29 10:36 编辑

采集百度知道的时候,答案是乱序的(用浏览器看源码正常)

比如一个答案里有100字,分十句,但采集下来后这十句是被打乱的。



比如用浏览器看源码是:
[ol]
  • 第一句,第二句,第三句,第N句
    [/ol]复制代码

    但采集下来变成:
    [ol]
  • 第三句,第二句,第N句,第一句
    [/ol]复制代码


    有采集过的能指导下哪里的问题吗?
  • 回复

    使用道具 举报

    20

    主题

    3203

    回帖

    6530

    积分

    论坛元老

    积分
    6530
    发表于 2015-12-29 10:41:09 | 显示全部楼层
    跟采集器的设置有关吧。发布的时候不要选打乱,按顺序发布
    回复

    使用道具 举报

    7

    主题

    34

    回帖

    97

    积分

    注册会员

    积分
    97
     楼主| 发表于 2015-12-29 10:43:50 | 显示全部楼层
    非那个顺序发布相关

    是采集下来的
    那段内容
    被乱序
    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    Archiver|手机版|小黑屋|Discuz! X

    GMT+8, 2025-2-2 15:52 , Processed in 0.017308 second(s), 4 queries , Gzip On, Redis On.

    Powered by Discuz! X3.5

    © 2001-2024 Discuz! Team.

    快速回复 返回顶部 返回列表