-
-
姝数 数据达人Lv4
发表于2018-9-19 18:48
悬赏1
已解决


姝数 发表于 2018-9-20 10:53
我按您这个在网页上可以出来,在I中就是如图
爬取数据是在服务器上执行的,需要服务器可以访问到www.stats.gov.cn,你本地可以打开那个www.stats.gov.cn,但是服务器不一定可以,有些服务器上会有各种限制对服务器的进入和出入的地址进行了严格的限制,或者服务器本身就是内网的一台机器,它无法访问外网。像这种需要您联系服务器管理员确定服务器上是否可以访问www.stats.gov.cn。如果服务器是linux,可以用wget www.stats.gov.cn命令查看服务器是否可以访问www.stats.gov.cn,如果服务器是windows,可以远程登录服务器,在服务器的浏览器里面输入www.stats.gov.cn这个地址,看是否可以访问。
11个回答
第三张图的错误信息是说21.193.56.42这台机器无法访问www.shibor.org
可能原因有很多种,但归根到底就是一种,21.193.56.42无法连接www.shibor.org,原因有可能是:
1.21.193.56.42这台机器配置的DNS无法解析www.shibor.org这个域名。
2.21.193.56.42这台机器的访问出口被限制了,不让访问外部网络,现在很多很多云服务器都会对服务器的出口和入口网络进行限制。
---------------认怂分割线--------------------
3.其他的,我也不懂
1、表格ID:在网页上的表格无明显关键字 或者 有多个同样标题的表格时,可以考虑取表格的ID来定位表格(对应表格<table> DOM对象的id属性)。
2、关键字,高级设置中的表格ID和表格名称三者至少选填一项即可!
3、先用浏览器访问一下那个网址看看能不能访问到
4、可以如下图配置测试一下这个功能,
http://www.stats.gov.cn/tjsj/tjgb/rkpcgb/qgrkpcgb/201104/t20110429_30328.html
缱绻 发表于 2018-9-20 10:09
1、表格ID:在网页上的表格无明显关键字 或者 有多个同样标题的表格时,可以考虑取表格的ID来定位表格(对 ...
我按您这个在网页上可以出来,在I中就是如图


姝数 发表于 2018-9-20 10:53
我按您这个在网页上可以出来,在I中就是如图
爬取数据是在服务器上执行的,需要服务器可以访问到www.stats.gov.cn,你本地可以打开那个www.stats.gov.cn,但是服务器不一定可以,有些服务器上会有各种限制对服务器的进入和出入的地址进行了严格的限制,或者服务器本身就是内网的一台机器,它无法访问外网。像这种需要您联系服务器管理员确定服务器上是否可以访问www.stats.gov.cn。如果服务器是linux,可以用wget www.stats.gov.cn命令查看服务器是否可以访问www.stats.gov.cn,如果服务器是windows,可以远程登录服务器,在服务器的浏览器里面输入www.stats.gov.cn这个地址,看是否可以访问。