博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
BeautifulSoup库未写明解析器警告
阅读量:6870 次
发布时间:2019-06-26

本文共 1128 字,大约阅读时间需要 3 分钟。

from urllib.request import urlopenfrom bs4 import BeautifulSouphtml = urlopen("http://www.pythonscraping.com/pages/page1.html")bsObj = BeautifulSoup(html.read())print(bsObj.h1)

代码运行之后警告如下:

UserWarning: No parser was explicitly specified, so I'm using the best available HTML parser for this system ("lxml"). This usually isn't a problem, but if you run this code on another system, or in a different virtual environment, it may use a different parser and behave differently.

The code that caused this warning is on line 4 of the file D:/Python/venv/test8.py. To get rid of this warning, pass the additional argument 'features="lxml"' to the BeautifulSoup constructor.

翻译如下:

用户警告:没有显式指定语法分析器,因此我使用了此系统的最佳可用HTML语法分析器(“lxml”)。这通常不是问题,但是如果您在另一个系统上运行此代码,或者在不同的虚拟环境中运行此代码,它可能会使用不同的解析器并表现出不同的行为。

导致此警告的代码位于文件d:/python/venv/test8.py的第4行。要消除此警告,请将附加参数'features=“lxml”'传递给beautifulsoup构造函数。

解决:指定解析器,一般使用'lxml'

from urllib.request import urlopenfrom bs4 import BeautifulSouphtml = urlopen("http://www.pythonscraping.com/pages/page1.html")bsObj = BeautifulSoup(html.read(),'lxml')print(bsObj.h1)

转载于:https://blog.51cto.com/12884584/2348995

你可能感兴趣的文章
ubuntu jdk 环境变量配置
查看>>
用freeswitch架构自己的VOIP网络电话
查看>>
《虚拟机并发编程》读书笔记(二)关于STM
查看>>
游戏修改记录
查看>>
全栈工程师特写
查看>>
页面点击其他位置,目标标签都隐藏
查看>>
WordPress主题教程(三):HTML静态模板制作
查看>>
C#游戏编程之创建一个简单的卷轴射击游戏
查看>>
varnish 4.0 官方文档翻译5-varnish概况
查看>>
阿里云漏洞提示:phpMyAdmin <=4.8.1 checkPageValidity函数缺陷可导致GETSHELL
查看>>
pyCharm中python对象的自动提示问题
查看>>
一些常用JavaScript方法的重写 持续更新中
查看>>
URL短地址压缩算法 微博短地址原理解析 (Java实现)
查看>>
redis中lua应用
查看>>
Receiver type for instance message is a forward
查看>>
Stream上传插件(HTML5支持拖拽、断点续传)
查看>>
用做产品的思路去开发基础框架
查看>>
内存使用技巧及内存池实现
查看>>
【转】实战低成本服务器搭建千万级数据采集系统
查看>>
四:Mysql存储引擎简介
查看>>