在Python中验证(X)HTML

验证文档是否遵循某个HTML版本(最好是我可以指定的版本)的最佳方法是什么?我希望能够知道失败发生在哪里,比如在基于web的验证器中,除了在本机Python应用程序中

PyTidyLib是一个很好的用于HTML的python绑定。他们的例子是:

来自tidylib导入tidy_文档的


文件,错误=TINDY_文件('''<p>fõo<img src='https://stackoverflow.com/questions/35538/bar.jpg“>”,
选项={'numeric-entities':1})
打印文档
打印错误

此外,它与传统的HTMLTidy和新的Tidy-html5兼容

发表评论