NavigableString
字符串常被包含在tag内.Beautiful Soup用NavigableString
类来包装tag中的字符串:
一个NavigableString
字符串与Python中的Unicode字符串相同,并且还支持包含在遍历文档树和搜索文档树中的一些特性. 通过unicode()
方法可以直接将NavigableString
对象转换成Unicode字符串:
tag中包含的字符串不能编辑,但是可以被替换成其它的字符串,用replace_with()方法:
NavigableString
对象支持遍历文档树和搜索文档树中定义的大部分属性, 并非全部.尤其是,一个字符串不能包含其它内容(tag能够包含字符串或是其它tag),字符串不支持.contents
或.string
属性或find()
方法.
如果想在Beautiful Soup之外使用NavigableString
对象,需要调用unicode()
方法,将该对象转换成普通的Unicode字符串,否则就算Beautiful Soup已方法已经执行结束,该对象的输出也会带有对象的引用地址.这样会浪费内存.
Last updated