python库lxml在linux和WIN系统下的安装

  • Post category:Linux

下面是关于在Linux和Windows系统下安装Python库lxml的详细步骤和示例说明:

安装步骤

1. 安装Python

在Linux中,一般自带Python,如果版本较低可以先升级。在Windows中需要先从官网下载Python安装包并安装。

2. 安装依赖项

lxml需要C库libxml2和libxslt的支持,如果系统中已经安装则可以跳过此步骤。否则需要先安装依赖项。

在Debian/Ubuntu系列中:

sudo apt-get install libxml2-dev libxslt-dev python-dev

在RedHat/CentOS系列中:

sudo yum install libxml2-devel libxslt-devel python-devel

在Windows中,可以从 xmlsoft.orgftp.zlatkovic.com/libxml/ 下载预编译好的二进制包并安装。

3. 安装lxml库

使用pip安装:

pip install lxml

或从源代码安装:

tar -zxvf lxml-x.y.z.tar.gz
cd lxml-x.y.z
python setup.py build
sudo python setup.py install

4. 测试lxml是否安装成功

使用Python命令行:

>>> import lxml.etree
>>> print(lxml.etree.LXML_VERSION)

如果输出lxml的版本号则说明安装成功。

示例说明

示例一:使用lxml解析XML文件

假设当前路径下有一个名为example.xml的XML文件,内容如下:

<?xml version="1.0"?>
<root>
    <element>hello</element>
    <element>world</element>
</root>

使用lxml解析该XML文件:

import lxml.etree as ET

with open("example.xml", "r") as f:
    xml_str = f.read()
root = ET.fromstring(xml_str)
for elem in root.iter():
    print(elem.tag, elem.text)

输出:

root None
element hello
element world

示例二:使用lxml处理HTML文档

假设当前路径下有一个名为example.html的HTML文件,内容如下:

<!DOCTYPE html>
<html>
<head>
    <title>Example HTML</title>
</head>
<body>
    <h1>Hello</h1>
    <p>World</p>
</body>
</html>

使用lxml处理该HTML文件:

import lxml.html as LH

with open("example.html", "r") as f:
    html_str = f.read()
root = LH.fromstring(html_str)
for elem in root.iter():
    print(elem.tag, elem.text)

输出:

html None
head None
title Example HTML
body None
h1 Hello
p World

以上是在Linux和Windows系统下安装Python库lxml的攻略及示例说明,如有不清楚之处可以向我提问。