@byxiaoxie6 年前

07/22
16:01
Home

Python3入门爬虫

HTML源代码:

<html xmlns=http://www.w3.org/1999/xhtml>
	<meta http-equiv=Content-Type content="text/html;charset=utf-8">
    <title>爬虫测试</title>
	
    <head>
        <body>
            <h1>任务1:把[P]标签内容利用爬虫全部读取出来.</h1>
            <h2>任务2:把[A]标签连接全部利用爬虫读取出来.</h2>
            <h2>任务3:把[Img]标签图片地址全部读取出来.</h2>
            <h1>任务4:读取完每一个后利用[\n]换行.</h1>
            <hr>
            <p>Test_P_1</p>
            <p>Test_P_2</p>
            <p>Test_P_3</p>
            <p>Test_P_4</p>
            <p>Test_P_5</p>
            <hr>
            <a href="https://baidu.com">连接1_baidu</a>
            <a href="https://byxiaoxie.com">连接2_byxiaoxie</a>
            <a href="http://xz.nicokun.com">连接3_nicokun</a>
            <hr>
            <img src="img_1.jpg" alt="图片1">
            <img src="img_2.jpg" alt="图片2">
            <img src="img_3.jpg" alt="图片3">
        </body>
    </head>
</html>

阅读全文 →

Python3入门爬虫

加载中……