python数据分析第四堂课抓取书名时报错问题

在练习python数据分析第四讲项目实践用scrapy抓取书名时出错, 老师在代码中用" item['book_name'] = div_zg_itemRow.xpath('.//a[@class="a-link-normal"]/text()')[2].extract()" 抓取书名, 现在练习时发现是空白,分析了源代码结构,在书名这里是这样的: <a class="a-link-normal" target="_blank" href="/gp/product/B009FWYL04/ref=zg_bs_books_1?ie=UTF8&amp;psc=1&amp;refRID=PZEZ5RPHVFMAGTXGD7XP">
        <div class="p13n-sc-truncated-hyphen p13n-sc-truncated" aria-hidden="true" data-rows="2" data-truncate-by-character="1" data-truncate-mix-weblab="true">我们仨</div>
    </a>
想问下在这里应该怎样取书名, 我改成了  item['book_name'] = div_zg_itemRow.xpath('.//a[@class="a-link-normal"]//div[@class="p13n-sc-truncated-hyphen p13n-sc-truncated"]/text()').extract()也是取不到书名 ??

Robin_TY - PhD@CSU,研究方向:计算机视觉,模式识别

赞同来自: wclluck

这是3个月前的项目代码,网页上肯定会更新,所以要适当地修改爬虫代码。其实不需要那么复杂,可以试试这样做: div_zg_itemRow.xpath('.//a/div/text()').extract()

wclluck

赞同来自:

谢谢老师, 刚才试过了,用 div_zg_itemRow.xpath('.//a/div/text()').extract()  可以拿到书名

要回复问题请先登录注册