用 Scrapy 爬取中文内容保存到 JSON 文件时总是出现 Unicode 码,解决办法如下。
在 piplines.py 文件中插入如下代码:
import json, codecs
class MyfirstPipeline(object):
def __init__(self):
self.file = codecs.open('result.json', 'w', encoding='utf-8')
def process_item(self, item, spider):
line = json.dumps(dict(item)) + "\n"
self.file.write(line.decode('unicode_escape'))
return item
或者是:
import json, codecs
class MyfirstPipeline(object):
def __init__(self):
self.file = codecs.open('result.json', 'w', encoding='utf-8')
def process_item(self, item, spider):
line = json.dumps(dict(item), ensure_ascii=False) + "\n"
self.file.write(line)
return item
在 setting.py 文件中插入如下代码:
ITEM_PIPELINES = {
'myfirst.pipelines.MyfirstPipeline': 800,
}
OK!
PREVIOUS服务器上搭建 Git 以及客户端操作
NEXT春雨