百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT知识 > 正文

爬虫python链接mysql数据库使用to_sql写入数据老报错的问题

liuian 2024-12-27 15:15 43 浏览

网上有很多使用爬虫技术抓取数据并写入cvs的教学案例

抓下来也没大的问题,但是如果自己本地建立了mysql数据库,使用很多公开的教程,反倒实现不了功能,经常报这样那样的错误,比如常见的UserWarning: pandas only support SQLAlchemy connectable(engine/connection)错误!

经过不少时间的折腾终于找到了解决问题的办法,是因为to_sql办法网上大多数教程都是老版本的链接数据库的办法,新的版本的pandas只支持SQLAlchemy的办法链接

老的链接数据库的办法一般是这样的

import pandas as pd

import pymysql

# 创建数据库连接

conn = pymysql.connect(host='localhost', port=3306, user='root', password='password', db='database_name')

# 创建游标对象 cursor = conn.cursor()

# 创建一个DataFrame示例

data = {'Name': ['John', 'Mike', 'Bob'], 'Age': [25, 30, 35]}

df = pd.DataFrame(data)

# 将DataFrame插入MySQL表

# 如果该表不存在,可以使用CREATE TABLE语句来创建它

df.to_sql(name='table_name', con=conn, if_exists='replace', index=False)

# 关闭游标和连接

cursor.close()

conn.close()

这样的话直接报错!

那么就需要用新的办法链接

from sqlalchemy import create_engine

MYSQL_HOST = 'localhost'

MYSQL_PORT = '3306'

MYSQL_USER = 'root'

MYSQL_PASSWORD = '12345678'

MYSQL_DB = 'stocks'

### 使用pandas to_sql写入数据

engine = create_engine('mysql+pymysql://%s:%s@%s:%s/%s?charset=utf8'% (MYSQL_USER, MYSQL_PASSWORD, MYSQL_HOST, MYSQL_PORT, MYSQL_DB))

#engine = create_engine(conn)

df = pd.DataFrame(all_products,columns=keys)

#replce 清除并重写,append 叠加数据

df.to_sql('test_ifeng',engine, if_exists='replace', index=False)

#raise SystemExit

OK,这样我们就能看到mysql数据库存入了相关的数据

这是昨天爬虫入库的完整代码,有三种写入数据库的办法

import requests

from bs4 import BeautifulSoup

import csv

import pandas as pd

from sqlalchemy import create_engine

url = 'http://www.ifeng.com'

page = requests.get(url)

soup = BeautifulSoup(page.content, 'html.parser')

# 设置headers

headers = {"User-Agent":"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.186 Safari/537.36",

}

# 设置cookies

cookies = {}

cookies['mall'] = '1638237165.7.1148.523814'

cookies['JSESSIONID'] = '7D7F08E6CAC6989FDE82EBDEBBF9CB21'

# 发起请求

res = requests.get(url, cookies=cookies, headers=headers, timeout=5)

#res = requests.get(url)

#title = soup.title.text

all_products = []

#print(soup)

products = soup.select('p.index_news_list_p_5zOEF')

#raise SystemExit

for product in products:

title = product.select('a')[0].text

url = product.select('a')[0].attrs['href']

all_products.append({

"biaoti":title,

"link": url

})

#csv写入办法

keys = all_products[0].keys()

with open('ifeng新闻.csv', 'w', newline='', encoding='utf-8-sig') as output_file:

dict_writer = csv.DictWriter(output_file, keys)

dict_writer.writeheader()

dict_writer.writerows(all_products)

MYSQL_HOST = 'localhost'

MYSQL_PORT = '3306'

MYSQL_USER = 'root'

MYSQL_PASSWORD = '12345678'

MYSQL_DB = 'stocks'

### 使用pandas to_sql写入数据

engine = create_engine('mysql+pymysql://%s:%s@%s:%s/%s?charset=utf8'% (MYSQL_USER, MYSQL_PASSWORD, MYSQL_HOST, MYSQL_PORT, MYSQL_DB))

#engine = create_engine(conn)

df = pd.DataFrame(all_products,columns=keys)

#replce 清除并重写,append 叠加数据

df.to_sql('test_ifeng',engine, if_exists='replace', index=False)

#raise SystemExit

### 使用pandas to_csv写入数据

pd.DataFrame(all_products,columns=keys).to_csv('ifeng新闻1.csv', encoding='utf-8-sig')

相关推荐

声卡驱动64位(创新声卡kx 3552 win10 64位驱动补丁)

根据我的了解,惠普战66声卡通常使用RealtekHighDefinitionAudio驱动程序。然而,具体的驱动版本可能会因操作系统和硬件配置而有所不同。为了确保获得最佳的音频性能和兼容性,建...

笔记本蓝牙驱动怎么安装(笔记本蓝牙驱动安装步骤)

我们在使用电脑的时候,要想进行一些远程操作,那么蓝牙的功能是非常重要的,可是一些朋友因为电脑没有蓝牙驱动程序而无法启动蓝牙,现在就来说说蓝牙驱动安装的详细操作步骤吧。第一步:首先鼠标右键点击开始并选择...

win8系统多大(win8.1系统多大)

win8更大,安装后占C盘约15G,win7约占8-10G.个人觉得win8更好,如果要安装的话,最好给C盘留100G空间,这样方便以后软件的安装以及系统的持久运行。对于系统的选择,一是看是该系统否...

我的邮箱怎么填写(我的邮箱地址怎么填写)

首先进入写邮件界面,在收件人一栏输入收件邮箱,邮箱格式为帐号+@+域名,然后正确填写格式,在主题处要突出邮件的主旨,让别人知道要传递的事情,比如安排、询问等,在正文中开头是尊称;就填写上你的邮件地址就...

win11系统体验版(win10体验win11)

要体验最新的Win11系统,首先需要检查电脑是否符合Win11的硬件要求,例如处理器、存储、显卡等。如果符合要求,可以前往微软官网下载Win11系统的ISO镜像文件,然后将其写入U盘或DVD光盘。接着...

可以免费主题的软件下载(有什么可以免费弄主题的软件)
可以免费主题的软件下载(有什么可以免费弄主题的软件)

步骤如下:1.我们首先打开vivo手机,在vivo手机自带的APP找到I主题,然后打开I主题,会在打开的时候看到精选里面包含了:主题,字体,铃声,息屏和动态壁纸。2.我们在我们在此页面的右上角找到一个放大镜的标识,点击,然后在弹出的页面输...

2025-11-11 06:55 liuian

怎么设置路由器ip(怎么设置路由器IP地址成2网段)

设置Wifi路由器的IP地址需要登录路由器管理界面。一般来说,路由器的管理地址为192.168.1.1或192.168.0.1,具体地址可以在路由器说明书或者设备背面上找到。下面是具体操作步骤:1....

ie8浏览器是什么意思(ie8浏览器是什么样子的)
ie8浏览器是什么意思(ie8浏览器是什么样子的)

IE8浏览器发布于2009年3月,携手Windows7,安全性得到非常大的增强,可以下载超过4G的文件,也是微软第一个64位版浏览器。微软的IE浏览器,版本是8——11原名叫MicrosoftInternetExplorer是微软...

2025-11-11 05:55 liuian

怎么登陆qq邮箱(163邮箱怎么登陆qq邮箱)
怎么登陆qq邮箱(163邮箱怎么登陆qq邮箱)

1.以苹果iPhone12、iOS15.3为例。选qq邮箱在苹果手机邮件应用页,点击“qq邮箱”选项。2.点下一步输入帐号密码,点击“下一步”。3.验证登录验证完成后,进行登录即可。...

2025-11-11 05:05 liuian

win7纯净旗舰版下载(win7 纯净版)

下载win7纯净版方法如下:在电脑上打开搜索软件,在搜索框里搜寻微软官方网址,打开官网后,第一条进入找到系统版本选择WIN7纯净版,点击立即下载将下载地址设置为本地C盘,下载进度100%后就下载成功...

大白菜重装系统详细步骤(大白菜重装系统步骤和详细教程)

u盘大白菜重装系统的步骤~~1、首先将u盘制作成大白菜u盘启动盘,重启电脑等待出现开机画面按下启动快捷键,选择u盘启动进入到大白菜主菜单,选取“【02】运行大白菜Win8PE装机维护版(新机器)”选项...

office plus官方网站(officeplus官方网站公众号)

1、选中你想要添加翻页的ppt页面,我们这里以这个ppt的第二个页面为例。;2、在页面上方的菜单栏找到“切换'这个选项,选择”切换“中的”页面卷曲“动画效果。;3、设置完毕后,如果你想要选择翻...

u盘制作启动盘后如何恢复原来的样子

可以通过U盘启动盘制作工具的恢复普通盘功能将制作了启动盘的U盘恢复为一个普通U盘,这类制作工具核心相同,都可以实现删除隐藏启动文件的功能,下面以电脑店启动盘制作工具为例:1、将U盘插入电脑,然后运行电...

xp系统安装版免费版华为版(windows xp 安装版)

1、点击主界面中的【设置】进入到设置界面,然后向下滑动即可找到【开发者选项】,点击进入。2、点击【开发者选项】右边的按钮打开此功能,然后在弹出的提示框中选择【确定】。值得注意的是,启用这个功能可能会导...

手机网页自动翻译插件(手机网页自动翻译插件免费版)

找到了吗你好;苹果自带浏览器添加书签按也是要占用手机内存的,自带浏览器的安装包太大,会影响手机运行的,你可以下载一个QQ浏览器。它的安装包很小,不影响手机运行,它使用的极速内核,有着神速一般的浏览体验...