爬虫python链接mysql数据库使用to_sql写入数据老报错的问题
liuian 2024-12-27 15:15 43 浏览
网上有很多使用爬虫技术抓取数据并写入cvs的教学案例
抓下来也没大的问题,但是如果自己本地建立了mysql数据库,使用很多公开的教程,反倒实现不了功能,经常报这样那样的错误,比如常见的UserWarning: pandas only support SQLAlchemy connectable(engine/connection)错误!
经过不少时间的折腾终于找到了解决问题的办法,是因为to_sql办法网上大多数教程都是老版本的链接数据库的办法,新的版本的pandas只支持SQLAlchemy的办法链接
老的链接数据库的办法一般是这样的
import pandas as pd
import pymysql
# 创建数据库连接
conn = pymysql.connect(host='localhost', port=3306, user='root', password='password', db='database_name')
# 创建游标对象 cursor = conn.cursor()
# 创建一个DataFrame示例
data = {'Name': ['John', 'Mike', 'Bob'], 'Age': [25, 30, 35]}
df = pd.DataFrame(data)
# 将DataFrame插入MySQL表
# 如果该表不存在,可以使用CREATE TABLE语句来创建它
df.to_sql(name='table_name', con=conn, if_exists='replace', index=False)
# 关闭游标和连接
cursor.close()
conn.close()
这样的话直接报错!
那么就需要用新的办法链接
from sqlalchemy import create_engine
MYSQL_HOST = 'localhost'
MYSQL_PORT = '3306'
MYSQL_USER = 'root'
MYSQL_PASSWORD = '12345678'
MYSQL_DB = 'stocks'
### 使用pandas to_sql写入数据
engine = create_engine('mysql+pymysql://%s:%s@%s:%s/%s?charset=utf8'% (MYSQL_USER, MYSQL_PASSWORD, MYSQL_HOST, MYSQL_PORT, MYSQL_DB))
#engine = create_engine(conn)
df = pd.DataFrame(all_products,columns=keys)
#replce 清除并重写,append 叠加数据
df.to_sql('test_ifeng',engine, if_exists='replace', index=False)
#raise SystemExit
OK,这样我们就能看到mysql数据库存入了相关的数据
这是昨天爬虫入库的完整代码,有三种写入数据库的办法
import requests
from bs4 import BeautifulSoup
import csv
import pandas as pd
from sqlalchemy import create_engine
url = 'http://www.ifeng.com'
page = requests.get(url)
soup = BeautifulSoup(page.content, 'html.parser')
# 设置headers
headers = {"User-Agent":"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.186 Safari/537.36",
}
# 设置cookies
cookies = {}
cookies['mall'] = '1638237165.7.1148.523814'
cookies['JSESSIONID'] = '7D7F08E6CAC6989FDE82EBDEBBF9CB21'
# 发起请求
res = requests.get(url, cookies=cookies, headers=headers, timeout=5)
#res = requests.get(url)
#title = soup.title.text
all_products = []
#print(soup)
products = soup.select('p.index_news_list_p_5zOEF')
#raise SystemExit
for product in products:
title = product.select('a')[0].text
url = product.select('a')[0].attrs['href']
all_products.append({
"biaoti":title,
"link": url
})
#csv写入办法
keys = all_products[0].keys()
with open('ifeng新闻.csv', 'w', newline='', encoding='utf-8-sig') as output_file:
dict_writer = csv.DictWriter(output_file, keys)
dict_writer.writeheader()
dict_writer.writerows(all_products)
MYSQL_HOST = 'localhost'
MYSQL_PORT = '3306'
MYSQL_USER = 'root'
MYSQL_PASSWORD = '12345678'
MYSQL_DB = 'stocks'
### 使用pandas to_sql写入数据
engine = create_engine('mysql+pymysql://%s:%s@%s:%s/%s?charset=utf8'% (MYSQL_USER, MYSQL_PASSWORD, MYSQL_HOST, MYSQL_PORT, MYSQL_DB))
#engine = create_engine(conn)
df = pd.DataFrame(all_products,columns=keys)
#replce 清除并重写,append 叠加数据
df.to_sql('test_ifeng',engine, if_exists='replace', index=False)
#raise SystemExit
### 使用pandas to_csv写入数据
pd.DataFrame(all_products,columns=keys).to_csv('ifeng新闻1.csv', encoding='utf-8-sig')
相关推荐
- 声卡驱动64位(创新声卡kx 3552 win10 64位驱动补丁)
-
根据我的了解,惠普战66声卡通常使用RealtekHighDefinitionAudio驱动程序。然而,具体的驱动版本可能会因操作系统和硬件配置而有所不同。为了确保获得最佳的音频性能和兼容性,建...
- 笔记本蓝牙驱动怎么安装(笔记本蓝牙驱动安装步骤)
-
我们在使用电脑的时候,要想进行一些远程操作,那么蓝牙的功能是非常重要的,可是一些朋友因为电脑没有蓝牙驱动程序而无法启动蓝牙,现在就来说说蓝牙驱动安装的详细操作步骤吧。第一步:首先鼠标右键点击开始并选择...
- win8系统多大(win8.1系统多大)
-
win8更大,安装后占C盘约15G,win7约占8-10G.个人觉得win8更好,如果要安装的话,最好给C盘留100G空间,这样方便以后软件的安装以及系统的持久运行。对于系统的选择,一是看是该系统否...
- 我的邮箱怎么填写(我的邮箱地址怎么填写)
-
首先进入写邮件界面,在收件人一栏输入收件邮箱,邮箱格式为帐号+@+域名,然后正确填写格式,在主题处要突出邮件的主旨,让别人知道要传递的事情,比如安排、询问等,在正文中开头是尊称;就填写上你的邮件地址就...
- win11系统体验版(win10体验win11)
-
要体验最新的Win11系统,首先需要检查电脑是否符合Win11的硬件要求,例如处理器、存储、显卡等。如果符合要求,可以前往微软官网下载Win11系统的ISO镜像文件,然后将其写入U盘或DVD光盘。接着...
-
- 可以免费主题的软件下载(有什么可以免费弄主题的软件)
-
步骤如下:1.我们首先打开vivo手机,在vivo手机自带的APP找到I主题,然后打开I主题,会在打开的时候看到精选里面包含了:主题,字体,铃声,息屏和动态壁纸。2.我们在我们在此页面的右上角找到一个放大镜的标识,点击,然后在弹出的页面输...
-
2025-11-11 06:55 liuian
- 怎么设置路由器ip(怎么设置路由器IP地址成2网段)
-
设置Wifi路由器的IP地址需要登录路由器管理界面。一般来说,路由器的管理地址为192.168.1.1或192.168.0.1,具体地址可以在路由器说明书或者设备背面上找到。下面是具体操作步骤:1....
-
- ie8浏览器是什么意思(ie8浏览器是什么样子的)
-
IE8浏览器发布于2009年3月,携手Windows7,安全性得到非常大的增强,可以下载超过4G的文件,也是微软第一个64位版浏览器。微软的IE浏览器,版本是8——11原名叫MicrosoftInternetExplorer是微软...
-
2025-11-11 05:55 liuian
-
- 怎么登陆qq邮箱(163邮箱怎么登陆qq邮箱)
-
1.以苹果iPhone12、iOS15.3为例。选qq邮箱在苹果手机邮件应用页,点击“qq邮箱”选项。2.点下一步输入帐号密码,点击“下一步”。3.验证登录验证完成后,进行登录即可。...
-
2025-11-11 05:05 liuian
- win7纯净旗舰版下载(win7 纯净版)
-
下载win7纯净版方法如下:在电脑上打开搜索软件,在搜索框里搜寻微软官方网址,打开官网后,第一条进入找到系统版本选择WIN7纯净版,点击立即下载将下载地址设置为本地C盘,下载进度100%后就下载成功...
- 大白菜重装系统详细步骤(大白菜重装系统步骤和详细教程)
-
u盘大白菜重装系统的步骤~~1、首先将u盘制作成大白菜u盘启动盘,重启电脑等待出现开机画面按下启动快捷键,选择u盘启动进入到大白菜主菜单,选取“【02】运行大白菜Win8PE装机维护版(新机器)”选项...
- office plus官方网站(officeplus官方网站公众号)
-
1、选中你想要添加翻页的ppt页面,我们这里以这个ppt的第二个页面为例。;2、在页面上方的菜单栏找到“切换'这个选项,选择”切换“中的”页面卷曲“动画效果。;3、设置完毕后,如果你想要选择翻...
- u盘制作启动盘后如何恢复原来的样子
-
可以通过U盘启动盘制作工具的恢复普通盘功能将制作了启动盘的U盘恢复为一个普通U盘,这类制作工具核心相同,都可以实现删除隐藏启动文件的功能,下面以电脑店启动盘制作工具为例:1、将U盘插入电脑,然后运行电...
- xp系统安装版免费版华为版(windows xp 安装版)
-
1、点击主界面中的【设置】进入到设置界面,然后向下滑动即可找到【开发者选项】,点击进入。2、点击【开发者选项】右边的按钮打开此功能,然后在弹出的提示框中选择【确定】。值得注意的是,启用这个功能可能会导...
- 手机网页自动翻译插件(手机网页自动翻译插件免费版)
-
找到了吗你好;苹果自带浏览器添加书签按也是要占用手机内存的,自带浏览器的安装包太大,会影响手机运行的,你可以下载一个QQ浏览器。它的安装包很小,不影响手机运行,它使用的极速内核,有着神速一般的浏览体验...
- 一周热门
- 最近发表
- 标签列表
-
- python判断字典是否为空 (50)
- crontab每周一执行 (48)
- aes和des区别 (43)
- bash脚本和shell脚本的区别 (35)
- canvas库 (33)
- dataframe筛选满足条件的行 (35)
- gitlab日志 (33)
- lua xpcall (36)
- blob转json (33)
- python判断是否在列表中 (34)
- python html转pdf (36)
- 安装指定版本npm (37)
- idea搜索jar包内容 (33)
- css鼠标悬停出现隐藏的文字 (34)
- linux nacos启动命令 (33)
- gitlab 日志 (36)
- adb pull (37)
- python判断元素在不在列表里 (34)
- python 字典删除元素 (34)
- vscode切换git分支 (35)
- python bytes转16进制 (35)
- grep前后几行 (34)
- hashmap转list (35)
- c++ 字符串查找 (35)
- mysql刷新权限 (34)
