簡體 English 中英

如何在不重復數據的情況下將pandas數據框插入數據庫？

[英]How can I insert pandas dataframe to database without data duplication?

原文 2016-11-14 08:08:19 3 2 python/ pandas/ pymysql

我使用.to_sql函數插入數據。 但是它無法檢查重復的插入數據。 （它只能檢查重復的表）

源代碼），當我運行以下兩次源代碼時。

userData.to_sql(con=engine, name='test_quest_complete', schema='test', if_exists='append')

結果）在表中插入了相同的數據。

0   2016-11-14 00:00:10 AAAA
1   2016-11-14 00:00:20 BBBB
0   2016-11-14 00:00:10 AAAA
1   2016-11-14 00:00:20 BBBB

如何在不重復數據的情況下將pandas數據框插入數據庫？

（此外，我嘗試使用加載數據本地infile，但由於安全問題，我無法使用它。）

2 個解決方案

如果您對數據庫具有管理權限，建議您對表本身施加一些約束。 然后python插入將引發異常（您可以攔截它）。 另外，您還可以嘗試首先從表中檢索數據並將其合並到熊貓中。 然后對所有列進行分組，並獲取不存在的數據作為新數據框並將其插入。

import pandas as pd
import pypyodbc
from sqlalchemy import create_engine


##Data of Excel File - ExcelData(Sheet1)
##id    name
##1 11
##2 22
##3 33
##4 44
##5 55


##CREATE TABLE [test].[test_quest_complete](
##  [id] [int] NULL,
##  [name] [int] NULL
##) 


TblName="test_quest_complete"
cnxn = pypyodbc.connect("dsn=mydsn;Trusted_Connection=Yes")
engine = create_engine("mssql+pyodbc://mydsn")

file_name="C:\Users\poonamr\Desktop\ExcelData.xlsx"
xl = pd.ExcelFile(file_name)
userData = xl.parse("Sheet1")
print(userData)

sql="Select * From test." + TblName
tblData=pd.read_sql(sql,cnxn)
print(tblData)

Finalresult=pd.concat([userData, tblData]).drop_duplicates(keep=False)
print(Finalresult)

Finalresult.to_sql(TblName, engine, if_exists='append',schema='test', index=False)

如何使用pandas.read_csv將CSV文件中的數據插入數據框？

[英]How can I insert data from a CSV file into a dataframe using pandas.read_csv?

如何將 Pandas dataframe 插入另一個 Pandas Z6A8064B5DF479455500553C47C5505系列中？

[英]How to insert Pandas dataframe into another Pandas dataframe without wrapping it in a Series?

如何在 Pandas DataFrame 中的給定位置插入多行？

[英]How can I insert several rows at given position in pandas DataFrame?

如何通過mysqldb將pandas數據框插入數據庫？

[英]How to insert pandas dataframe via mysqldb into database?

如何將dataframe插入pandas中的SQl服務器數據庫

[英]how to insert dataframe into SQl server database in pandas

如何將數據插入到 MySQL 數據庫中？

[英]How can I insert data into a MySQL database?

如何使用 pyodbc 將 pandas 數據框寫入 Access 數據庫？

[英]How can I write a pandas dataframe into an Access database using pyodbc?

如何在沒有 Pandas 數據框的情況下復制 seaborn 計數圖？

[英]How can I replicate a seaborn countplot without a pandas dataframe?

我怎樣才能 plot 一個總計沒有 Pandas dataframe 中的 header 的條？

[英]How can I plot a bar with totals without the header in Pandas dataframe?

如何將 PySpark dataframe 插入具有雪花模式的數據庫中？

[英]How can I insert a PySpark dataframe into a database with a snowflake schema?

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 如何使用pandas.read_csv將CSV文件中的數據插入數據框？如何將 Pandas dataframe 插入另一個 Pandas Z6A8064B5DF479455500553C47C5505系列中？如何在 Pandas DataFrame 中的給定位置插入多行？如何通過mysqldb將pandas數據框插入數據庫？如何將dataframe插入pandas中的SQl服務器數據庫如何將數據插入到 MySQL 數據庫中？如何使用 pyodbc 將 pandas 數據框寫入 Access 數據庫？如何在沒有 Pandas 數據框的情況下復制 seaborn 計數圖？我怎樣才能 plot 一個總計沒有 Pandas dataframe 中的 header 的條？如何將 PySpark dataframe 插入具有雪花模式的數據庫中？

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM