> 文章列表 > pandas读取数据库

pandas读取数据库

pandas读取数据库

什么是Pandas

Pandas 是一个数据处理库,它提供了高性能且功能丰富的数据结构,可用于处理结构化数据。通过 Pandas,可以轻松地预处理和清理数据以及进行数据分析。另外,Pandas 还可以与许多其它数据处理库进行配合使用,如NumPy,Matplotlib等。

如何连接数据库

Pandas 有一个内置的功能,可用于连接并读取 SQL 数据库。Pandas 支持多种类型的 SQL 数据库,包括 MySQL,SQLite,PostgreSQL 等等。示例代码如下:

import pandas as pd
import sqlalchemy
engine = sqlalchemy.create_engine('postgresql://user:password@hostname/database_name')
df = pd.read_sql_table('table_name', engine)
print(df.head())

读取整张表的数据

在连接了数据库之后,我们可以通过 pd.read_sql_table() 来读取整张表的数据。这使我们能够轻松地将 SQL 数据库中的表转换为 Pandas DataFrame。示例代码如下:

import pandas as pd
import sqlalchemy
engine = sqlalchemy.create_engine('postgresql://user:password@hostname/database_name')
df = pd.read_sql_table('table_name', engine)
print(df.head())

读取指定字段的数据

如果只需要读取表中的部分字段,可以使用 pd.read_sql_query() 方法。该方法使用 SQL 查询语句来筛选指定字段的数据。示例代码如下:

import pandas as pd
import sqlalchemy
engine = sqlalchemy.create_engine('postgresql://user:password@hostname/database_name')
query = "SELECT col1, col2 FROM table_name"
df = pd.read_sql_query(query, engine)
print(df.head())

使用DataFrame.to_sql()方法写入数据库

Pandas 提供了 DataFrame.to_sql() 方法,以将 DataFrame 的数据写入 SQL 数据库中。该方法需要一个 SQLAlchemy 引擎,以及 Table 名称和连接等信息。示例代码如下:

import pandas as pd
import sqlalchemy
df = pd.read_csv('data.csv')
engine = sqlalchemy.create_engine('postgresql://user:password@hostname/database_name')
df.to_sql('table_name', engine, if_exists='replace')