数据库

首页 » 常识 » 问答 » 表哥表姐,不加班学Python从Exc
TUhjnbcbe - 2025/5/14 22:17:00

前言

Python非常强大,并且与Excel相比具有许多优势,包括处理大型数据集和能够自动化工作流的功能,仅举几例。但是,学习如何编程可能会有非常陡峭的学习曲线,因此从长远来看,耐心地坚持下去将是有益的。

在干就行!大牛给初学者推荐的10个Python经典案例里,我们对大家想学习的十几个Python应用场景做了投票调查。结果很让人意外,居然Python在办公领域应用很受欢迎!那下面赶紧为大家撰写了这篇办公领域内很经典的Excel应用场景的入门上手文章。

从Excel到Python入门速成来了

作为具有Excel背景的初学者,经常发现很难在Python中执行我熟悉的在Excel中执行的常见任务。当尝试执行一些常见任务时,例如更改列的格式,将列过滤为行的子集,基于其他列的信息创建新列等,经常会遇到问题,在解决问题过程中表哥表姐会感到沮丧。

没学过Python的表哥表姐,不要烦恼!专门为你们带来了以下将Excel中执行的一些操作和Python中执行类似任务的代码做了一个对比介绍。在耐心看完下面的例子讲解后,相信你们会有不小的收获,可以将工作从Excel开始转移到Python来了。

显示和格式

在Excel中完成的一项常见任务是将数字数据更改为数字格式。数字可能变得难以阅读,尤其是在处理大数字时。下面,将pandas库中的格式设置选项应用于虚拟数据。

pd.options.display.float_format=${:,。2f}.format

薪金列中的数字数据用逗号分隔,以便于阅读

执行的另一个常见任务是Excel用日期格式将日期列覆盖,以允许按年,月或日对数据进行切片。可以使用Pandas的to_datetime函数在Python中执行此操作。出生日期下方的列将转换为datetime格式。

df[dateofbirth]=pd.to_datetime(df[dateofbirth])

出生日期列将转换为日期时间格式

重复项

作为一个新手,你会发现使用代码识别数据库中的重复条目非常困难。为了识别,查看和删除重复项,首先使用Pandas库中的重复方法,通过获取数据库中所有重复项的总数,来检查数据库中是否存在重复项。

df.duplicated([dateofbirth,Name]).sum()

然后,您可以使用Pandas的.loc方法查看包含重复项的行。复制的方法的keep参数设置为False,以查看数据库中早晚出现的重复性。

rows_to_check_for_duplicates=[dateofbirth,Name]df.loc[df.duplicated(rows_to_check_for_duplicates,keep=False),:]

查看重复的条目。

要删除重复的行,可以使用drop_duplicates方法。该就地参数设置为True,以影响地方的基础数据,确保重复的从数据库的原始副本删除。

df.drop_duplicates([dateofbirth,Name],inplace=True)

复制的行将从数据库中删除。

1
查看完整版本: 表哥表姐,不加班学Python从Exc