![](/img/trans.png)
[英]Python reading Excel spreadsheet, creating multiple lists according to variables and conditions
[英]Python Excel Spreadsheet Reading
import pandas as pd
#Read File
contacts_file = pd.read_excel("Contacts_Sheet.xlsx", sheet_name="Sheet1", email=[1])
#Get emails
real_email = contacts_file["@" in contacts_file["Company Email:"]]
#Output Doc
real_email.to_excel("All_emails.xlsx")
我有一个包含电子邮件和公司名称的电子表格,但是有很多公司无法找到电子邮件并且位置是“NA”。 我想创建一个程序,将第 2 列中的所有电子邮件与第 1 列中的公司名称一起取出,但我不知道如何“搜索”这些电子邮件。 我的想法是在每个字符串中找到“@”,因为这是将电子邮件与其他字符串区分开来的唯一因素。 这就是我在上面的代码中试图做的。
你需要str.contains
IE
df = pd.DataFrame({'Company' : ['A','B'],
'Email' : ['test@test.com',np.nan]})
print(df)
Company Email
0 A test@test.com
1 B NaN
df_new = df[df['Email'].str.contains('@')==True]
print(df_new)
Company Email
0 A test@test.com
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.