Python Excel 电子表格读取

Question

import pandas as pd
    
#Read File
contacts_file = pd.read_excel("Contacts_Sheet.xlsx", sheet_name="Sheet1", email=[1])
    
#Get emails
real_email = contacts_file["@" in contacts_file["Company Email:"]]
    
#Output Doc
real_email.to_excel("All_emails.xlsx")

我有一个包含电子邮件和公司名称的电子表格，但是有很多公司无法找到电子邮件并且位置是“NA”。 我想创建一个程序，将第 2 列中的所有电子邮件与第 1 列中的公司名称一起取出，但我不知道如何“搜索”这些电子邮件。 我的想法是在每个字符串中找到“@”，因为这是将电子邮件与其他字符串区分开来的唯一因素。 这就是我在上面的代码中试图做的。

Answer 1

你需要str.contains

IE

df = pd.DataFrame({'Company' : ['A','B'],
             'Email'  : ['test@test.com',np.nan]})

print(df)

  Company          Email
0       A  test@test.com
1       B            NaN

df_new = df[df['Email'].str.contains('@')==True]

print(df_new)

      Company          Email
    0       A  test@test.com

Python Excel 电子表格读取

问题描述

1 个解决方案

解决方案1
0 2020-07-10 12:59:44

Python Excel 电子表格读取

问题描述

1 个解决方案

解决方案1 0 2020-07-10 12:59:44

解决方案1
0 2020-07-10 12:59:44