[英]Dump data from HTML to database(SQLite3) in Python Django
我正在从邮件中读取内容,并使用'html2text'将其转换为普通数据。 最后我的输出如下
Reservation Confirmation #184146
Last Modified On: 03/12/2014 03:24 PM
Pick-up Date:
03/18/2014 - Tuesday
Pick-up Time:
11:20 PM
Service Type:
From Airport
Passenger:
MR.Ramesh
Phone Number:
(000) 000-0000
No. of Pass:
4
Vehicle Type:
suv
Primary/Billing Contact:
some name
Booking Contact:
MR.Ramesh
Payment Method:
CC 0000
i am planing to dump this data to my DB(SQLite3).
如何在python,django中执行此操作上面的数据应如下所示:ReservationConfirmation = 184146 Pick-upDate = 03/18/2014-Tuesday Pick-upTime = 11:20 PM Etc ...
So, that i can dump in to corresponding fields in database.
假设HTML只是一个巨大的<p>
块,这意味着将没有任何HTML标记可帮助您的程序理解数据,您最好的选择可能是将电子邮件解析为字符串并进行几次拆分。
首先在“ \\ n \\ n”上进行split()(例如email = email.split("\\n\\n")
)。 这应该会产生一个列表,其中每个键/值对都是字符串,例如['Pick-up Date:\\n03/18/2014 - Tuesday', 'Pick-up Time:\\n11:20 PM']
。
然后在“:”上拆分()(例如email = [entry.split(":") for entry in email]
))。 这将产生键/值列表的列表,例如[['Pick-up Date', '\\n03/18/2014 - Tuesday'], ['Pick-up Time', '\\n11:20 PM']]
最后, parsed_email = {entry[0].strip():entry[1].strip() for entry in email}
应该为您提供一个数据字典,然后可以将其加载到SQLite中,除去任何多余的空白,例如\\n
是我们的示例。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.