[英]Emails and Map Reduce Job
我只是從Hadoop開始,然后編寫一些Map Reduce作業。 我正在尋找有關在python中編寫MR作業的幫助,該作業使我可以接收一些電子郵件並將其放入HDFS,以便我可以搜索電子郵件的文本或附件?
謝謝!
對於處理電子郵件,來自stdlib的email
模塊可能會很方便。 對於Hadoop而言,盡管有很多Google搜索結果可供選擇,但將Python與Hadoop結合使用可能會很方便。
是的,如果要使用編寫Python代碼來運行MapReduce作業,則需要使用hadoop流
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.