簡體   English   中英

如何使用Perl創建網站摘要?

[英]How can I create a website summary with Perl?

當您在Facebook或Digg上共享內容時,它會生成頁面的一些摘要。 我將如何在Perl中做到這一點? 有什么算法?

例如:

如果我去Facebook並嘗試通過鏈接分享此問題: 如何使用Perl創建網站摘要?

它檢索“ Facebook / Digg獲取網站摘要?-堆棧溢出”作為標題(僅是頁面標題)和[...不完整的問題?]

CPAN是您的朋友。

一些有前途的模塊:

假設您的意思是共享鏈接...

通常,摘要是由提交URL的用戶編寫的。 如果您必須自動編寫摘要,可以通過以下方法實現:

  • 使用文檔正文的前100個左右的字符(本身並不容易)
  • 使用描述或關鍵字之類的元數據(通常為空或垃圾郵件)
  • 與上下文相關的摘要,例如重新創建Google代碼段 (對不起PHP,但很簡單)
  • 使用Yahoo Keyword Extractor API或您自己的關鍵字密度函數之類的文檔中的標簽/關鍵字

最好的選擇是詢問用戶!

希望能有所幫助:)

基本上,您想抓取URL並找到“最重要的段落”,它可能是第一個<h2>或<h1>之后的第一個<div>或<p>元素,具體取決於頁面的布局。

您可以檢查並查看頁面上是否有元描述,但這使您不受編寫元描述的任何人的影響。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM