[英]How to prevent DMOZ data displaying in search engine results
當我在Google中查找網站時,結果頁面上的所有內容看起來都不錯,但DMOZ生成的域名旁邊的灰色標題/說明(如下屏幕截圖)除外。 其他所有元素都可以通過頁面標題正確生成,但我的網站上卻有描述。 下面的NOODP元標記已添加到包括主頁在內的每個頁面,但DMOZ標記仍顯示在搜索結果中。 ...
[英]How to prevent DMOZ data displaying in search engine results
當我在Google中查找網站時,結果頁面上的所有內容看起來都不錯,但DMOZ生成的域名旁邊的灰色標題/說明(如下屏幕截圖)除外。 其他所有元素都可以通過頁面標題正確生成,但我的網站上卻有描述。 下面的NOODP元標記已添加到包括主頁在內的每個頁面,但DMOZ標記仍顯示在搜索結果中。 ...
[英]Scrapy dmoz tutorial: _init_() takes at most 2 arguments (3 given)
PS C:\\ users \\ steve \\ tutorial>抓取抓取dmoz 我的dmoz Spider python腳本在這里 ...
[英]Exception when parsing structure.rdf.u8, using Jena
我使用Jena文檔中提供的上述代碼來解析ODP 。 首先,它給出了一些異常,因此我將所有jar文件添加到Jena包中,並得到以下長異常: ` 我不知道是否需要刪除一些jar文件來解決此問題,或者Apache站點中提供的代碼錯誤? ...
[英]Scrapy first tutorial dmoz returning en error “TypeError: Can't use implementer with classes. Use one of the class-declaration functions instead.”
運行第一個教程進行抓取時出錯。 cra草:0.22.2 lxml:3.3.5.0 libxml2:2.7.8 扭曲:12.0.0 Python:2.7.2(默認設置,2012年10月11日,20:14:37)-[兼容GCC 4.2.1的Apple Clang 4.0(標簽/A ...
[英]scrapy tutorial: cannot run scrapy crawl dmoz
我問一個新問題,因為我知道上一個問題還不夠清楚。 我正在嘗試遵循簡單的教程,但我陷入了關鍵步驟,即“ scrapy crawl dmoz'命令。代碼就是這個(我已經在python shell中編寫了該代碼,並輸入.py擴展名保存) : 我使用的目錄應該很好,請在樹下找到: 現在 ...
[英]Parsing DMOZ dumps for category queries in Python
我目前正在從事一個項目,該項目涉及尋找與某個關鍵字相關的“知識領域”。 我計划使用DMOZ進行此操作。 例如,“布拉德·皮特(Brad Pitt)” 等等... 我有DMOZ網站上的structure.rdf.u8轉儲。 有人向我提到,如果我不需要URL,僅此文件就足夠了(我 ...
[英]crawling multiple webpages from a website
我想從網站提取數據。 說,URL是http://www.example.com/ 。 因此,我將此URL放在start_urls (請參考文檔中的DMOZ示例)。 但是,當我輸入一個字符串並單擊一個按鈕時,我也想創建一個GUI,它將把該字符串附加到start_urls並提取所有可訪問的頁面 ...
[英]How to detect site listing in DMOZ directory from PHP
如何檢測PHP的DMOZ目錄中是否偵聽了特定站點? ...
[英]how to make use of rdf data of dmoz with mysql and php?
我在網上搜索過,但仍然無法得到可靠的答案。 我的目標是利用來自dmoz的rdf數據 ,所以這里有兩個問題: 如何將rdf導入mysql? (可以使用任何實體工具嗎?) 如何通過SPARQL查詢數據? (我應該使用哪個組件或查詢引擎) 根據我所學到的,我需要構建基於 ...
[英]Obtain website's description (meta) from ODP DMOZ.org using PHP
我在一個 php 網站上工作。 我想做的是取消網站的描述或元信息。 我希望做的是從dmoz.org獲取信息,有沒有辦法做這樣的事情? 如果沒有,那么其他選擇是什么? 卷曲? 非常感謝, 編輯: 顯然我的問題不清楚。 dmoz.org 是一個開放目錄,可為您提供有關網站的信息。 提供的信息與網站本 ...
[英]Dmoz/Monster algorithme to calculate count of each category and sub category?
我必須創建一個瀏覽頁面,如monter.com或dmoz目錄。 我的問題是每個類別的計數。 做類似事情的最好方法是什么? 我正在使用PHP / MySQL Thx! ...
[英]Parsing dmoz rdf files using PHP script
我使用了 php 腳本 http://sourceforge.net/projects/dmoz2mysql/files/ 下載、提取、清理、解析和插入 dmoz 數據到 MySQL 表中。 我在處理 structure.rdf 時沒有遇到任何問題。 但是在解析 content.rdf 時,插 ...
[英]how to obtain URLs from Dmoz ODP
我想為我的應用程序使用DMOZ ODP中存在的URL數據庫。 (URL字符串數組或包含相同字符串的文件)。 有什么方法可以獲取它(除了手動復制粘貼)? 編輯: 是否有任何腳本/代碼來解析rdf文件。 ...
[英]Parsing Huge XML Files in PHP
我正在嘗試將 DMOZ 內容/結構 XML 文件解析為 MySQL,但是所有現有的執行此操作的腳本都非常舊並且無法正常工作。 如何在 PHP 中打開一個大(+1GB)的 XML 文件進行解析? ...