[英]Exclude Items from Another Table in PHP and MySQL
我有一個表來跟蹤每個用戶單擊的鏈接,而我有另一個表。 這是每個表的結構:
鏈接: id | 鏈接| 價值| 添加日期
點擊次數: user_id | link_id | date_clicked
現在,這是我用來進行搜索的代碼,它可以正常工作,我只想知道是否有一種更有效的方法,因為被單擊的鏈接表很快就會變得很大。
$history_query = mysql_query("SELECT * FROM clicked_links WHERE user_id = '$id'") or die(mysql_error());
$history_array = array();
while ($h = mysql_fetch_array($history_query)) {
$history_array[] = $h['link_id'];
}
$clicked = implode(',', $history_array);
$link_query = mysql_query("SELECT * FROM chip_links WHERE id NOT IN ($clicked) ORDER BY value DESC") or die(mysql_error());
while ($r = mysql_fetch_array($link_query)) {
echo "<div id='claim{$r['id']}' style='text-align: center; font-weight: bold; font-size: 18px; float: left; width: 183px;'>
<a href='{$r['link']}' id='{$r['id']}' class='collect' target='_blank'>
Claim {$r['value']} points!
</a>
</div>";
}
運行單個查詢以獲取結果集將比運行單獨的查詢更為有效。
您不需要返回所有的link_id
值,將它們放入數組中,將數組放入字符串中,然后將該字符串推入另一個查詢中,然后將其洗回到數據庫中……數據庫已經具有該值。
該查詢將返回與您當前的$ link_query相等的結果集,而無需$ history_query或$ history_array。
SELECT l.id
, l.link
, l.value
FROM chip_links l
WHERE l.id NOT IN
( SELECT c.link_id
FROM clicked_links c
WHERE c.user_id = '$id'
AND c.link_id IS NOT NULL
)
ORDER BY l.value DESC
如果您不能保證clicked_links表中的link_id為NOT NULL,則需要在該子查詢中包含link_id IS NOT NULL
謂詞,因為如果link_id值為,則查詢將不返回任何行。空值。 (這是NOT IN (subquery)
構造的一個眾所周知且可避免的問題。
MySQL可能會將其優化為一個(希望更有效,但是)等效的NOT EXISTS相關子查詢,如下所示:
SELECT l.id
, l.link
, l.value
FROM chip_links l
WHERE NOT EXISTS
( SELECT 1
FROM clicked_links c
WHERE c.user_id = '$id'
AND c.link_id = l.id
)
ORDER BY l.value DESC
但是,為了獲得最佳性能,您可能要使用反聯接模式。
該LEFT JOIN操作基本上查找匹配行,和IS NOT NULL
謂詞將拋出匹配,所以你得到的回復是從行的行chip_links
那里是從沒有“匹配”行clicked_links
。
MySQL優化器通常使用如下查詢生成最有效的計划:
SELECT l.id
, l.link
, l.value
FROM chip_links l
LEFT
JOIN clicked_links c
ON c.link_id = l.id
AND c.user_id = '$id'
WHERE c.link_id IS NULL
ORDER
BY l.value DESC
為了在大型機器上獲得良好的性能,您可能還需要索引
... ON clicked_links (user_id, link_id)
... ON chip_links (value, id, link)
這應該允許完全從索引滿足查詢,而無需排序操作。 EXPLAIN輸出將包括“使用索引”,而將不包括“使用文件排序”)。
像這樣的一次性查詢,它會告訴您給定用戶未單擊的所有鏈接
SELECT l.* FROM chip_links l
LEFT JOIN clicked_links c ON (c.link_id=l.id AND l.user_id='$id')
WHERE c.link_id IS NULL
ORDER BY l.value DESC;
如果您不熟悉左聯接,它將包含clicked_links中join子句匹配的行,但是如果沒有匹配,我們將得到null。 由於我們對不匹配感興趣,因此WHERE子句確保這些是我們將獲得的唯一行。
這可能比使用兩個查詢和一些PHP代碼更為有效,但是只有一個基准可以肯定地告訴您。 您還應該檢查EXPLAIN SELECT ...
的輸出,以確保正在使用合適的索引。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.