亚马逊以编程方式获取产品 ASIN

Question

我正在尝试以编程方式检索 500 多本书的 ASIN 编号。

示例：Joseph Heller 的 Product Catch-22 亚马逊 URL： https : //www.amazon.com/Catch-22-Joseph-Heller/dp/3866155239

我可以通过浏览器搜索每个产品来手动获取产品编号，但这效率不高。 我想在最坏的情况下使用 API 或 wget/curl，但我遇到了一些绊脚石。

Amazon API 并不是最容易使用的......（我一直在用头撞墙，试图用 python 使签名请求哈希正确无济于事......）

然后我认为 googler 可能是另一种选择，但是在 15 个请求之后（即使有 time.sleep(30) google 也会将我锁定几个小时 [来自多个 IP 来源]）。

bing 怎么样……好吧，他们没有通过 API 显示任何亚马逊结果……这真的很奇怪……

我尝试用 wget 编写自己的 Google 解析器，但随后我必须将所有这些导入 BeautifulSoup 并重新解析……我的 sed 和 awk 技能还有很多不足之处……

基本上......有没有人遇到过以编程方式获取产品ASIN编号的更简单方法？

Answer 1

https://isbndb.com/ API 收费 :(

所以...

走 Google 网页抓取路线

from urllib.request import Request, urlopen
from bs4 import BeautifulSoup as soup
import requests
import time


def get_amazon_link(book_title):
  url = 'https://www.google.com/search?q=amazon+novel+'+book_title
  print(url)

  url = Request(url)
  url.add_header('User-Agent', 'Mozilla/5.0')

  with urlopen(url) as f:
    data = f.readlines()

    page_soup = soup(str(data), 'html.parser')
    for line in page_soup.findAll('h3',{'class':'r'}):
      for item in line.findAll('a', href=True):
        item = item['href'].split('=')[1]
        item = item.split('&')[0]
        return item


def get_wiki_link(book_title):
  url = 'https://www.google.com/search?q=wiki+novel+'+book_title
  print(url)
  url = Request(url)
  url.add_header('User-Agent', 'Mozilla/5.0')

  with urlopen(url) as f:
    data = f.readlines()

    page_soup = soup(str(data), 'html.parser')

    for line in page_soup.findAll('h3',{'class':'r'}):
      for item in line.findAll('a', href=True):
        item = item['href'].split('=')[1]
        item = item.split('&')[0]
        return item


a = open('amazonbookslinks','w')
w = open('wikibooklinks','w')
with open('booklist') as b:
  books = b.readlines()

  for book in books:
    book_title = book.replace(' ','+')
    amazon_result = get_amazon_link(book_title)
    amazon_msg = book +'@'+ amazon_result
    a.write(amazon_msg + '\n')
    time.sleep(5)
    wiki_result = get_wiki_link(book_title)    
    wiki_msg = book +'@'+ wiki_result
    w.write(wiki_msg + '\n')
    time.sleep(5)
a.close()
w.close()

不漂亮，但它有效:)

Answer 2

根据亚马逊的客户服务页面：

https://www.amazon.co.uk/gp/help/customer/display.html?nodeId=898182

ASIN 代表亚马逊标准识别号。 我们网站上的几乎每个产品都有自己的 ASIN，这是我们用来识别它的唯一代码。 对于图书，ASIN 与 ISBN 号相同，但对于所有其他产品，当商品上传到我们的目录时会创建一个新的 ASIN。

这意味着对于“Catch 22”一书，其 ISBN-10 为3866155239 。

我建议您使用像https://isbndb.com/这样的网站来查找书籍的 ISBN，它会自动为您提供您正在寻找的 ASIN。 它还带有一个 REST API，您可以在https://isbndb.com/apidocs 上阅读。

亚马逊以编程方式获取产品 ASIN

问题描述

2 个解决方案

解决方案1
0 2018-06-29 04:33:25

解决方案2
-1 2018-06-23 20:57:57

亚马逊以编程方式获取产品 ASIN

问题描述

2 个解决方案

解决方案1 0 2018-06-29 04:33:25

解决方案2 -1 2018-06-23 20:57:57

解决方案1
0 2018-06-29 04:33:25

解决方案2
-1 2018-06-23 20:57:57