![](/img/trans.png)
[英]quotas are exceeded error while deploying Vertex AI Matching Engine Index
[英]vertex ai matching service machines
我想嘗試頂點 ai 向量匹配服務,但是當我進行部署時,它總是將 n 16 台機器放在我的索引上。 我想嘗試使用更小的東西,但我在部署期間看不到特定機器類型的選項。 這是我的部署命令:
gcloud ai index-endpoints deploy-index 2056746450917785600 \
--deployed-index-id=postanndeploy \
--display-name=smallindexdeploy \
--index=5486800517113839616 \
--min-replica-count=1 \
--max-replica-count=2 \
--project=myproject \
--region=us-central1
在我完成部署后,當我查看部署時,我看到了 n16 機器。 這比我的 POC 需要的要大得多。 有沒有一種方法可以讓我在更小的機器上做到這一點而不用擔心成本。
馬尼什
匹配引擎部署的機器類型將取決於您在創建索引時設置的分片級別。 如果未指定任何內容,則默認分片為SHARD_SIZE_MEDIUM
。
SHARD_SIZE_MEDIUM
使用e2-standard-16
機器。 對於較小的用例,您可以嘗試使用SHARD_SIZE_SMALL
。 旋轉的機器數量將取決於索引的大小。 用於SHARD_SIZE_SMALL
的機器將是e2-standard-2
實例。
但是,此類實例的數量將取決於您的整體索引大小。 匹配引擎監控儀表板會告訴您為您的特定索引創建了多少個實例。
您可以在此處找到更多與索引大小和實例相關的 google 文檔。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.