[英]How to install libs for R arrow package on ubuntu without internet?
我正在研究 Azure 數據塊,它的計算服務器是 Ubuntu 18.04。 我想安裝箭頭R 包,但由於安全原因無法訪問互聯網。 我在可以訪問互聯網的 MacBook 上下載了箭頭 tar 文件,並在 ubuntu 中手動安裝它。 我執行了以下步驟:
sudo dpkg -i /dbfs/FileStore/tables/build_essential_12_4ubuntu1_amd64.deb
R CMD INSTALL /dbfs/FileStore/tables/arrow_dir/cpp11_0_3_1.tar.gz
感謝您閱讀我的問題。
注意:下面建議了一個解決方案,在執行./thirdparty/download_dependencies.sh $HOME/arrow-thirdparty
我得到:
# Environment variables for offline Arrow build
export ARROW_ABSL_URL=/root/arrow-thirdparty/absl-0f3bb466b868b523cf1dc9b2aaaed65c77b28862.tar.gz
export ARROW_AWSSDK_URL=/root/arrow-thirdparty/aws-sdk-cpp-1.8.133.tar.gz
export ARROW_AWS_CHECKSUMS_URL=/root/arrow-thirdparty/aws-checksums-v0.1.10
export ARROW_AWS_C_COMMON_URL=/root/arrow-thirdparty/aws-c-common-v0.5.10.tar.gz
export ARROW_AWS_C_EVENT_STREAM_URL=/root/arrow-thirdparty/aws-c-event-stream-v0.1.5
export ARROW_BOOST_URL=/root/arrow-thirdparty/boost-1.75.0.tar.gz
export ARROW_BROTLI_URL=/root/arrow-thirdparty/brotli-v1.0.9.tar.gz
export ARROW_BZIP2_URL=/root/arrow-thirdparty/bzip2-1.0.8.tar.gz
export ARROW_CARES_URL=/root/arrow-thirdparty/cares-1.17.1.tar.gz
export ARROW_GBENCHMARK_URL=/root/arrow-thirdparty/gbenchmark-v1.5.2.tar.gz
export ARROW_GFLAGS_URL=/root/arrow-thirdparty/gflags-v2.2.2.tar.gz
export ARROW_GLOG_URL=/root/arrow-thirdparty/glog-v0.4.0.tar.gz
export ARROW_GRPC_URL=/root/arrow-thirdparty/grpc-v1.35.0.tar.gz
export ARROW_GTEST_URL=/root/arrow-thirdparty/gtest-1.10.0.tar.gz
export ARROW_JEMALLOC_URL=/root/arrow-thirdparty/jemalloc-5.2.1.tar.bz2
export ARROW_LZ4_URL=/root/arrow-thirdparty/lz4-v1.9.3.tar.gz
export ARROW_MIMALLOC_URL=/root/arrow-thirdparty/mimalloc-v1.7.2.tar.gz
export ARROW_ORC_URL=/root/arrow-thirdparty/orc-1.6.6.tar.gz
Failed downloading https://github.com/google/protobuf/releases/download/v3.14.0/protobuf-all-3.14.0.tar.gz
使用下面鏈接中提到的腳本下載依賴項並將它們放在可以安裝的地方是否有幫助?
這里有一些說明: https : //arrow.apache.org/docs/developers/cpp/building.html#offline-builds
我已將它們粘貼在下面以防鏈接過期,但您可能需要查看這些說明的最新版本。
要啟用離線構建,您可以自己下載源工件並使用 ARROW_$LIBRARY_URL 形式的環境變量來指示構建系統從本地文件讀取而不是訪問互聯網。
為了讓您更輕松,我們准備了一個腳本thirdparty/download_dependencies.sh,它將每個依賴項的正確版本下載到您選擇的目錄。 它會在最后打印一個 bash 風格的環境變量語句列表,用於您的構建腳本。
# Download tarballs into $HOME/arrow-thirdparty
$ ./thirdparty/download_dependencies.sh $HOME/arrow-thirdparty
然后,您可以調用 CMake 來創建構建目錄,它將使用指向已下載檔案的聲明環境變量,而不是下載它們(每個構建目錄一個!)。
從arrow
6.0.0 開始,離線時包應該從源成功安裝。 它將只有基本功能:您將能夠使用 Arrow 數據和羽化文件,但 Parquet 讀取、S3 和壓縮庫等功能將不可用。 還有一個新的實用程序函數create_package_with_all_dependencies()
,您可以在連接到 Internet 的機器上運行該函數,以生成包含所有第三方 C++ 依賴項的“胖”源包。 然后,您可以將其復制到您的氣隙服務器。 有關詳細信息,請參閱https://arrow.apache.org/docs/r/reference/create_package_with_all_dependencies.html 。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.