Ubuntu 22.04完整安装Xinference及解决依赖报错

news/2025/2/19 9:44:55
aidu_pl">

注:文中使用的环境为Ubuntu 22.04 LTS + CUDA 12.4.1

1、创建conda环境

conda create -n xinference python==3.11 -y
conda activate xinference

2、安装Xinference

pip install "xinference[all]"

3、解决报错

Pytorch报错

根据Pytorch安装指引进行安装,重新执行命令即可。注意,一定要在Pytorch网站上按照你的系统和CUDA版本等选择。使用pip即可。例:

pip3 install torch torchvision torchaudio
pip install "xinference[all]"

llamacpppython_26">llama-cpp-python报错

当报错ERROR: Failed building wheel for llama-cpp-python时,需要手动修补环境并重新安装llama-cpp-python。这个问题比较复杂。按步骤操作即可修复:

  • 修复构建工具链

    sudo add-apt-repository ppa:ubuntu-toolchain-r/test
    sudo apt update
    sudo apt install gcc-11 g++-11
    sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-11 60 --slave /usr/bin/g++ g++ /usr/bin/g++-11
    pip install --upgrade pip
    pip install --upgrade setuptools wheel
    sudo apt-get install build-essential
    sudo apt-get install libgomp1
    
  • 检查并更新环境变量

    export PATH=/usr/local/cuda-12.4/bin:$PATH
    export LD_LIBRARY_PATH=/usr/local/cuda-12.4/lib64:/usr/local/cuda-12.4/extras/CUPTI/lib64:/usr/local/cuda-12.4/targets/x86_64-linux/lib:/usr/lib/x86_64-linux-gnu:$LD_LIBRARY_PATH
    
  • 重新安装

    # CPU推理
    pip install llama-cpp-python --verbose
    # N卡推理
    CMAKE_ARGS="-DLLAMA_CUBLAS=on" FORCE_CMAKE=1 pip install --upgrade --force-reinstall llama-cpp-python==0.2.57 --no-cache-dir --verbose
    pip install "xinference[all]"
    

http://www.niftyadmin.cn/n/5852675.html

相关文章

面试经典150题——堆

文章目录 1、数组中的第K个最大元素1.1 题目链接1.2 题目描述1.3 解题代码1.4 解题思路 2、IPO2.1 题目链接2.2 题目描述2.3 解题代码2.4 解题思路 3、查找和最小的 K 对数字3.1 题目链接3.2 题目描述3.3 解题代码3.4 解题思路 4、数据流的中位数4.1 题目链接4.2 题目描述4.3 解…

KubeSphere 和 K8s 高可用集群离线部署全攻略

本文首发:运维有术,作者术哥。 今天,我们将一起探索如何在离线环境中部署 K8s v1.30.6 和 KubeSphere v4.1.2 高可用集群。对于离线环境的镜像仓库管理,官方推荐使用 Harbor 作为镜像仓库管理工具,它为企业级用户提供…

深入解析 vLLM:高性能 LLM 服务框架的架构之美(上)

修改内容时间2.4.1处理请求的流程,引用更好的流程图2025.02.11首发2025.02.08 1. vLLM 整体代码架构 1.1 vLLM 的设计目标与特点 vLLM 是一个高性能的大语言模型服务框架。在大语言模型日益普及的今天,如何高效地提供推理服务成为一个重要挑战。传统的…

jenkins服务启动-排错

服务状态为active (exited) 且进程不在 查看/etc/rc.d/init.d/jenkins配置 获取配置参数 [rootfy-jenkins-prod jenkins]# cat /etc/rc.d/init.d/jenkins | grep -v #JENKINS_WAR"/usr/lib/jenkins/jenkins.war" test -r "$JENKINS_WAR" || { echo "…

CTFSHOW-WEB入门-PHP特性109-115

题目:web 109 1. 题目: 2. 解题思路:题目要求获得两个参数,v1 v2,if语句中的意思是要求两个参数都包含字母,条件满足的话,执行 echo new 类名(方法()&#xf…

untiy3D 让角色动起来,角色动画的使用

1.untiy 商店下载动画模型 2.导入项目 模型拖入到场景中 3.创建动画器控制器 4.动画控制器挂载到plarer上 5.把动画idle和pickup拖入到动画器 6.右键动画创建过渡效果(Make Transition) 6.设置参数用条件控制 7.当选中参数时启动过渡 运行效果 119 (二)用脚本控制动画…

Linux 系统下 如何部署本地 deepseek R1模型

硬件:RTX3090 24G 系统:ubuntu 1804 1. 下载ollama curl -fsSL https://ollama.com/install.sh | sh 2.下载deepseek R1 模型数据 百度网盘下载链接 可以全部都下载,也可以选择性下载,主要看硬件平台 7B的模型大概需要5.5G…

《网络编程卷2:进程间通信》第八章:共享内存深度解析与多进程高性能通信实践

《网络编程卷2:进程间通信》第八章:共享内存深度解析与多进程高性能通信实践 引言 共享内存(Shared Memory) 是进程间通信(IPC)中性能最高的机制,允许多个进程直接读写同一块物理内存区域&…